嵌入式Linux启动时间优化的秘密之三-内核

嵌入式操作系统

57人已加入

描述

  本文主要讲述嵌入式Linux启动时间优化的秘密之三-内核,我们继续上篇没有讲完的嵌入式Linux启动时间优化方法,本文主要会讲内核系统。想看上一篇的请查看本文结尾的链接。

  内核

  1.有用的调试手段

  1. 1 内核初始化度量函数

  要找出最长执行时间的内核初始化函数,请在内核命令行中添加initcall_debug。将内核日志中得到如下日志:

内核

  如使用initcall_debug可能需要在内核配置中使用CONFIG_LOG_BUF_SHIFT增加日志缓冲区的大小。还可能需要使能CONFIG_PRINTK_TIME和CONFIG_KALLSYMS。

  1.2 使用内核启动图进行有目的的优化

  使用initcall_debug可以生成启动图,从而轻松查看哪些内核初始化函数需要最多时间来执行。

  复制dmesg命令的输出并将其粘贴到文件中(我们将其称为启动日志boot.log)

  在开发工作站上,在内核源代码中运行scripts / bootgraph.pl脚本:scripts / bootgraph.pl boot.log》 boot.svg

  现在可以使用矢量图形编辑器(例如inkscape)打开启动图:

内核

  首先从花费最长时间的功能开始尝试优化。对于每个功能:

  在内核源代码中查找其定义。

  可以使用Elixir(参考https://elixir.bootlin.com)。

  注意:某些函数名称可能不存在,名称与modulename_init相对应。然后,在相应的模块中查找初始化代码。

  删除不必要的功能:

  通过查看相应源目录中的Makefile,找到哪个内核配置参数可编译代码。

  延后加载处理:

  查找功能所属的模块(如果有)。如果可能,请稍后加载此模块。

  优化必要的功能:

  查找可以用于减少探测时间的参数,并查找module_param宏。

  查找延迟循环和对名称中包含delay的函数的调用, 可以减少此类延迟,并查看代码是否仍然有效。

  1.3 减小内核尺寸

  首先,我们专注于在不删除功能的情况下缩小尺寸

  主要机制是使用内核模块

  将启动时不需要的所有内容编译为模块

  有两个好处:内核更小且加载速度更快,初始化代码更少

  删除用户空间不需要的功能:

  CONFIG_KALLSYMS,CONFIG_DEBUG_FS,CONFIG_BUG

  用专为嵌入式系统设计的功能:CONFIG_SLOB,CONFIG_EMBEDDED

  然后考虑内核压缩的方式:

  根据存储读取速度和CPU解压缩内核之间的平衡,需要对不同的压缩算法进行测试。还建议在内核优化过程结束时尝试压缩选项,因为结果可能会因内核大小而异。

 内核

  Lzo和Gzip似乎是最好的解决方案。 但这结果取决于存储和CPU性能,故在决定方案是务必进行测试。

  另外内核的编译选项也有可以优化的可能:

  CONFIG_CC_OPTIMIZE_FOR_SIZE:可以使用gcc -Os而不是gcc -O2编译内核。

  这样的优化会优先考虑代码大小,但会牺牲代码速度。

  结果:初始引导时间更好(较小的启动时间),但是较慢的内核代码可能会使性能降低。系统运行速度会变慢!

  1.4 延迟驱动程序和初始化调用

  如果有点功能无法编译为模块(例如,网络或模块子系统),可以尝试推迟执行。内核不会缩小,但某些初始化将被推迟,所以启动变快。通常,您可以修改probe()函数以返回-EPROBE_DEFER,直到它们准备好运行为止。

  有关支持此功能的详细信息,请参见

  https://lwn.net/Articles/485194/。

  1.5 关闭控制台输出

  控制台输出实际上要花费很多时间(非常慢的设备)。 产品中可能不需要。通过在内核命令行中传递quiet参数来禁用它。但仍然可以使用dmesg获取内核消息。这一步一般建议等最后一步再做,否则将损失控制台进行调试。

  1.6 预置jiffy

  每次引导时,Linux内核都会校准延迟循环(用于udelay()函数)。这将测量每个jiff y(lpj)值的循环次数。只需要测量一次!在内核启动消息中找到 lpj值:

  Calibrating delay loop.。。 996.14 BogoMIPS (lpj=4980736)

  然后将lpj = 《value》添加到内核命令行:

  Calibrating delay loop (skipped) preset value.。 996.14 BogoMIPS (lpj=4980736)

  1.7 多处理器

  SMP初始化很慢,即使您只有一个核心CPU,通常也会在默认配置中启用它(默认配置应支持多个系统)。因此,如果只有一个CPU内核,请确保将其禁用。BeagleBone Black上的结果:压缩内核大小:-188 KB

  要节省最后的毫秒数,您可能需要删除不必要的功能:

  CONFIG_PRINTK = n与quiet命令行参数具有相同的效果,但是您无权访问内核消息。但是,您将拥有一个非常小的内核。

  在Thumb2模式下编译内核:CONFIG_THUMB2_KERNEL(任何ARM工具链都可以做到)。

  模块装卸

  块层(Block layer)

  网络堆栈

  USB堆栈

  电源管理功能

  CONFIG_SYSFS_DEPRECATED

  输入:键盘/鼠标/触摸屏

  减少CONFIG_LEGACY_PTY_COUNT的值或设置pty.legacy_count内核参数.

  编辑连载推荐:嵌入式Linux启动时间优化的秘密之一工具链/应用程序优化

  编辑连载推荐:嵌入式Linux启动时间优化的秘密之二文件系统

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分