本文主要讲述嵌入式 Linux 启动时间优化的秘密之三-内核,我们继续上篇没有讲完的嵌入式Linux启动时间优化方法,本文主要会讲内核系统。想看上一篇的请查看本文结尾的链接。
内核
1.有用的调试手段
1. 1 内核初始化度量函数
要找出最长执行时间的内核初始化函数,请在内核命令行中添加initcall_debug。将内核日志中得到如下日志:
如使用initcall_debug可能需要在内核配置中使用CONFIG_LOG_BUF_SH IF T增加日志缓冲区的大小。还可能需要使能CONFIG_PRINTK_ TI ME和CONFIG_KALLSYMS。
1.2 使用内核启动图进行有目的的优化
使用initcall_debug可以生成启动图,从而轻松查看哪些内核初始化函数需要最多时间来执行。
复制dmesg命令的输出并将其粘贴到文件中(我们将其称为启动日志boot.log)
在开发工作站上,在内核源代码中运行scripts / bootgraph.pl脚本:scripts / bootgraph.pl boot.log》 boot.svg
现在可以使用矢量 图形 编辑器(例如inkscape)打开启动图:
首先从花费最长时间的功能开始尝试优化。对于每个功能:
在内核源代码中查找其定义。
可以使用Elixir(参考https://elixir.bootlin.com)。
注意:某些函数名称可能不存在,名称与modulename_init相对应。然后,在相应的模块中查找初始化代码。
删除不必要的功能:
通过查看相应源目录中的Makefile,找到哪个内核配置参数可编译代码。
延后加载处理:
查找功能所属的模块(如果有)。如果可能,请稍后加载此模块。
优化必要的功能:
查找可以用于减少探测时间的参数,并查找module_pa ram 宏。
查找延迟循环和对名称中包含delay的函数的调用, 可以减少此类延迟,并查看代码是否仍然有效。
1.3 减小内核尺寸
首先,我们专注于在不删除功能的情况下缩小尺寸
主要机制是使用内核模块
将启动时不需要的所有内容编译为模块
有两个好处:内核更小且加载速度更快,初始化代码更少
删除用户空间不需要的功能:
CONFIG_KALLSYMS,CONFIG_DEBUG_FS,CONFIG_BUG
用专为嵌入式系统设计的功能:CONFIG_SLOB,CONFIG_EMBEDDED
然后考虑内核压缩的方式:
根据 存储 读取速度和 CPU 解压缩内核之间的平衡,需要对不同的压缩算法进行 测试 。还建议在内核优化过程结束时尝试压缩选项,因为结果可能会因内核大小而异。
Lzo和Gzip似乎是最好的解决方案。 但这结果取决于存储和CPU性能,故在决定方案是务必进行测试。
另外内核的编译选项也有可以优化的可能:
CONFIG_CC_OP TI MI ZE_FOR_SIZE:可以使用gcc -Os而不是gcc -O2编译内核。
这样的优化会优先考虑代码大小,但会牺牲代码速度。
结果:初始引导时间更好(较小的启动时间),但是较慢的内核代码可能会使性能降低。系统运行速度会变慢!
1.4 延迟驱动程序和初始化调用
如果有点功能无法编译为模块(例如,网络或模块子系统),可以尝试推迟执行。内核不会缩小,但某些初始化将被推迟,所以启动变快。通常,您可以修改probe()函数以返回-EPROBE_DEFER,直到它们准备好运行为止。
有关支持此功能的详细信息,请参见
https://lwn.net/Ar TI cles/485194/。
1.5 关闭控制台输出
控制台输出实际上要花费很多时间(非常慢的设备)。 产品中可能不需要。通过在内核命令行中传递quiet参数来禁用它。但仍然可以使用dmesg获取内核消息。 这一步一般建议等最后一步再做,否则将损失控制台进行调试。
1.6 预置jiffy
每次引导时,Linux内核都会校准延迟循环(用于udelay()函数)。这将 测量 每个jiff y(lpj)值的循环次数。只需要测量一次!在内核启动消息中找到 lpj值:
Calibra TI ng delay loop.。。 996.14 BogoMIPS (lpj=4980736)
然后将lpj = 《value》添加到内核命令行:
Calibra TI ng delay loop (skipped) preset value.。 996.14 BogoMIPS (lpj=4980736)
1.7 多处理器
SMP初始化很慢,即使您只有一个核心CPU,通常也会在默认配置中启用它(默认配置应支持多个系统)。因此,如果只有一个CPU内核,请确保将其禁用。 BeagleBone Black上的结果:压缩内核大小:-188 KB
要节省最后的毫秒数,您可能需要删除不必要的功能:
CONFIG_PRINTK = n与quiet命令行参数具有相同的效果,但是您无权访问内核消息。但是,您将拥有一个非常小的内核。
在Thumb2模式下编译内核:CONFIG_THUMB2_KERNEL(任何 ARM 工具链都可以做到)。
模块装卸
块层(Block layer)
网络堆栈
USB 堆栈
电源管理 功能
CONFIG_SYSFS_DEPRECA TE D
输入:键盘/鼠标/触摸屏
减少CONFIG_LEGACY_PTY_COUNT的值或设置pty.legacy_count内核参数.