链接器优化: 相同代码折叠 ICF

johnsoncodehk · 发表于 2022-5-11 08:17

最近看到一篇论文《Safe ICF》，是链接器的一项优化技术，叫相同代码折叠(合并)，可以用来优化二进制体积，可以搜论文看看，本文是所做的笔记。
1、简介

在大型的 C++ 应用和动态库中，存在着很多函数体一样的函数，大概有 10% 左右的可以做合并操作，这种技术称之为 ICF (Identical Code Folding)。在 C++ 当中，主要是因为对模版的使用，会导致相同实现体的函数出现(比如以类型的指针来进行实例化，而指针类型大小是一致的)。
在链接时，ICF 会检测出带有相同实现体的函数，然后合并为一个单独的副本。显而易见，这样操作的好处就是减小了二进制体积(实验 Google 体积下降 64MB，6% 左右，性能无影响)。
但 ICF 不一定安全，因为它会改变需要函数有唯一地址的运行时行为。ICF 可以安全地用在那些不需要进行地址比较的需合并的函数身上。还有，对二进制进行调试(debugging)和探测(profiling)时会迷惑，因为合并的函数的 PC 地址指向不明，所以也有新的 DWARF 格式对此来进行兼容。
ICF 也扩展到 read-only string section、unwind info 等场景。

2、ICF 算法

ICF 要如何检测到相同实现体的函数？为了使链接器可以实现这一手段，编译器需要把每一个函数放置在一个单独的 section，这个功能 GCC 编译器已经提供了支持 -ffunctions-sections，当然，实际上拿到 text 段中每一个函数的位置再进行计算也是可行的。
从链接器的角度而言，在代码段，一个函数的实现体包含有代码文本以及重定位信息。那么，只要代码文本二进制完全相同、而且它们的重定位指向相同的 section，就可以认为是相同的。这里的重定位信息指向相同的 section、或者指向被认为相同的函数，都被认为是相同的。
// zip 和 zap 是相同的，所以 foo 和 bar 也被认为是相同的
int foo () { return zip (); }
int bar () { return zap (); }
int zip () { return 0; }
int zap () { return 0; }

/***
What the linker sees :
Disassembly of section .text._Z3foov:
0000000000000000 <_Z3foov>:
55             push %rbp
48 89 e5       mov %rsp,%rbp
e8 00 00 00 00  callq 9 R_X86_64_PC32 relocation to zip
c9             leaveq
c3             retq

Disassembly of section .text._Z3barv:
0000000000000000 <_Z3barv>:
55             push %rbp
48 89 e5       mov %rsp,%rbp
e8 00 00 00 00  callq 9 R_X86_64_PC32 relocation to zap
c9             leaveq
c3             retq
***/
开始链接器操作，首先，需要把每一个函数体划分为两个部分：常量(constant)和变量(variable)。常量部分代表在分析中不会产生变化的内容，一般是代码段内容、以及不会指向考虑合并的候选函数 section 的重定位信息。而变量部分代表指向被考虑合并的函数 section 的重定位信息。
然后，分析会把可合并的函数归为一组，分多个组。计算时，常量部分保持不变，而变量部分会用组标识符(group identifier)来代替重定位信息，这个组标识符表示重定位信息所指向的函数 section 的组(初始时会为每个考虑合并的函数定义一个组标识符，初始时每个组只有一个函数)。算法会对内容进行 checksum(校验和)，然后基于这个结果把函数划分到不同的组里面。再用新的组标识符对新的划分进行上述同样的操作直到收敛(到达不动点 fixed point，每个函数 section 的组标识符不再变化)。在这个过程中，实际上只有变量部分会被重新计算。
最后，我们在每个组里面，只保留一个，其余的被丢弃。
2.1、初始阶段

在初始化阶段，有两种选择：

消极，每个函数放在一个单独的组里。这样操作每次迭代后结果都是正确的，不一定需要到达不动点。但是对于递归调用函数或相互间的递归调用，就难以识别出来了(因为重定位部分会用组标识符来替换，所以这些函数很难被认为是相同的)。

// 实际上 funcA 和 funcB 是相同的，但消极方式无法识别出来
int funcA (int a) {
if (a == 1) return 1;
return 1 + funcB(a 1);
}
int funcB (int a) {
if (a == 1) return 1;
return 1 + funcA(a 1);
}

乐观，所有函数放到同一个组里，即认为所有的函数初始时都是相同的。可以识别递归函数，但算法需要执行到不动点才能保证完全正确。

在论文《Safe ICF》中，采用的是消极的方式，首先保证正确性，对于递归函数，则先识别出来，然后采用特殊符号来进行替换。
2.2、预处理

为了减少需要分析的函数的数量，先剔除掉只具有常量部分的候选函数(即只有静态代码文本，而没有重定位信息的)，因为这些函数可以直接做比较，不需要进一步的算法分析。
链接器在做 sections 合并的时候，会把所有的 section 以及只读的常量(read-only constants)看作是常量静态文本。而 ICF 的分析需要在链接器做合并操作之前进行。因此，我们需要先把被引用的常量内联(inline)到被引用的地方，这样函数就更有可能是相同的。
3、安全模式

链接器开启 ICF 使用选项 --icf=all，这里还提供了一种更为安全的选项 --icf=safe。
前面说过，对于需要进行地址比较的函数，进行合并是一种危险的操作。为了保证运行时的安全性，安全模式下会检测哪些函数被通过指针获取地址，阻止这些函数被合并。虽然不是所有通过指针获取函数地址的情况都会拿来比较，但为了确保安全，所有这些函数都会被标记为不能合并。
根据 C++ 规范，通过函数指针来获取构造函数(constructors)和析构函数(destructors)是被禁止的，因此，对们进行合并操作是安全的。对于虚函数的指针获取，只是为了虚表的使用，也是可以安全地考虑进行合并，并不会影响运行时行为。
参考

论文《Safe ICF: Pointer Safe and Unwinding aware Identical Code Folding in the Gold Linker》
Teach ICF to dedup functions with identical unwind info
Implement ICF

stonstad · 发表于 2022-5-11 08:22

取过地址的函数如果可以“间接”重定位（比如用一个跳转指令替代函数体），是否也可以进行折叠 [思考]

IT圈老男孩1 · 发表于 2022-5-11 08:28

请教一下，现在优化二进制体积这个方向的动机原因是什么，如果二进制代码段是分段映射进虚拟内存，大小应该影响没有非常大

Ylisar · 发表于 2022-5-11 08:33

安全模式下，虽然不是所有通过指针获取函数地址的情况都会拿来比较，但为了确保安全，所有这些函数都会被标记为不能合并。这种间接跳转，比如虚函数的调用，因为有 C++ 的规则保证，所以是可以确认的

XGundam05 · 发表于 2022-5-11 08:40

这些折叠的函数会共用同一个地址，虚拟内存只会占一份，对内存也是有优化。而二进制体积，对于嵌入式、或者移动端，就会比较看重。

mypro334 · 发表于 2022-5-11 08:50

感谢[赞]

acecase · 发表于 2022-5-11 08:53

将取过函数地址的函数体也折叠了，折叠前的每个函数体替换为一个简单的跳转指令，不也是安全的吗，他们的地址仍然是不同的

acecase · 发表于 2022-5-11 08:58

这里说的取地址具体是指函数指针，比如 int (*fun1)();，而实际开发，是可能会有 (fun1 == fun2) 的判断，合并了就一致了。而你所说的情况是 indirect call，-icf=all 是可以考虑的，只是安全模式 -icf=safe 没有做更多的筛查。

ainatipen · 发表于 2022-5-11 09:06

“实际开发，是可能会有 (fun1 == fun2) 的判断，合并了就一致了” fun1和fun2仍然不同的函数有不同的地址，只是他们都是调用了同一个折叠后的函数定义。这会带来安全问题吗？

RhinoFreak · 发表于 2022-5-11 09:14

不是对比函数指针本身，是对比函数指针指向的函数，折叠后只保留一个函数，函数地址是一致的，指针这个和 indirect call 不是一个概念

		自动登录	找回密码
密码			立即注册

链接器优化: 相同代码折叠 ICF

本帖子中包含更多资源

浏览过的版块