-os 是发布时追求小体积最直接有效的编译选项,它倾向代码大小优化,保守内联、禁用循环展开等空间换时间优化,需配合 -dndebug、-ffunction-sections、-fdata-sections 和 -wl,--gc-sections 才能彻底剔除未用符号。

用 -Os 而不是 -O2 或 -O3 编译
发布时追求小体积,-Os 是最直接有效的编译选项——它在优化运行速度和代码大小之间倾向后者,会主动内联更保守、避免生成冗余指令序列。而 -O2 和 -O3 默认优先保性能,常导致函数内联过度、模板实例膨胀、甚至插入额外的运行时检查代码。
-
-Os会禁用部分以空间换时间的优化(如循环展开、向量化),但对绝大多数业务逻辑影响极小 - 某些平台(如嵌入式)上
-Os比-Oz更稳妥:-Oz极致压缩但可能触发旧版 GCC 的 bug,且部分 STL 实现(如 libstdc++)在-Oz下行为异常 - 务必搭配
-DNDEBUG使用,否则断言宏仍会编译进二进制
链接时去掉未使用的符号:-Wl,--gc-sections + -ffunction-sections -fdata-sections
默认编译器把所有函数/数据塞进少数几个大段(如 .text),链接器没法删掉其中某个没被调用的函数。加了 -ffunction-sections 和 -fdata-sections 后,每个函数/全局变量单独成段;再配合链接器参数 -Wl,--gc-sections,就能真正剔除未引用的部分。
- 必须同时启用三者,缺一不可:只加编译选项不加链接选项,或反之,都无效
- 静态链接 STL 时效果显著(比如
std::string的大量重载函数中,实际只用到 20%) - 注意:若使用了
dlsym动态查符号,或通过函数指针间接调用(且未显式标记__attribute__((used))),这些函数可能被误删
避免隐式模板实例化爆炸
模板类(如 std::vector<int></int>、std::map<:string double></:string>)每种类型组合都会生成一份独立代码。头文件里多 include 几次、不同 cpp 文件各自实例化,体积就悄悄翻倍。
- 对常用组合,在单个
.cpp文件里显式实例化一次:template class std::vector<mystruct>;</mystruct>,其余地方只声明 - 慎用
auto返回值 + 复杂模板推导,容易让编译器生成多个相似但不可合并的实例 - 第三方库(如 Boost)尽量用预编译版本,避免其模板头文件污染你的编译单元
strip 之后再检查符号表残留
strip 命令能删调试符号,但很多构建系统默认只 strip 可执行段,忽略 .dynsym 或 .dynamic 中的动态符号——这些仍占几百 KB,尤其当你链接了大量共享库时。
立即学习“C++免费学习笔记(深入)”;
- 用
readelf -d your_binary | grep NEEDED查看依赖库列表,确认没有意外引入(比如本该用静态链接的libz却动态连了) - 用
nm -C --defined-only your_binary | wc -l对比 strip 前后数量,如果下降不足 90%,说明还有隐藏符号(常见于未清除的弱符号、C++ 异常处理表.eh_frame) - 终极清理可加
-Wl,--strip-all,但会丢失所有符号信息,调试崩溃堆栈将无法还原
体积压缩不是线性过程:删掉第一个 MB 很容易,再压 100KB 就得逐段分析 objdump -h 输出,盯住 .rodata 和 .text 里异常大的节。真正难的不是开关选项,而是判断哪段“看起来有用”的代码其实根本没被执行。








