php 仓库克隆体积大因含完整历史、旧分支及大文件;用 --filter=blob:none 可减至200–300mb,git archive 则仅45mb且无git元数据。

为什么 git clone 下来的 PHP 仓库特别大?
PHP 官方仓库(如 https://github.com/php/php-src)默认包含完整历史、大量已删除的旧分支、测试用的大体积文件(如 ext/zip/tests/data.zip)、以及长期积累的二进制补丁和构建产物。直接 git clone 会拉取全部对象,动辄 1GB+,但你通常只需要最新源码或某几个稳定版本。
用 git clone --filter 跳过历史对象
Git 2.17+ 支持稀疏克隆,能显著减少初始下载量。关键不是“删历史”,而是“不下载”。对 PHP 这类超大仓库尤其有效:
-
git clone --filter=blob:none https://github.com/php/php-src.git:只下 commit 和 tree,不下任何文件内容(适合后续只 checkout 某个 tag) -
git clone --filter=tree:0 https://github.com/php/php-src.git:更激进,连目录结构都延迟获取(需 Git 2.22+) - 克隆后执行
git checkout php-8.3.0,Git 会按需拉取该 tag 对应的 blobs,体积通常压到 200–300MB
删掉没用的 reflog、packed-refs 和旧远程分支
即使克隆轻量了,.git 目录仍可能残留大量无用引用数据。手动清理比等 GC 更直接:
- 运行
git remote prune origin清除本地记录中已不存在的远程分支指针 - 删除
.git/logs/全部内容(reflog 不影响代码,只影响git reflog命令) - 删掉
.git/packed-refs(Git 会自动重建),再执行git gc --prune=now --aggressive - 注意:
git gc后不要立刻git pull,否则可能重新 fetch 大量对象
用 git archive 替代克隆(最彻底的“压缩”)
如果你根本不需要 Git 功能(比如只是编译或查代码),git archive 是零历史、零元数据的终极方案:
立即学习“PHP免费学习笔记(深入)”;
-
curl -L https://github.com/php/php-src/archive/refs/tags/php-8.3.0.tar.gz | tar -xzf -:直接拿 GitHub 打包的纯净源码,解压后约 45MB - 或用 Git 协议:
git archive --format=tar --remote=origin refs/tags/php-8.3.0 | tar -xf -(需服务器支持 upload-archive) - 缺点:没有
.git,不能git diff或切版本;优点:体积最小、无冗余、可脚本化
真正要压缩的是你的使用场景,不是 Git 仓库本身。选 --filter 还是 archive,取决于你是否需要提交、切换分支、追溯修改——这点容易被忽略,但决定了后续所有操作的成本。











