0

0

短链接怎么批量还原php_用Excel配合脚本高效处理【指南】

絕刀狂花

絕刀狂花

发布时间:2026-01-02 20:46:35

|

438人浏览过

|

来源于php中文网

原创

短链接还原需禁用curl自动跳转,手动解析location响应头;用phpspreadsheet读写excel并限速并发防封;cli脚本封装,支持中文列名但推荐英文键,失败url单独记录。

短链接怎么批量还原php_用excel配合脚本高效处理【指南】

用 cURL 批量请求短链接获取跳转目标

短链接还原本质是发起 HTTP 请求并读取 Location 响应头(301/302 重定向)或最终页面 URL。PHP 中最稳妥的方式是用 curl_exec() 配合 CURLOPT_FOLLOWLOCATION = false,避免自动跳转掩盖原始重定向地址。

关键点在于禁用自动跟随,手动提取响应头:

  • CURLOPT_HEADER 设为 true,才能拿到完整响应头
  • CURLOPT_NOBODY 设为 true,只取头不取体,省带宽、提速度
  • curl_getinfo($ch, CURLINFO_REDIRECT_URL) 可能为空——它只在 CURLOPT_FOLLOWLOCATION = true 且发生跳转时有效,**不可靠**
  • 必须用 explode("\r\n\r\n", curl_exec($ch), 2) 分离响应头,再逐行解析 Location:
$ch = curl_init($short_url);
curl_setopt($ch, CURLOPT_NOBODY, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HEADER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_TIMEOUT, 10);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (X11; Linux x86_64)');

$response = curl_exec($ch);
$header = explode("\r\n\r\n", $response, 2)[0];
$location = null;
foreach (explode("\r\n", $header) as $line) {
    if (stripos($line, 'Location:') === 0) {
        $location = trim(substr($line, 9));
        break;
    }
}
curl_close($ch);

Excel 数据读取与写回:用 PhpSpreadsheet 处理 .xlsx

别用 fgetcsv() 硬啃 Excel——.xlsx 是 ZIP+XML 结构,直接解析易出错。推荐 phpoffice/phpspreadsheet,支持读写、兼容公式和多 sheet。

注意两个坑:

Fish Audio
Fish Audio

为所有人准备的音频 AI

下载

立即学习PHP免费学习笔记(深入)”;

  • 读取时默认启用内存缓存,大批量(如 >1 万行)可能 OOM,需设 setReadDataOnly(true)
  • 写入时若原文件有样式/合并单元格,save() 会丢弃——仅还原 URL 场景下可忽略,否则得用 cloneStyle() 显式保留
  • 列名若为中文(如“短链接”),读取后直接当数组键用,无需转码;但写入新列建议用英文键(如 long_url)防乱码

并发控制与错误容错:避免被封 IP 或超时失败

一次性并发 100 个 curl 请求,多数短链服务(如 t.cn、bit.ly)会返回 429 或直接断连。必须限速:

  • usleep(200000)(200ms)间隔,比 sleep(1) 精细,100 条约 20 秒完成
  • curl_error($ch) 和 HTTP 状态码双校验:状态码非 3xx 视为失败(如 404、403、503)
  • 记录失败行号 + 原始 URL 到 failed_urls.csv,方便重试,而非中断整个流程
  • 设置 CURLOPT_CONNECTTIMEOUT = 5,防止 DNS 卡死拖垮整批

命令行一键跑完:封装成可执行脚本

把逻辑打包成 CLI 脚本,直接传 Excel 路径,输出新文件,不依赖 Web 环境:

  • 入口加 #!/usr/bin/env php,Linux/macOS 下 chmod +x restore.php 即可运行
  • $argv[1] 接收输入文件路径,basename($argv[1], '.xlsx') . '_expanded.xlsx' 自动生成输出名
  • 避免用 $_SERVER['DOCUMENT_ROOT']——CLI 下不存在,路径全用 __DIR__ 或绝对路径
  • 执行前检查扩展:extension_loaded('curl')class_exists('PhpOffice\PhpSpreadsheet\IOFactory')

真实场景中,短链接服务可能返回 200 + 页面内 JS 跳转(如微博短链),这种无法靠 header 还原,得上 headless 浏览器——但那已超出 PHP 批量处理范畴,属于另一层问题了。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1940

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2116

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1150

2024.11.28

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

454

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

530

2023.06.20

js获取当前时间
js获取当前时间

JS全称JavaScript,是一种具有函数优先的轻量级,解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言,主要用于Web,常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

514

2023.07.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

698

2023.08.03

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

4

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 12.9万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号