0

0

php远程访问文件怎么打开_phpcurl多url远程批量取法【批量】

看不見的法師

看不見的法師

发布时间:2026-01-18 08:44:40

|

691人浏览过

|

来源于php中文网

原创

curl_multi_exec 并发取多个 url 最省资源,需设 curlmopt_maxconnects、毫秒级超时、dns 缓存,并分组处理避免系统限制。

php远程访问文件怎么打开_phpcurl多url远程批量取法【批量】

curl_multi_exec 一次性并发取多个 URL 最省资源

PHP 原生 curl 单次只能处理一个请求,批量抓取时用循环串行调用会极慢。真正高效的做法是用 curl_multi_init 管理多个句柄,让它们在底层并行发起 HTTP 连接。

关键不是“能不能”,而是“怎么避免超时、内存溢出、DNS 阻塞”。实操中要注意:

  • curl_multi_setopt($mh, CURLMOPT_MAXCONNECTS, 20) 必须设,否则默认只保持 5 个连接,大量 URL 会排队等复用
  • 每个 curl_setopt($ch, CURLOPT_TIMEOUT_MS, 3000) 要设毫秒级超时,避免单个慢响应拖垮整批
  • 不要在循环里反复 curl_multi_add_handle 后立刻 curl_multi_exec —— 正确姿势是全加完再执行一次主循环
  • DNS 解析容易成为瓶颈,加 curl_setopt($ch, CURLOPT_DNS_CACHE_TIMEOUT, 300) 复用缓存
function fetchUrlsMulti(array $urls): array {
    $mh = curl_multi_init();
    curl_multi_setopt($mh, CURLMOPT_MAXCONNECTS, 20);
    
    $chs = [];
    $results = [];
    
    foreach ($urls as $i => $url) {
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
        curl_setopt($ch, CURLOPT_TIMEOUT_MS, 3000);
        curl_setopt($ch, CURLOPT_DNS_CACHE_TIMEOUT, 300);
        curl_setopt($ch, CURLOPT_USERAGENT, 'PHP-curl-multi');
        curl_multi_add_handle($mh, $ch);
        $chs[$i] = $ch;
    }
    
    $running = null;
    do {
        curl_multi_exec($mh, $running);
        curl_multi_select($mh, 0.1); // 防止 CPU 空转
    } while ($running > 0);
    
    foreach ($urls as $i => $url) {
        $results[$url] = curl_multi_getcontent($chs[$i]);
        curl_multi_remove_handle($mh, $chs[$i]);
        curl_close($chs[$i]);
    }
    
    curl_multi_close($mh);
    return $results;
}

file_get_contents 不适合批量远程访问

很多人第一反应是用 file_get_contents + stream_context_create,但它本质仍是阻塞式同步 I/O,没有并发能力。哪怕你写个 for 循环,也是串行跑完一个才开始下一个。

更麻烦的是:它不支持连接复用、无法统一控制超时粒度、错误堆不清晰(比如 DNS 失败直接报 failed to open stream,没法定位是哪个 URL)。真实场景下,10 个 URL 串行可能耗时 8 秒以上;而 curl_multi 通常 1–2 秒内完成。

笔灵降AI
笔灵降AI

论文降AI神器,适配知网及维普!一键降至安全线,100%保留原文格式;无口语化问题,文风更学术,降后字数控制最佳!

下载

立即学习PHP免费学习笔记(深入)”;

  • 若硬要用 file_get_contents,至少得配 stream_context_set_default 统一设 timeoutuser_agent
  • 但遇到 HTTPS 证书问题、302 重定向、大响应体,它比 curl 更难调试
  • PHP 8.1+ 已标记 allow_url_fopen=Off 为默认趋势,很多生产环境直接禁用

批量失败时怎么定位具体哪个 URL 出了问题

curl_multi_info_read 可以拿到每个句柄的最终状态,包括 HTTP 状态码、错误码、错误信息。别只看 curl_multi_getcontent 返回空字符串就认为失败 —— 有些返回 200 但内容是 HTML 错误页,有些返回 0 字节但实际是 503。

  • 每次 curl_multi_exec 后必须调用 curl_multi_info_read 拿到已完成句柄列表
  • curl_getinfo($ch, CURLINFO_HTTP_CODE) 判断是否为 200–299
  • curl_errno($ch)curl_error($ch) 查网络层错误(如 CURLE_COULDNT_RESOLVE_HOST
  • 建议把每个 URL 的 CURLINFO_EFFECTIVE_URLCURLINFO_TOTAL_TIME 也记下来,方便后续分析慢请求

大数量(>100 URL)时要分组,别一把梭

一次性扔 500 个 URL 进 curl_multi 容易触发系统限制:Linux 默认单进程最多打开 1024 个 socket,PHP 内存也会飙升。实测超过 200 个句柄后,curl_multi_select 延迟明显上升。

  • 按每组 20–50 个 URL 分批次处理,组间 sleep(0.05) 避免端口耗尽
  • curl_multi_setopt($mh, CURLMOPT_PIPELINING, 1) 开启管线化(需服务端支持),可减少 TCP 握手次数
  • 如果目标域名固定,加 curl_setopt($ch, CURLOPT_TCP_KEEPALIVE, 1) 复用长连接
  • 记得在循环外提前 set_time_limit(0),防止脚本被超时中断
实际跑起来最常被忽略的是 DNS 缓存和连接数限制 —— 很多人调通了小样本,一上生产就大量超时,翻来覆去查代码,最后发现只是 CURLMOPT_MAXCONNECTS 没设,或者没关掉 IPv6 强制解析。

相关文章

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

454

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

739

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

220

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1564

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

649

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1208

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1184

2024.04.29

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

24

2026.03.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.2万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号