讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

爬虫下载附件失败：如何解决政府网站附件下载难题？

DDD

发布时间：2024-11-04 21:09:01

|

988人浏览过

|

来源于php中文网

原创

爬虫下载附件失败：如何解决政府网站附件下载难题？

爬虫下载附件的问题：附件下载不下来

问题描述

使用提供的爬虫代码爬取政府网站的附件时，无法下载附件。

代码分析

def download(filename, url, path):
    """
    下载附件
    """
    try:
        print('下载中，请耐心等待...')
        r = requests.get(url)
        with open(path + filename, "wb") as file:
            file.write(r.content)
        print(filename, '下载ok')
    except:
        print(filename, '下载失败')

解决方案

Pebblely

Pebblely

AI产品图精美背景添加

下载

从代码中可以看出，下载附件的功能已经实现。问题原因可能不在于代码，而是其他方面：

目标网站的反爬虫机制：政府网站可能采取了反爬虫措施，限制了附件下载。
网络连接问题：检查网络连接状态，确保可以正常访问目标网站。
文件名和路径错误：检查指定的附件文件名和保存路径是否有误。
附件网址错误：确保从目标页面提取到的附件网址是正确的。

优化建议

即使解决了附件下载问题，代码仍有优化空间：

使用 contextlib.closing() 自动关闭文件：使用 with 语句时，可以考虑使用 contextlib.closing() 自动关闭文件，避免异常处理时的文件资源泄漏。

优化后的代码

import contextlib

def download(fileName, url, path):
    """
    下载附件
    """
    try:
        print('下载中，请耐心等待...')
        with contextlib.closing(requests.get(url, stream=True)) as r:
            with contextlib.closing(open(path + fileName, "wb")) as File:
                File.write(r.content)
        print(fileName, '下载Ok')
    except:
        print(fileName, '下载失败')

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何用正则表达式匹配重复标签的第二个内容？下一篇：Python 将数据写入多个 MySQL 表时，第二个表始终报错，如何解决？

作者最新文章

市场监管总局：2025 年召回问题充电宝 139.77 万台

2026-01-21 16:51

Pandas：跨数据集复用分位数分箱规则对新数据进行分组标注

2026-01-21 16:52

如何高效地将S3中的PNG/JPEG图像流式编码为Base64（无需本地落盘）

2026-01-21 16:54

马航 MH370 航班客机残骸重启搜寻，尚无重大发现

2026-01-21 16:54

软银发布 AI 数据中心操作系统

2026-01-21 16:54

台积电产能已证实：苹果今年不发iPhone 18

2026-01-21 16:54

Firebase 字段名自动添加下划线前缀的解决方案

2026-01-21 16:55

如何在 Tomcat 中正确配置静态 PDF 文件以实现客户端下载

2026-01-21 16:58

如何安全地通过文本输入动态调用指定函数（PHP 教程）

2026-01-21 16:59

玩家认为《赛博朋克2077》不需要快速传送：没有意义！

2026-01-21 16:59

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

Java编译相关教程合集

Java编译相关教程合集

本专题整合了Java编译相关教程，阅读专题下面的文章了解更多详细内容。

11

2026.01.21

C++多线程相关合集

C++多线程相关合集

本专题整合了C++多线程相关教程，阅读专题下面的的文章了解更多详细内容。

4

2026.01.21

无人机驾驶证报考 uom民用无人机综合管理平台官网

无人机驾驶证报考 uom民用无人机综合管理平台官网

无人机驾驶证（CAAC执照）报考需年满16周岁，初中以上学历，身体健康（矫正视力1.0以上，无严重疾病），且无犯罪记录。个人需通过民航局授权的训练机构报名，经理论（法规、原理）、模拟飞行、实操（GPS/姿态模式）及地面站训练后考试合格，通常15-25天拿证。

16

2026.01.21

Python多线程合集

Python多线程合集

本专题整合了Python多线程相关教程，阅读专题下面的文章了解更多详细内容。

1

2026.01.21

java多线程相关教程合集

java多线程相关教程合集

本专题整合了java多线程相关教程，阅读专题下面的文章了解更多详细内容。

4

2026.01.21

windows激活码分享 windows一键激活教程指南

windows激活码分享 windows一键激活教程指南

Windows 10/11一键激活可以通过PowerShell脚本或KMS工具实现永久或长期激活。最推荐的简便方法是打开PowerShell（管理员），运行 irm https://get.activated.win | iex 脚本，按提示选择数字激活（选项1）。其他方法包括使用HEU KMS Activator工具进行智能激活。

2

2026.01.21

excel表格操作技巧大全表格制作excel教程

excel表格操作技巧大全表格制作excel教程

Excel表格操作的核心技巧在于熟练使用快捷键、数据处理函数及视图工具，如Ctrl+C/V（复制粘贴）、Alt+=（自动求和）、条件格式、数据验证及数据透视表。掌握这些可大幅提升数据分析与办公效率，实现快速录入、查找、筛选和汇总。

6

2026.01.21

毒蘑菇显卡测试网站入口毒蘑菇测试官网volumeshader_bm

毒蘑菇显卡测试网站入口毒蘑菇测试官网volumeshader_bm

毒蘑菇VOLUMESHADER_BM测试网站网址为https://toolwa.com/vsbm/，该平台基于WebGL技术通过渲染高复杂度三维分形图形评估设备图形处理能力，用户可通过拖动彩色物体观察画面流畅度判断GPU与CPU协同性能；测试兼容多种设备，但中低端手机易卡顿或崩溃，高端机型可能因发热降频影响表现，桌面端需启用独立显卡并使用支持WebGL的主流浏览器以确保准确结果

25

2026.01.21

github中文官网入口 github中文版官网网页进入

github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started，GitHub 是一种基于云的平台，可在其中存储、共享并与他人一起编写代码。通过将代码存储在GitHub 上的“存储库”中，你可以： “展示或共享”你的工作。持续“跟踪和管理”对代码的更改。

7

2026.01.21

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

最新文章

更多

如何合法合规地爬取 Yelp 数据：避免 503 错误与封禁风险

如何准确识别运行环境：区分 MSYS2、PowerShell 与 CMD

如何批量请求多个URL并将结果合并保存为CSV文件

PyTorch模型加载权重后结果不一致？关键在于正确提取state_dict

Python requests.get 响应编码不一致问题的根源与解决方案

如何高效地按行计算 Pandas Series 中的动态表达式

Python 进程池 Pool 的任务分发机制

Python 中排序为什么如此灵活？

numpy 同时使用高级整数索引和布尔掩码的正确顺序

生成器函数如何在外部提前终止并清理资源

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部