python - 最近各电商打得很火啊！我也就学习学习爬虫。遇到些问题,关于User-Agent,关于403-PHP中文网问答

讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 AI 提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

python - 最近各电商打得很火啊！我也就学习学习爬虫。遇到些问题,关于User-Agent,关于403

迷茫 2017-04-17 11:34:14

[Python讨论组]

477

恩。我最近在弄个爬虫的程序，主要是弄来玩玩
是用python写的程序。目前遇到的问题是爬虫爬一会儿就会被返回
403 forbidden
这时，我依然可以使用浏览器访问该网页（爬虫处理到的页面）
于是我想到了修改USER-AGENT来伪装浏览器访问的效果
但是依旧是程序403，且浏览器可以访问。
请问，这是怎么回事，有什么办法可以解决吗？谢谢！
关于连接部分的代码是这样:(python3)

import urllib.request
req = urllib.request.Request('http://www.xxx.com')
req.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1; rv:7.0) Gecko/20100101 Firefox/7.0")
rec = urllib.request.urlopen(req).read().decode('utf8')

然后就会返回403了
谢谢！