使用 Python 抓取网页但不确定如何处理静态(?) URL
P粉293341969
P粉293341969 2024-02-17 17:14:50
[HTML讨论组]

我正在尝试学习如何从此网址提取数据: https://denver.coloradotaxsale.com/index.cfm?folder=auctionResults&mode=preview

但是,问题是当我尝试切换页面时,URL 不会改变,因此我不确定如何枚举或循环它。由于网页有 3000 个销售数据点,正在尝试寻找更好的方法。

这是我的起始代码,它非常简单,但我将不胜感激任何可以提供的帮助或任何提示。我想我可能需要换成另一个包,但我不确定哪个可能是 beautifulsoup?

导入请求
url =“https://denver.coloradotaxsale.com/index.cfm?folder=auctionResults&mode=preview”

html = requests.get(url).content
df_list = pd.read_html(html,标题 = 1)[0]
df_list = df_list.drop([0,1,2]) #删除不需要的行

P粉293341969
P粉293341969

全部回复(0)
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号