网页爬虫 - java 或 c++实现的 抓取数据的软件
迷茫
迷茫 2017-04-17 16:13:03
[Java讨论组]
迷茫
迷茫

业精于勤,荒于嬉;行成于思,毁于随。

全部回复(6)
巴扎黑

webmagic

伊谢尔伦

简单点的可以用Jsoup

伊谢尔伦

Jsoup 的优势是解析抓取到的网页。对于需要回话的复杂业务系统有时候还是 会抓取不到数据。(做入门级的抓取确实好用)

localHttpURLConnection 来抓取基本是没出过什么问题的。

httpclient 抓取也是基本没出过什么问题。

大家讲道理

现在发现好像要做一个 爬虫也不容易啊 。。。。

高洛峰

抓取网络数据可以用Jsoup,不过还是推荐你用Python写网络爬虫,有很多优秀的框架。

怪我咯

一般都是自己写,开源的软件抓取的数据很多时候和自己需要的不一样
http://www.duweixin.net/ 读微信 我的这个网站上的数据抓的是微信的,是用java写的。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号