想要爬取一个网站,这个网站的不同网页的正文部分的xpath是不一样的,比如:
有个页面的正文部分是://*[@id='postmessage_32199']
另一个是://*[@id='postmessage_32153']
......
它们的格式是postmessage_xxxxx,x为数字。
我的问题是:xpath中可以使用用正则表达式吗?如果不能那怎么匹配这么多不同的xpath?
ps:我是用的是python的scrapy框架
提前感谢各位了。
Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
走同样的路,发现不同的人生