
js如何使用正则表达式解析html文本
问题:
想要使用正则表达式解析html文本,并获取其中每个a标签的href地址,应该如何书写正则表达式?
尝试:
const r1 = s.match(/活动开展情况[\s\S]*zuojiankuohaophpcn\/ulyoujiankuohaophpcn/g)[0] const r2 = r1.match(/(?zuojiankuohaophpcn=href=").*?(?=")/g)
错误:
立即学习“前端免费学习笔记(深入)”;
上述代码会匹配到不想要的#、javascript:void(0)等内容,无法准确获取想要的结果。
解决方案:
由于自己写正则容易误配,建议使用html解析器来进行解析,更加安全稳妥。例如,可以使用jquery中的$(html).find('youjiankuohaophpcnliyoujiankuohaophpcna')来查找所有a标签,然后使用map方法获取它们的href地址:
使用jquery:
$(html).find('youjiankuohaophpcnliyoujiankuohaophpcna').map((_, a) =youjiankuohaophpcn $(a).attr('href'))使用ES6:
[...$(html).find('youjiankuohaophpcnliyoujiankuohaophpcna')].map(a =youjiankuohaophpcn $(a).attr('href'))输出:
[
"/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=3",
"/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=4",
"/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=6",
"/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&AreaType=1&SpecialCode=9",
"/eduadmin/DevelopActivity/SystemActivityManage/2/-1"
]











