PHP采集CSDN博客边栏的阅读排行
项目中要用到采集的数据,所以就先拿CSDN博客来试了试。这里使用Simple HTML DOM(官网)这个库,它能够方便的遍历HTML文档。
<?php include_once('simple_html_dom.php');
header('Content-Type:text/html;charset=utf-8');
$html = file_get_html('http://blog.csdn.net/szy361');
$res = $html->find('#hotarticls ul.panel_body li a[title]');//取得id=hotarticls下class为panel_bodya的ul标签下的a的title
$span = $html->find('#hotarticls ul.panel_body li span');//取得span
foreach($res as $element){
$arr[] = $element->title.'+'.$element->href;//将title值和href的值通过+连起来
}
foreach($span as $e){
$brr[] = $e->innertext;//得到span下的值组成的数组
}
//将两个数组组成一个新的二维数组
for($i=0;$i<count explode return>
<p> </p>
<p>扩展:</p><div class="aritcle_card flexRow">
<div class="artcardd flexRow">
<a class="aritcle_card_img" href="/ai/1796" title="奇布塔"><img
src="https://img.php.cn/upload/ai_manual/000/000/000/175680366899415.png" alt="奇布塔" onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
<div class="aritcle_card_info flexColumn">
<a href="/ai/1796" title="奇布塔">奇布塔</a>
<p>基于AI生成技术的一站式有声绘本创作平台</p>
</div>
<a href="/ai/1796" title="奇布塔" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
</div>
</div>
<p>PHP Simple HTML DOM解析器使用入门</p>
</count>










