本篇內(nèi)容介紹了“用PHP實(shí)現(xiàn)簡(jiǎn)單采集數(shù)據(jù)入庫(kù)”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
在湯旺等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場(chǎng)前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都網(wǎng)站設(shè)計(jì)、網(wǎng)站建設(shè) 網(wǎng)站設(shè)計(jì)制作定制制作,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),品牌網(wǎng)站設(shè)計(jì),營(yíng)銷型網(wǎng)站建設(shè),外貿(mào)網(wǎng)站制作,湯旺網(wǎng)站建設(shè)費(fèi)用合理。說(shuō)到采集,無(wú)非就是遠(yuǎn)程獲取信息->提取所需內(nèi)容->分類存儲(chǔ)->讀取->展示
也算是簡(jiǎn)單"小偷程序"的加強(qiáng)版吧
下面是對(duì)應(yīng)核心代碼(別拿去做壞事哦^_^)
所要采集的內(nèi)容是某游戲網(wǎng)站上的公告,如下圖:
可先利用file_get_contents和簡(jiǎn)單正則獲取基本頁(yè)面信息
整理下基本信息,采集入庫(kù):
<?php include_once("conn.php"); if($_GET['id']<=8&&$_GET['id']){ $id=$_GET['id']; $conn=file_get_contents("http://www.93moli.com/news_list_4_$id.html");//獲取頁(yè)面內(nèi)容 $pattern="/<li><a title=\"(.*)\" target=\"_blank\" href=\"(.*)\">/iUs";//正則 preg_match_all($pattern, $conn, $arr);//匹配內(nèi)容到arr數(shù)組 //print_r($arr);die; foreach ($arr[1] as $key => $value) {//二維數(shù)組[2]對(duì)應(yīng)id和[1]剛好一樣,利用起key $url="http://www.93moli.com/".$arr[2][$key]; $sql="insert into list(title,url) value ('$value', '$url')"; mysql_query($sql); //echo "<a href='content.php?url=http://www.93moli.com/$url'>$value</a>"."<br/>"; } $id++; echo "正在采集URL數(shù)據(jù)列表$id...請(qǐng)稍后..."; echo "<script>window.location='list.php?id=$id'</script>"; }else{ echo "采集數(shù)據(jù)結(jié)束。"; } ?>
conn.php是數(shù)據(jù)庫(kù)連接文件
list.php是本頁(yè)面
由于要采集的數(shù)據(jù)是分頁(yè)顯示的,且頁(yè)面地址是規(guī)律遞增,所以我用了js跳轉(zhuǎn)代碼,利用id傳值控制采集的頁(yè)數(shù),也避免了for循環(huán)數(shù)目過(guò)大。
輕輕松松數(shù)據(jù)入庫(kù),下篇文章寫(xiě)關(guān)于具體url采集信息的過(guò)程。
“用PHP實(shí)現(xiàn)簡(jiǎn)單采集數(shù)據(jù)入庫(kù)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
網(wǎng)頁(yè)題目:用PHP實(shí)現(xiàn)簡(jiǎn)單采集數(shù)據(jù)入庫(kù)-創(chuàng)新互聯(lián)
標(biāo)題網(wǎng)址:http://jinyejixie.com/article22/dhdjjc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信公眾號(hào)、網(wǎng)站建設(shè)、App開(kāi)發(fā)、品牌網(wǎng)站制作、云服務(wù)器、靜態(tài)網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容