成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

怎么用PHP函數(shù)實現(xiàn)采集器

本篇內(nèi)容介紹了“怎么用PHP函數(shù)實現(xiàn)采集器”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

創(chuàng)新互聯(lián)主營石獅網(wǎng)站建設的網(wǎng)絡公司,主營網(wǎng)站建設方案,成都app軟件開發(fā),石獅h5重慶小程序開發(fā)公司搭建,石獅網(wǎng)站營銷推廣歡迎石獅等地區(qū)企業(yè)咨詢

前幾天做了個小說連載的程序,因為怕更新麻煩,順帶就寫了個采集器,采集八路中文網(wǎng)的,功能比較簡單,不能自定義規(guī)則,不過大概思路都在里面了,自定義規(guī)則可以自己來擴展。用php來做采集器主要用到兩個PHP函數(shù):file_get_contents()和preg_match_all(),前一個是遠程讀取網(wǎng)頁內(nèi)容的,不過只在php5以上的版本才能用,后一個是正則函數(shù),用來提取需要的內(nèi)容的。面就一步一步來講功能實現(xiàn)。因為是采集小說,所以首先要將書名、作者、類型這三個提取出來,別的信息可根據(jù)需要提取。

這樣還不夠,還需要一個切取PHP函數(shù):

function cut($string,$start,$end){     $message = explode($start,$string);     $message = explode($end,$message[1]); return $message[0];}其中$string為要被切取的內(nèi)容,$start為開始的地方,$end為結束的地方。取出分類號:      $start = "Html/Book/";     $end    = "List.shtm";     $typeid = cut($typeid[0][0],$start,$end);     $typeid = explode("/",$typeid);[/php]      這樣,$typeid[0]就是我們要找的分類號了。方法如下:      $ustart = "\"";     $uend    = "\"";     //t表示title的縮寫     $tstart = ">";     $tend    = "<";     //取路徑,例如:123.shtm,2342.shtm,233.shtm     preg_match_all("/\"[0-9]{1,}\.(shtm)\"/is",$chapterurl,$url);     //取標題,例如:***章 九世善人     preg_match_all("/<a href=\"[0-9]{1,}\.shtm\"(.*?)\<\/a>/is",$file,$title);     $countcountcount = count($url[0]);     for($i=0;$i<=$count;$i++)     {     $u = cut($url[0][$i],$ustart,$uend);     $t = cut($title[0][$i],$tstart,$tend);     $array[$u] = $t;     }

$array數(shù)組就是所有的章節(jié)地址了,到這里,采集器就完成一半了,剩下的就是循環(huán)打開每個章節(jié)地址,讀取,然后將內(nèi)容匹配出來。這個比較簡單,這里就不詳細敘述了。好了,今天就先寫到這吧,***次寫這么長的文章,語言組織方面難免有問題,還請大家多包涵!

“怎么用PHP函數(shù)實現(xiàn)采集器”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關的知識可以關注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!

名稱欄目:怎么用PHP函數(shù)實現(xiàn)采集器
URL網(wǎng)址:http://jinyejixie.com/article48/gpejep.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站制作、手機網(wǎng)站建設、做網(wǎng)站自適應網(wǎng)站、網(wǎng)站制作、品牌網(wǎng)站建設

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作
东宁县| 报价| 故城县| 武汉市| 诸暨市| 德庆县| 龙川县| 温州市| 新巴尔虎右旗| 余江县| 孙吴县| 阳高县| 巴塘县| 建瓯市| 奎屯市| 姜堰市| 新蔡县| 大埔区| 安徽省| 隆回县| 都兰县| 霍城县| 伊春市| 招远市| 安丘市| 江阴市| 洪泽县| 龙江县| 七台河市| 伊川县| 淮北市| 嫩江县| 时尚| 白河县| 台前县| 垣曲县| 洛隆县| 莱州市| 裕民县| 桐城市| 班戈县|