可以用以下4個(gè)方法來抓取網(wǎng)站 的數(shù)據(jù):
創(chuàng)新互聯(lián)主營(yíng)高陵網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,重慶APP開發(fā)公司,高陵h5微信平臺(tái)小程序開發(fā)搭建,高陵網(wǎng)站營(yíng)銷推廣歡迎高陵等地區(qū)企業(yè)咨詢
1. 用 file_get_contents 以 get 方式獲取內(nèi)容:
?
$url = '';
$html = file_get_contents($url);
echo $html;
2. 用fopen打開url,以get方式獲取內(nèi)容
?
$url = '';
$fp = fopen($url, 'r');
stream_get_meta_data($fp);
$result = '';
while(!feof($fp))
{
$result .= fgets($fp, 1024);
}
echo "url body: $result";
fclose($fp);
3. 用file_get_contents函數(shù),以post方式獲取url
?
$data = array(
'foo'='bar',
'baz'='boom',
'site'='',
'name'='nowa magic');
$data = http_build_query($data);
//$postdata = http_build_query($data);
$options = array(
'http' = array(
'method' = 'POST',
'header' = 'Content-type:application/x-www-form-urlencoded',
'content' = $data
//'timeout' = 60 * 60 // 超時(shí)時(shí)間(單位:s)
)
);
$url = "";
$context = stream_context_create($options);
$result = file_get_contents($url, false, $context);
echo $result;
4、使用curl庫(kù),使用curl庫(kù)之前,可能需要查看一下php.ini是否已經(jīng)打開了curl擴(kuò)展
$url = '';
$ch = curl_init();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, $url);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents = curl_exec($ch);
curl_close($ch);
echo $file_contents;
PHP抓取頁(yè)面的主要方法:
1. file()函數(shù)
2. file_get_contents()函數(shù)
3. fopen()-fread()-fclose()模式
4.curl方式
5. fsockopen()函數(shù) socket模式
6. 使用插件
會(huì)用正則就會(huì)抓取。
不會(huì)正則,一時(shí)半會(huì)也教不錯(cuò)。
不過,推薦你使用phpQuery這個(gè)框架,用jQuery的使用器來抓取數(shù)據(jù)。
sybase_connect連上數(shù)據(jù)庫(kù)。
語(yǔ)法: int sybase_connect(string [servername], string [username], string [password]);
返回值: 整數(shù)函數(shù)種類: 數(shù)據(jù)庫(kù)功能 本函數(shù)用來打開與 Sybase 數(shù)據(jù)庫(kù)的連接。
參數(shù) servername 為欲連上的數(shù)據(jù)庫(kù)服務(wù)器名稱。
參數(shù) username 及 password 可省略,分別為連接使用的帳號(hào)及密碼。
使用本函數(shù)需注意早點(diǎn)關(guān)閉數(shù)據(jù)庫(kù),以減少系統(tǒng)的負(fù)擔(dān)。
連接成功則返回?cái)?shù)據(jù)庫(kù)的連接代號(hào),失敗返回 false 值。
?php
$rs=file_get_contents('');
preg_match('/table?width="600"?border="0"?cellpadding="5"?cellspacing="1"?bgcolor="#EAEAEA"(.*?)\/table/sS',$rs,$match);
//?print_r($match);
$rs?=?str_replace(array('/tr','/td','tr?align="center"','td?bgcolor="#FFFFFF"'),array('|',';'),$match[1]);
//?
$data?=?array();
$rs?=?explode('|',$rs);
foreach($rs?as?$key=$item){
if($key0){
$arr?=?explode(';',$item);
($a?=?@trim($arr[0]))??($b?=?@trim($arr[5]))??$data[]?=?array($a,$b);
}
}
print_r($data);
?
網(wǎng)站欄目:抓取頁(yè)面數(shù)據(jù)php,獲取頁(yè)面數(shù)據(jù)
本文鏈接:http://jinyejixie.com/article6/dseciig.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供手機(jī)網(wǎng)站建設(shè)、電子商務(wù)、軟件開發(fā)、、Google、網(wǎng)站營(yíng)銷
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)