成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

PHP怎么用curl讀取HTTPchunked數(shù)據(jù)-創(chuàng)新互聯(lián)

這篇文章主要介紹PHP怎么用curl讀取HTTP chunked數(shù)據(jù),文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

專(zhuān)注于為中小企業(yè)提供成都網(wǎng)站設(shè)計(jì)、做網(wǎng)站服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)資興免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動(dòng)了超過(guò)千家企業(yè)的穩(wěn)健成長(zhǎng),幫助中小企業(yè)通過(guò)網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。

對(duì)于 Web 服務(wù)器返回的 HTTP chunked 數(shù)據(jù), 我們可能希望在每一個(gè) chunk 返回時(shí)得到回調(diào), 而不是所有的響應(yīng)返回后再回調(diào). 例如, 當(dāng)服務(wù)器是 icomet 的時(shí)候.

在 PHP 中使用 curl 代碼如下:

<?php 
$url = "http://127.0.0.1:8100/stream";
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_WRITEFUNCTION, 'myfunc');
$result = curl_exec($ch);
curl_close($ch);
function myfunc($ch, $data){
$bytes = strlen($data);
// 處理 data
return $bytes;
}

但是, 這里有一個(gè)問(wèn)題. 對(duì)于一個(gè) chunk, 回調(diào)函數(shù)可能會(huì)被調(diào)用多次, 每一次大概是 16k 的數(shù)據(jù). 這顯然不是我們希望得到的. 因?yàn)?icomet 的一個(gè) chunk 是以 "\n" 結(jié)尾, 所以回調(diào)函數(shù)可以做一下緩沖.

function myfunc($ch, $data){
$bytes = strlen($data);
static $buf = '';
$buf .= $data;
while(1){
$pos = strpos($buf, "\n");
if($pos === false){
break;
}
$data = substr($buf, 0, $pos+1);
$buf = substr($buf, $pos+1);
// 處理 data
}
}

下面給大家介紹下chunked php使用fsockopen讀取分段數(shù)據(jù)(transfer-encoding: chunked)

使用fsockopen讀取數(shù)據(jù)時(shí)遇到了一個(gè)神奇的問(wèn)題,具體情況如下:


讀取地址:http://blog.maxthon.cn/?feed=rss2


讀取代碼:


<?php
$fp = fsockopen("blog.maxthon.cn", 80, $errno, $errstr, 30);
if (!$fp) {
echo "$errstr ($errno)<br />\n";
} else {
$out = "GET /?feed=rss2 HTTP/1.1\r\n";
$out .= "Host: blog.maxthon.cn\r\n";
$out .= "Connection: Close\r\n\r\n";
fwrite($fp, $out);
while (!feof($fp)) {
echo fgets($fp, 128);
}
fclose($fp);
}
?>

返回http內(nèi)容:

Date: Mon, 29 Mar 2010 10:16:13 GMT
Server: Apache/2.2.8 (Unix) mod_ssl/2.2.8 OpenSSL/0.9.8b PHP/5.2.6
X-Powered-By: PHP/5.2.6
X-Pingback: http://blog.maxthon.cn/xmlrpc.php
Last-Modified: Wed, 03 Mar 2010 03:13:41 GMT
ETag: "8f16b619f32188bde3bc008a60c2cc11"
Keep-Alive: timeout=15, max=120
Connection: Keep-Alive
Transfer-Encoding: chunked
Content-Type: text/xml; charset=UTF-8
22de
<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
<description><![CDATA[2009年12月31日
1711
.......
1fe8
]]></description>
<content:encoded><![CDATA[<p>2009年12月31日<br />
1711</p>

請(qǐng)注意上面那些標(biāo)紅的4個(gè)字符,它們每隔一段數(shù)據(jù)就會(huì)出現(xiàn)一次,但是用其他的方法如curl,file_get_contents等取回的數(shù)據(jù)則沒(méi)有這些玩意。換成其他的網(wǎng)站來(lái)抓取,也只是少數(shù)的網(wǎng)站會(huì)出現(xiàn)這種情況,多方搜索無(wú)解后,我無(wú)意中看到了上面返回頭中有這么一個(gè)聲明:Transfer-Encoding: chunked,而常見(jiàn)的Content-lenght字段沒(méi)有了。這個(gè)聲明的大致的意思是傳輸編碼為分段方式。


在Google上搜索該關(guān)鍵詞,在維基百科上找到對(duì)這個(gè)聲明的解釋?zhuān)ㄓ捎跊](méi)有中文版,我只能自己按照意思翻譯):


Chunked Transfer Encoding is a mechanism that allows HTTP messages to be split in several parts. This can be applied to both HTTP requests (from client to server) and HTTP responses (from server to client)

分塊傳輸編碼是一種機(jī)制,允許將HTTP消息分成幾個(gè)部分傳輸。同時(shí)適用于HTTP請(qǐng)求(從客戶(hù)端到服務(wù)器)和 HTTP響應(yīng)(從服務(wù)器到客戶(hù)端)


For example, let us consider the way in which an HTTP server may transmit data to a client application (usually a web browser). Normally, data delivered in HTTP responses is sent in one piece, whose length is indicated by the Content-Length header field. The length of the data is important, because the client needs to know where the response ends and any following response starts. With chunked encoding, however, the data is broken up into a series of blocks of data and transmitted in one or more "chunks" so that a server may start sending data before it knows the final size of the content that it's sending. Often, the size of these blocks is the same, but this is not always the case.


例如,讓我們考慮HTTP服務(wù)器可將數(shù)據(jù)傳輸?shù)娇蛻?hù)端應(yīng)用程序(通常是一個(gè)網(wǎng)絡(luò)瀏覽器)使用哪些方式。通常情況下,在HTTP響應(yīng)數(shù)據(jù)是按照一整塊發(fā)送給客戶(hù)端的,數(shù)據(jù)的長(zhǎng)度是由Content - Length頭域表示。數(shù)據(jù)的長(zhǎng)度很重要,因?yàn)榭蛻?hù)需要知道在哪里響應(yīng)結(jié)束和后面的響應(yīng)何時(shí)啟動(dòng)。而使用Chunked編碼方式,不管怎樣,數(shù)據(jù)都會(huì)分割成一系列的數(shù)據(jù)塊和一個(gè)或多個(gè)轉(zhuǎn)發(fā)的“塊”,因此服務(wù)器在知道內(nèi)容的長(zhǎng)度之前,就可以開(kāi)始發(fā)送數(shù)據(jù)后。通常情況下,這些數(shù)據(jù)塊的大小是一樣的,但也并不是絕對(duì)的。


大概意思了解后,我們來(lái)看例子:


Chunked編碼使用若干個(gè)Chunk串連而成,由一個(gè)標(biāo)明長(zhǎng)度為0的chunk標(biāo)示結(jié)束。每個(gè)Chunk分為頭部和正文兩部分,頭部?jī)?nèi)容指定下一段正文的字符總數(shù)(十六進(jìn)制的數(shù)字)和數(shù)量單位(一般不寫(xiě)),正文部分就是指定長(zhǎng)度的實(shí)際內(nèi)容,兩部分之間用回車(chē)換行(CRLF)隔開(kāi)。在最后一個(gè)長(zhǎng)度為0的Chunk中的內(nèi)容是稱(chēng)為footer的內(nèi)容,是一些附加的Header信息(通??梢灾苯雍雎裕?。具體的Chunk編碼格式如下:


編過(guò)碼的響應(yīng)內(nèi)容:

HTTP/1.1 200 OK
Content-Type: text/plain
Transfer-Encoding: chunked

25


這是第一段數(shù)據(jù)

1A


然后這是第二段數(shù)據(jù)


0

解碼的數(shù)據(jù):


這是第一段內(nèi)容,然后這是第二段數(shù)據(jù)


情況搞清楚了,那么我們?cè)趺磥?lái)解碼這個(gè)編碼后的數(shù)據(jù)呢?


在php官方手冊(cè)fsockopen函數(shù)下面的評(píng)論中,已經(jīng)有很多人提出了解決方法


方法1.


<?php
function unchunk($result) {
return preg_replace_callback(
'/(?:(?:\r\n|\n)|^)([0-9A-F]+)(?:\r\n|\n){1,2}(.*?)'.
'((?:\r\n|\n)(?:[0-9A-F]+(?:\r\n|\n))|$)/si',
create_function(
'$matches',
'return hexdec($matches[1]) == strlen($matches[2]) ? $matches[2] : $matches[0];'
),
$result
);
}

方法二.


function unchunkHttp11($data) {
$fp = 0;
$outData = "";
while ($fp < strlen($data)) {
$rawnum = substr($data, $fp, strpos(substr($data, $fp), "\r\n") + 2);
$num = hexdec(trim($rawnum));
$fp += strlen($rawnum);
$chunk = substr($data, $fp, $num);
$outData .= $chunk;
$fp += strlen($chunk);
}
return $outData;
}

注意:這兩個(gè)函數(shù)的參數(shù)都是返回的http原始數(shù)據(jù)(包括頭)

以上是“PHP怎么用curl讀取HTTP chunked數(shù)據(jù)”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

本文標(biāo)題:PHP怎么用curl讀取HTTPchunked數(shù)據(jù)-創(chuàng)新互聯(lián)
本文網(wǎng)址:http://jinyejixie.com/article42/dipiec.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供響應(yīng)式網(wǎng)站企業(yè)建站、域名注冊(cè)面包屑導(dǎo)航、商城網(wǎng)站、網(wǎng)頁(yè)設(shè)計(jì)公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)
舒兰市| 安平县| 综艺| 南江县| 方正县| 刚察县| 土默特左旗| 太谷县| 屯留县| 铜陵市| 阳曲县| 白银市| 达日县| 北流市| 郎溪县| 涿州市| 永德县| 丰城市| 灵台县| 齐河县| 枣强县| 梧州市| 浙江省| 陆河县| 永胜县| 尼勒克县| 凯里市| 阿拉善左旗| 怀化市| 贞丰县| 依兰县| 乌拉特前旗| 珠海市| 渝中区| 墨玉县| 丹巴县| 洪江市| 遂平县| 上虞市| 和田市| 宜章县|