2023-12-01 分類: 網站建設
php字符編碼轉換類,支持ANSI、big、UTF-8、UTF-8+bom相互轉換。
四種常見的文本文件編碼方式
ANSI 編碼:
無文件頭(文件編碼開頭的有效字節(jié))
ANSI編碼的字母數(shù)字占一個字節(jié),漢字占兩個字節(jié)
回車換行,單字節(jié),十六進制表示為0d 0a
編碼:
文件頭,十六進制表示為FF FE
每個字符用兩個字節(jié)編碼
回車,換行,雙字節(jié),十六進制表示為000d 000a
大編碼:
文件頭的十六進制表示為FE FF
后面的編碼就是把字符的高位放在前面,低位放在后面,正好是編碼的逆過程
回車,換行php轉unicode編碼,雙字節(jié)php轉unicode編碼,十六進制表示為 0d00 0a00
UTF-8 編碼:
文件頭,十六進制表示為EF bb bF
UTF-8 是一種可變長度的字符編碼。數(shù)字、字母、回車、換行都用1個字節(jié)表示,漢字占3個字節(jié)。
回車換行,單字節(jié),十六進制表示為0d 0a
轉換原則:先將字符編碼轉換為UTF-8,再由UTF-8轉換為對應的字符編碼。
..php
_allow_charset)){ $this->_in_charset = $in_charset; } // 檢查輸出編碼 if(in_array($out_charset, $this->_allow_charset)){ $this->_out_charset = $out_charset; } } /** 轉換 * @param String $str 要轉換的字符串 * @return String 轉換后的字符串 */ public function convert($str){ $str = $this->convToUtf8($str); // 先轉為utf8 $str = $this->convFromUtf8($str); // 從utf8轉為對應的編碼 return $str; } /** 把編碼轉為UTF-8編碼 * @param String $str * @return String */ private function convToUtf8($str){ if($this->_in_charset=='utf-8'){ // 編碼已經是utf-8,不用轉 return $str; } switch($this->_in_charset){ case 'utf-8bom': $str = substr($str, 3); break; case 'ansi': $str = iconv('GbK', 'UTF-8//IGNORE', $str); break; case 'unicode': $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2)); break; case 'unicodebe': $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2)); break; default: break; } return $str; } /** 把UTF-8編碼轉換為輸出編碼 * @param String $str * @return String */ private function convFromUtf8($str){ if($this->_out_charset=='utf-8'){ // 輸出編碼已經是utf-8,不用轉 return $str; } switch($this->_out_charset){ case 'utf-8bom': $str = "\xef\xbb\xbf".$str; break; case 'ansi': $str = iconv('UTF-8', 'GbK//IGNORE', $str); break; case 'unicode': $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str); break; case 'unicodebe': $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str); break; default: break; } return $str; } } // class end ?>
演示:將 big 轉換為 utf-8+bom
convert($str); file_put_contents('response/utf-8bom.txt', $response, true); ?>
源碼下載地址:點擊查看
以上介紹了pHp字符編碼轉換類,支持ANSI、big、UTF-8、UTF-8+bom之間的轉換,包括內容,希望對pHp教程感興趣的朋友有所幫助.
免責聲明:本文首發(fā)于php中文網。轉載請注明出處。感謝您的尊重!如果您有任何問題,請聯(lián)系我們
網頁題目:四種常見文本文件編碼方式ANSI編碼:無文件頭(文件編碼開頭標志性)
當前地址:http://jinyejixie.com/news48/297848.html
成都網站建設公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、Google、網站建設、電子商務、面包屑導航、移動網站建設
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內容