下文給大家?guī)黻P(guān)于MySQL中utf8_general_ci與utf8_unicode_ci有什么本質(zhì)上的區(qū)別,感興趣的話就一起來看看這篇文章吧,相信看完Mysql中utf8_general_ci與utf8_unicode_ci有什么本質(zhì)上的區(qū)別對大家多少有點幫助吧。
成都創(chuàng)新互聯(lián)公司長期為上千余家客戶提供的網(wǎng)站建設服務,團隊從業(yè)經(jīng)驗10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務;打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為豐鎮(zhèn)企業(yè)提供專業(yè)的成都網(wǎng)站制作、網(wǎng)站建設,豐鎮(zhèn)網(wǎng)站改版等技術(shù)服務。擁有十載豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。
用了這么長時間,發(fā)現(xiàn)自己竟然不知道utf_bin和utf_general_ci這兩者到底有什么區(qū)別。。
ci是 case insensitive, 即 "大小寫不敏感", a 和 A 會在字符判斷中會被當做一樣的;
bin 是二進制, a 和 A 會別區(qū)別對待.
例如你運行:
SELECT * FROM table WHERE txt = 'a'
那么在utf8_bin中你就找不到 txt = 'A' 的那一行, 而 utf8_general_ci 則可以.
utf8_general_ci 不區(qū)分大小寫,這個你在注冊用戶名和郵箱的時候就要使用。
utf8_general_cs 區(qū)分大小寫,如果用戶名和郵箱用這個 就會照成不良后果
utf8_bin:字符串每個字符串用二進制數(shù)據(jù)編譯存儲。 區(qū)分大小寫,而且可以存二進制的內(nèi)容
一、官方文檔說明
下面摘錄一下Mysql 5.1中文手冊中關(guān)于utf8_unicode_ci與utf8_general_ci的說明:
當前,utf8_unicode_ci校對規(guī)則僅部分支持Unicode校對規(guī)則算法。一些字符還是不能支持。并且,不能完全支持組合的記號。這主要影響越南和俄羅斯的一些少數(shù)民族語言,如:Udmurt 、Tatar、Bashkir和Mari。
utf8_unicode_ci的最主要的特色是支持擴展,即當把一個字母看作與其它字母組合相等時。例如,在德語和一些其它語言中‘?'等于‘ss'。
utf8_general_ci是一個遺留的 校對規(guī)則,不支持擴展。它僅能夠在字符之間進行逐個比較。這意味著utf8_general_ci校對規(guī)則進行的比較速度很快,但是與使用utf8_unicode_ci的 校對規(guī)則相比,比較正確性較差)。
例如,使用utf8_general_ci和utf8_unicode_ci兩種 校對規(guī)則下面的比較相等:
? = A
? = O
ü = U
兩種校對規(guī)則之間的區(qū)別是,對于utf8_general_ci下面的等式成立:
? = s
但是,對于utf8_unicode_ci下面等式成立:
? = ss
對于一種語言僅當使用utf8_unicode_ci排序做的不好時,才執(zhí)行與具體語言相關(guān)的utf8字符集 校對規(guī)則。例如,對于德語和法語,utf8_unicode_ci工作的很好,因此不再需要為這兩種語言創(chuàng)建特殊的utf8校對規(guī)則。
utf8_general_ci也適用與德語和法語,除了‘?'等于‘s',而不是‘ss'之外。如果你的應用能夠接受這些,那么應該使用utf8_general_ci,因為它速度快。否則,使用utf8_unicode_ci,因為它比較準確。
如果你想使用gb2312編碼,那么建議你使用latin1作為數(shù)據(jù)表的默認字符集,這樣就能直接用中文在命令行工具中插入數(shù)據(jù),并且可以直接顯示出來.而不要使用gb2312或者gbk等字符集,如果擔心查詢排序等問題,可以使用binary屬性約束,例如:
create table my_table ( name varchar(20) binary not null default '')type=myisam default charset latin1;
二、簡短總結(jié)
utf8_unicode_ci和utf8_general_ci對中、英文來說沒有實質(zhì)的差別。
utf8_general_ci校對速度快,但準確度稍差。
utf8_unicode_ci準確度高,但校對速度稍慢。
如果你的應用有德語、法語或者俄語,請一定使用utf8_unicode_ci。一般用utf8_general_ci就夠了,到現(xiàn)在也沒發(fā)現(xiàn)問題。。。
三、詳細總結(jié)
1、對于一種語言僅當使用utf8_unicode_ci排序做的不好時,才執(zhí)行與具體語言相關(guān)的utf8字符集校對規(guī)則。例如,對于德語和法語,utf8_unicode_ci工作的很好,因此不再需要為這兩種語言創(chuàng)建特殊的utf8校對規(guī)則。
2、utf8_general_ci也適用與德語和法語,除了‘?'等于‘s',而不是‘ss'之外。如果你的應用能夠接受這些,那么應該使用 utf8_general_ci,因為它速度快。否則,使用utf8_unicode_ci,因為它比較準確。
用一句話概況上面這段話:utf8_unicode_ci比較準確,utf8_general_ci速度比較快。通常情況下 utf8_general_ci的準確性就夠我們用的了,在我看過很多程序源碼后,發(fā)現(xiàn)它們大多數(shù)也用的是utf8_general_ci,所以新建數(shù)據(jù) 庫時一般選用utf8_general_ci就可以了
四、如何在MySQL5.0中使用UTF8
在 my.cnf中增加下列參數(shù)
[mysqld] init_connect='SET NAMES utf8′ default-character-set=utf8 default-collation = utf8_general_ci
執(zhí)行查詢 mysql> show variables; 相關(guān)如下:
character_set_client | utf8 character_set_connection | utf8 character_set_database | utf8 character_set_results | utf8 character_set_server | utf8 character_set_system | utf8
collation_connection | utf8_general_ci collation_database | utf8_general_ci collation_server | utf8_general_ci
個人見解,對于數(shù)據(jù)庫的使用,utf8 - general 已經(jīng)足夠的準確,并且相較與 utf8 - unicode速度上有優(yōu)勢,固可放心采用之
附1:舊數(shù)據(jù)升級辦法
以原來的字符集為latin1為例,升級成為utf8的字符集。原來的表: old_table (default charset=latin1),新表:new_table(default charset=utf8)。
第一步:導出舊數(shù)據(jù)
mysqldump --default-character-set=latin1 -hlocalhost -uroot -B my_db --tables old_table > old.sql
第二步:轉(zhuǎn)換編碼(類似unix/linux環(huán)境下)
iconv -t utf-8 -f gb2312 -c old.sql > new.sql
或者可以去掉 -f 參數(shù),讓iconv自動判斷原來的字符集
iconv -t utf-8 -c old.sql > new.sql
在這里,假定原來的數(shù)據(jù)默認是gb2312編碼。
第三步:導入
修改old.sql,在插入/更新語句開始之前,增加一條sql語句: "SET NAMES utf8;",保存。
mysql -hlocalhost -uroot my_db < new.sql
大功告成?。?/p>
附2:支持查看utf8字符集的MySQL客戶端有
1.) MySQL-Front,據(jù)說這個項目已經(jīng)被MySQL AB勒令停止了,不知為何,如果國內(nèi)還有不少破解版可以下載(不代表我推薦使用破解版 :-P)。
2.) Navicat,另一款非常不錯的MySQL客戶端,漢化版剛出來,還邀請我試用過,總的來說還是不錯的,不過也需要付費。
3.) PhpMyAdmin,開源的php項目,非常好。
4.) Linux下的終端工具(Linux terminal),把終端的字符集設置為utf8,連接到MySQL之后,執(zhí)行 SET NAMES UTF8; 也能讀寫utf8數(shù)據(jù)了。
看了以上關(guān)于Mysql中utf8_general_ci與utf8_unicode_ci有什么本質(zhì)上的區(qū)別詳細內(nèi)容,是否有所收獲。如果想要了解更多相關(guān),可以繼續(xù)關(guān)注我們的行業(yè)資訊板塊。
本文題目:Mysql中utf8_general_ci與utf8_unicode_ci有什么本質(zhì)上的區(qū)別
URL鏈接:http://jinyejixie.com/article10/gdpedo.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站建設、軟件開發(fā)、電子商務、虛擬主機、網(wǎng)站營銷、網(wǎng)站設計公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)