2021-02-05 分類: 網(wǎng)站建設(shè)
今天,探討一個(gè)有趣的話題:MySQL 單表數(shù)據(jù)達(dá)到多少時(shí)才需要考慮分庫分表?有人說 2000 萬行,也有人說 500 萬行。那么,你覺得這個(gè)數(shù)值多少才合適呢?
曾經(jīng)在中國互聯(lián)網(wǎng)技術(shù)圈廣為流傳著這么一個(gè)說法:MySQL 單表數(shù)據(jù)量大于 2000 萬行,性能會明顯下降。事實(shí)上,這個(gè)傳聞?chuàng)f最早起源于百度。具體情況大概是這樣的,當(dāng)年的 DBA 測試 MySQL性能時(shí)發(fā)現(xiàn),當(dāng)單表的量在 2000 萬行量級的時(shí)候,SQL 操作的性能急劇下降,因此,結(jié)論由此而來。然后又據(jù)說百度的工程師流動到業(yè)界的其它公司,也帶去了這個(gè)信息,所以,就在業(yè)界流傳開這么一個(gè)說法。
再后來,阿里巴巴《Java 開發(fā)手冊》提出單表行數(shù)超過 500 萬行或者單表容量超過 2GB,才推薦進(jìn)行分庫分表。對此,有阿里的黃金鐵律支撐,所以,很多人設(shè)計(jì)大數(shù)據(jù)存儲時(shí),多會以此為標(biāo)準(zhǔn),進(jìn)行分表操作。
那么,你覺得這個(gè)數(shù)值多少才合適呢?為什么不是 300 萬行,或者是 800 萬行,而是 500 萬行?也許你會說這個(gè)可能就是阿里的好實(shí)戰(zhàn)的數(shù)值吧?那么,問題又來了,這個(gè)數(shù)值是如何評估出來的呢?稍等片刻,請你小小思考一會兒。
事實(shí)上,這個(gè)數(shù)值和實(shí)際記錄的條數(shù)無關(guān),而與 MySQL 的配置以及機(jī)器的硬件有關(guān)。因?yàn)椋琈ySQL 為了提高性能,會將表的索引裝載到內(nèi)存中。InnoDB buffer size 足夠的情況下,其能完成全加載進(jìn)內(nèi)存,查詢不會有問題。但是,當(dāng)單表數(shù)據(jù)庫到達(dá)某個(gè)量級的上限時(shí),導(dǎo)致內(nèi)存無法存儲其索引,使得之后的 SQL 查詢會產(chǎn)生磁盤 IO,從而導(dǎo)致性能下降。當(dāng)然,這個(gè)還有具體的表結(jié)構(gòu)的設(shè)計(jì)有關(guān),最終導(dǎo)致的問題都是內(nèi)存限制。這里,增加硬件配置,可能會帶來立竿見影的性能提升哈。
那么,我對于分庫分表的觀點(diǎn)是,需要結(jié)合實(shí)際需求,不宜過度設(shè)計(jì),在項(xiàng)目一開始不采用分庫與分表設(shè)計(jì),而是隨著業(yè)務(wù)的增長,在無法繼續(xù)優(yōu)化的情況下,再考慮分庫與分表提高系統(tǒng)的性能。對此,阿里巴巴《Java 開發(fā)手冊》補(bǔ)充到:如果預(yù)計(jì)三年后的數(shù)據(jù)量根本達(dá)不到這個(gè)級別,請不要在創(chuàng)建表時(shí)就分庫分表。那么,回到一開始的問題,你覺得這個(gè)數(shù)值多少才合適呢?我的建議是,根據(jù)自身的機(jī)器的情況綜合評估,如果心里沒有標(biāo)準(zhǔn),那么暫時(shí)以 500 萬行作為一個(gè)統(tǒng)一的標(biāo)準(zhǔn),相對而言算是一個(gè)比較折中的數(shù)值。
標(biāo)題名稱:MySQL單表數(shù)據(jù)量超過2000萬性能急劇下降的說法靠譜?
文章位置:http://jinyejixie.com/news/99337.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供Google、做網(wǎng)站、面包屑導(dǎo)航、網(wǎng)站策劃、ChatGPT、域名注冊
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容