php數(shù)據(jù)庫物理設(shè)計(jì) PHP數(shù)據(jù)庫設(shè)計(jì)

php怎么處理高并發(fā)

以下內(nèi)容轉(zhuǎn)載自徐漢彬大牛的博客?億級Web系統(tǒng)搭建——單機(jī)到分布式集群?

創(chuàng)新互聯(lián)建站專注于太和企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè),商城系統(tǒng)網(wǎng)站開發(fā)。太和網(wǎng)站建設(shè)公司,為太和等地區(qū)提供建站服務(wù)。全流程按需設(shè)計(jì)網(wǎng)站，專業(yè)設(shè)計(jì)，全程項(xiàng)目跟蹤，創(chuàng)新互聯(lián)建站專業(yè)和態(tài)度為您提供的服務(wù)

當(dāng)一個(gè)Web系統(tǒng)從日訪問量10萬逐步增長到1000萬，甚至超過1億的過程中，Web系統(tǒng)承受的壓力會(huì)越來越大，在這個(gè)過程中，我們會(huì)遇到很多的問題。為了解決這些性能壓力帶來問題，我們需要在Web系統(tǒng)架構(gòu)層面搭建多個(gè)層次的緩存機(jī)制。在不同的壓力階段，我們會(huì)遇到不同的問題，通過搭建不同的服務(wù)和架構(gòu)來解決。

Web負(fù)載均衡?

Web負(fù)載均衡（Load Balancing），簡單地說就是給我們的服務(wù)器集群分配“工作任務(wù)”，而采用恰當(dāng)?shù)姆峙浞绞?，對于保護(hù)處于后端的Web服務(wù)器來說，非常重要。

負(fù)載均衡的策略有很多，我們從簡單的講起哈。

1.?HTTP重定向

當(dāng)用戶發(fā)來請求的時(shí)候，Web服務(wù)器通過修改HTTP響應(yīng)頭中的Location標(biāo)記來返回一個(gè)新的url，然后瀏覽器再繼續(xù)請求這個(gè)新url，實(shí)際上就是頁面重定向。通過重定向，來達(dá)到“負(fù)載均衡”的目標(biāo)。例如，我們在下載PHP源碼包的時(shí)候，點(diǎn)擊下載鏈接時(shí)，為了解決不同國家和地域下載速度的問題，它會(huì)返回一個(gè)離我們近的下載地址。重定向的HTTP返回碼是302

這個(gè)重定向非常容易實(shí)現(xiàn)，并且可以自定義各種策略。但是，它在大規(guī)模訪問量下，性能不佳。而且，給用戶的體驗(yàn)也不好，實(shí)際請求發(fā)生重定向，增加了網(wǎng)絡(luò)延時(shí)。

2. 反向代理負(fù)載均衡

反向代理服務(wù)的核心工作主要是轉(zhuǎn)發(fā)HTTP請求，扮演了瀏覽器端和后臺(tái)Web服務(wù)器中轉(zhuǎn)的角色。因?yàn)樗ぷ髟贖TTP層（應(yīng)用層），也就是網(wǎng)絡(luò)七層結(jié)構(gòu)中的第七層，因此也被稱為“七層負(fù)載均衡”?？梢宰龇聪虼淼能浖芏?，比較常見的一種是Nginx。

Nginx是一種非常靈活的反向代理軟件，可以自由定制化轉(zhuǎn)發(fā)策略，分配服務(wù)器流量的權(quán)重等。反向代理中，常見的一個(gè)問題，就是Web服務(wù)器存儲(chǔ)的session數(shù)據(jù)，因?yàn)橐话阖?fù)載均衡的策略都是隨機(jī)分配請求的。同一個(gè)登錄用戶的請求，無法保證一定分配到相同的Web機(jī)器上，會(huì)導(dǎo)致無法找到session的問題。

解決方案主要有兩種：

1.?配置反向代理的轉(zhuǎn)發(fā)規(guī)則，讓同一個(gè)用戶的請求一定落到同一臺(tái)機(jī)器上（通過分析cookie），復(fù)雜的轉(zhuǎn)發(fā)規(guī)則將會(huì)消耗更多的CPU，也增加了代理服務(wù)器的負(fù)擔(dān)。

2.?將session這類的信息，專門用某個(gè)獨(dú)立服務(wù)來存儲(chǔ)，例如redis/memchache，這個(gè)方案是比較推薦的。

反向代理服務(wù)，也是可以開啟緩存的，如果開啟了，會(huì)增加反向代理的負(fù)擔(dān)，需要謹(jǐn)慎使用。這種負(fù)載均衡策略實(shí)現(xiàn)和部署非常簡單，而且性能表現(xiàn)也比較好。但是，它有“單點(diǎn)故障”的問題，如果掛了，會(huì)帶來很多的麻煩。而且，到了后期Web服務(wù)器繼續(xù)增加，它本身可能成為系統(tǒng)的瓶頸。

3. IP負(fù)載均衡

IP負(fù)載均衡服務(wù)是工作在網(wǎng)絡(luò)層（修改IP）和傳輸層（修改端口，第四層），比起工作在應(yīng)用層（第七層）性能要高出非常多。原理是，他是對IP層的數(shù)據(jù)包的IP地址和端口信息進(jìn)行修改，達(dá)到負(fù)載均衡的目的。這種方式，也被稱為“四層負(fù)載均衡”。常見的負(fù)載均衡方式，是LVS（Linux Virtual Server，Linux虛擬服務(wù)），通過IPVS（IP Virtual Server，IP虛擬服務(wù)）來實(shí)現(xiàn)。

在負(fù)載均衡服務(wù)器收到客戶端的IP包的時(shí)候，會(huì)修改IP包的目標(biāo)IP地址或端口，然后原封不動(dòng)地投遞到內(nèi)部網(wǎng)絡(luò)中，數(shù)據(jù)包會(huì)流入到實(shí)際Web服務(wù)器。實(shí)際服務(wù)器處理完成后，又會(huì)將數(shù)據(jù)包投遞回給負(fù)載均衡服務(wù)器，它再修改目標(biāo)IP地址為用戶IP地址，最終回到客戶端。

上述的方式叫LVS-NAT，除此之外，還有LVS-RD（直接路由），LVS-TUN（IP隧道），三者之間都屬于LVS的方式，但是有一定的區(qū)別，篇幅問題，不贅敘。

IP負(fù)載均衡的性能要高出Nginx的反向代理很多，它只處理到傳輸層為止的數(shù)據(jù)包，并不做進(jìn)一步的組包，然后直接轉(zhuǎn)發(fā)給實(shí)際服務(wù)器。不過，它的配置和搭建比較復(fù)雜。

4. DNS負(fù)載均衡

DNS（Domain Name System）負(fù)責(zé)域名解析的服務(wù)，域名url實(shí)際上是服務(wù)器的別名，實(shí)際映射是一個(gè)IP地址，解析過程，就是DNS完成域名到IP的映射。而一個(gè)域名是可以配置成對應(yīng)多個(gè)IP的。因此，DNS也就可以作為負(fù)載均衡服務(wù)。

這種負(fù)載均衡策略，配置簡單，性能極佳。但是，不能自由定義規(guī)則，而且，變更被映射的IP或者機(jī)器故障時(shí)很麻煩，還存在DNS生效延遲的問題。?

5. DNS/GSLB負(fù)載均衡

我們常用的CDN（Content Delivery Network，內(nèi)容分發(fā)網(wǎng)絡(luò)）實(shí)現(xiàn)方式，其實(shí)就是在同一個(gè)域名映射為多IP的基礎(chǔ)上更進(jìn)一步，通過GSLB（Global Server Load Balance，全局負(fù)載均衡）按照指定規(guī)則映射域名的IP。一般情況下都是按照地理位置，將離用戶近的IP返回給用戶，減少網(wǎng)絡(luò)傳輸中的路由節(jié)點(diǎn)之間的跳躍消耗。

“向上尋找”，實(shí)際過程是LDNS（Local DNS）先向根域名服務(wù)（Root Name Server）獲取到頂級根的Name Server（例如.com的），然后得到指定域名的授權(quán)DNS，然后再獲得實(shí)際服務(wù)器IP。

CDN在Web系統(tǒng)中，一般情況下是用來解決大小較大的靜態(tài)資源（html/Js/Css/圖片等）的加載問題，讓這些比較依賴網(wǎng)絡(luò)下載的內(nèi)容，盡可能離用戶更近，提升用戶體驗(yàn)。

例如，我訪問了一張imgcache.gtimg.cn上的圖片（騰訊的自建CDN，不使用qq.com域名的原因是防止http請求的時(shí)候，帶上了多余的cookie信息），我獲得的IP是183.60.217.90。

這種方式，和前面的DNS負(fù)載均衡一樣，不僅性能極佳，而且支持配置多種策略。但是，搭建和維護(hù)成本非常高。互聯(lián)網(wǎng)一線公司，會(huì)自建CDN服務(wù)，中小型公司一般使用第三方提供的CDN。

Web系統(tǒng)的緩存機(jī)制的建立和優(yōu)化

剛剛我們講完了Web系統(tǒng)的外部網(wǎng)絡(luò)環(huán)境，現(xiàn)在我們開始關(guān)注我們Web系統(tǒng)自身的性能問題。我們的Web站點(diǎn)隨著訪問量的上升，會(huì)遇到很多的挑戰(zhàn)，解決這些問題不僅僅是擴(kuò)容機(jī)器這么簡單，建立和使用合適的緩存機(jī)制才是根本。

最開始，我們的Web系統(tǒng)架構(gòu)可能是這樣的，每個(gè)環(huán)節(jié)，都可能只有1臺(tái)機(jī)器。

我們從最根本的數(shù)據(jù)存儲(chǔ)開始看哈。

一、 MySQL數(shù)據(jù)庫內(nèi)部緩存使用

MySQL的緩存機(jī)制，就從先從MySQL內(nèi)部開始，下面的內(nèi)容將以最常見的InnoDB存儲(chǔ)引擎為主。

1. 建立恰當(dāng)?shù)乃饕?/p>

最簡單的是建立索引，索引在表數(shù)據(jù)比較大的時(shí)候，起到快速檢索數(shù)據(jù)的作用，但是成本也是有的。首先，占用了一定的磁盤空間，其中組合索引最突出，使用需要謹(jǐn)慎，它產(chǎn)生的索引甚至?xí)仍磾?shù)據(jù)更大。其次，建立索引之后的數(shù)據(jù)insert/update/delete等操作，因?yàn)樾枰略瓉淼乃饕?，耗時(shí)會(huì)增加。當(dāng)然，實(shí)際上我們的系統(tǒng)從總體來說，是以select查詢操作居多，因此，索引的使用仍然對系統(tǒng)性能有大幅提升的作用。

2. 數(shù)據(jù)庫連接線程池緩存

如果，每一個(gè)數(shù)據(jù)庫操作請求都需要?jiǎng)?chuàng)建和銷毀連接的話，對數(shù)據(jù)庫來說，無疑也是一種巨大的開銷。為了減少這類型的開銷，可以在MySQL中配置thread_cache_size來表示保留多少線程用于復(fù)用。線程不夠的時(shí)候，再創(chuàng)建，空閑過多的時(shí)候，則銷毀。

其實(shí)，還有更為激進(jìn)一點(diǎn)的做法，使用pconnect（數(shù)據(jù)庫長連接），線程一旦創(chuàng)建在很長時(shí)間內(nèi)都保持著。但是，在訪問量比較大，機(jī)器比較多的情況下，這種用法很可能會(huì)導(dǎo)致“數(shù)據(jù)庫連接數(shù)耗盡”，因?yàn)榻⑦B接并不回收，最終達(dá)到數(shù)據(jù)庫的max_connections（最大連接數(shù)）。因此，長連接的用法通常需要在CGI和MySQL之間實(shí)現(xiàn)一個(gè)“連接池”服務(wù)，控制CGI機(jī)器“盲目”創(chuàng)建連接數(shù)。

建立數(shù)據(jù)庫連接池服務(wù)，有很多實(shí)現(xiàn)的方式，PHP的話，我推薦使用swoole（PHP的一個(gè)網(wǎng)絡(luò)通訊拓展）來實(shí)現(xiàn)。

3. Innodb緩存設(shè)置（innodb_buffer_pool_size）

innodb_buffer_pool_size這是個(gè)用來保存索引和數(shù)據(jù)的內(nèi)存緩存區(qū)，如果機(jī)器是MySQL獨(dú)占的機(jī)器，一般推薦為機(jī)器物理內(nèi)存的80%。在取表數(shù)據(jù)的場景中，它可以減少磁盤IO。一般來說，這個(gè)值設(shè)置越大，cache命中率會(huì)越高。

4. 分庫/分表/分區(qū)。

MySQL數(shù)據(jù)庫表一般承受數(shù)據(jù)量在百萬級別，再往上增長，各項(xiàng)性能將會(huì)出現(xiàn)大幅度下降，因此，當(dāng)我們預(yù)見數(shù)據(jù)量會(huì)超過這個(gè)量級的時(shí)候，建議進(jìn)行分庫/分表/分區(qū)等操作。最好的做法，是服務(wù)在搭建之初就設(shè)計(jì)為分庫分表的存儲(chǔ)模式，從根本上杜絕中后期的風(fēng)險(xiǎn)。不過，會(huì)犧牲一些便利性，例如列表式的查詢，同時(shí)，也增加了維護(hù)的復(fù)雜度。不過，到了數(shù)據(jù)量千萬級別或者以上的時(shí)候，我們會(huì)發(fā)現(xiàn)，它們都是值得的。?

二、 MySQL數(shù)據(jù)庫多臺(tái)服務(wù)搭建

1臺(tái)MySQL機(jī)器，實(shí)際上是高風(fēng)險(xiǎn)的單點(diǎn)，因?yàn)槿绻鼟炝耍覀僕eb服務(wù)就不可用了。而且，隨著Web系統(tǒng)訪問量繼續(xù)增加，終于有一天，我們發(fā)現(xiàn)1臺(tái)MySQL服務(wù)器無法支撐下去，我們開始需要使用更多的MySQL機(jī)器。當(dāng)引入多臺(tái)MySQL機(jī)器的時(shí)候，很多新的問題又將產(chǎn)生。

1. 建立MySQL主從，從庫作為備份

這種做法純粹為了解決“單點(diǎn)故障”的問題，在主庫出故障的時(shí)候，切換到從庫。不過，這種做法實(shí)際上有點(diǎn)浪費(fèi)資源，因?yàn)閺膸鞂?shí)際上被閑著了。

2. MySQL讀寫分離，主庫寫，從庫讀。

兩臺(tái)數(shù)據(jù)庫做讀寫分離，主庫負(fù)責(zé)寫入類的操作，從庫負(fù)責(zé)讀的操作。并且，如果主庫發(fā)生故障，仍然不影響讀的操作，同時(shí)也可以將全部讀寫都臨時(shí)切換到從庫中（需要注意流量，可能會(huì)因?yàn)榱髁窟^大，把從庫也拖垮）。

3. 主主互備。

兩臺(tái)MySQL之間互為彼此的從庫，同時(shí)又是主庫。這種方案，既做到了訪問量的壓力分流，同時(shí)也解決了“單點(diǎn)故障”問題。任何一臺(tái)故障，都還有另外一套可供使用的服務(wù)。

不過，這種方案，只能用在兩臺(tái)機(jī)器的場景。如果業(yè)務(wù)拓展還是很快的話，可以選擇將業(yè)務(wù)分離，建立多個(gè)主主互備。

三、 MySQL數(shù)據(jù)庫機(jī)器之間的數(shù)據(jù)同步

每當(dāng)我們解決一個(gè)問題，新的問題必然誕生在舊的解決方案上。當(dāng)我們有多臺(tái)MySQL，在業(yè)務(wù)高峰期，很可能出現(xiàn)兩個(gè)庫之間的數(shù)據(jù)有延遲的場景。并且，網(wǎng)絡(luò)和機(jī)器負(fù)載等，也會(huì)影響數(shù)據(jù)同步的延遲。我們曾經(jīng)遇到過，在日訪問量接近1億的特殊場景下，出現(xiàn)，從庫數(shù)據(jù)需要很多天才能同步追上主庫的數(shù)據(jù)。這種場景下，從庫基本失去效用了。

于是，解決同步問題，就是我們下一步需要關(guān)注的點(diǎn)。

1. MySQL自帶多線程同步

MySQL5.6開始支持主庫和從庫數(shù)據(jù)同步，走多線程。但是，限制也是比較明顯的，只能以庫為單位。MySQL數(shù)據(jù)同步是通過binlog日志，主庫寫入到binlog日志的操作，是具有順序的，尤其當(dāng)SQL操作中含有對于表結(jié)構(gòu)的修改等操作，對于后續(xù)的SQL語句操作是有影響的。因此，從庫同步數(shù)據(jù)，必須走單進(jìn)程。

2. 自己實(shí)現(xiàn)解析binlog，多線程寫入。

以數(shù)據(jù)庫的表為單位，解析binlog多張表同時(shí)做數(shù)據(jù)同步。這樣做的話，的確能夠加快數(shù)據(jù)同步的效率，但是，如果表和表之間存在結(jié)構(gòu)關(guān)系或者數(shù)據(jù)依賴的話，則同樣存在寫入順序的問題。這種方式，可用于一些比較穩(wěn)定并且相對獨(dú)立的數(shù)據(jù)表。

國內(nèi)一線互聯(lián)網(wǎng)公司，大部分都是通過這種方式，來加快數(shù)據(jù)同步效率。還有更為激進(jìn)的做法，是直接解析binlog，忽略以表為單位，直接寫入。但是這種做法，實(shí)現(xiàn)復(fù)雜，使用范圍就更受到限制，只能用于一些場景特殊的數(shù)據(jù)庫中（沒有表結(jié)構(gòu)變更，表和表之間沒有數(shù)據(jù)依賴等特殊表）。?

四、在Web服務(wù)器和數(shù)據(jù)庫之間建立緩存

實(shí)際上，解決大訪問量的問題，不能僅僅著眼于數(shù)據(jù)庫層面。根據(jù)“二八定律”，80%的請求只關(guān)注在20%的熱點(diǎn)數(shù)據(jù)上。因此，我們應(yīng)該建立Web服務(wù)器和數(shù)據(jù)庫之間的緩存機(jī)制。這種機(jī)制，可以用磁盤作為緩存，也可以用內(nèi)存緩存的方式。通過它們，將大部分的熱點(diǎn)數(shù)據(jù)查詢，阻擋在數(shù)據(jù)庫之前。

1. 頁面靜態(tài)化

用戶訪問網(wǎng)站的某個(gè)頁面，頁面上的大部分內(nèi)容在很長一段時(shí)間內(nèi)，可能都是沒有變化的。例如一篇新聞報(bào)道，一旦發(fā)布幾乎是不會(huì)修改內(nèi)容的。這樣的話，通過CGI生成的靜態(tài)html頁面緩存到Web服務(wù)器的磁盤本地。除了第一次，是通過動(dòng)態(tài)CGI查詢數(shù)據(jù)庫獲取之外，之后都直接將本地磁盤文件返回給用戶。

在Web系統(tǒng)規(guī)模比較小的時(shí)候，這種做法看似完美。但是，一旦Web系統(tǒng)規(guī)模變大，例如當(dāng)我有100臺(tái)的Web服務(wù)器的時(shí)候。那樣這些磁盤文件，將會(huì)有100份，這個(gè)是資源浪費(fèi)，也不好維護(hù)。這個(gè)時(shí)候有人會(huì)想，可以集中一臺(tái)服務(wù)器存起來，呵呵，不如看看下面一種緩存方式吧，它就是這樣做的。

2. 單臺(tái)內(nèi)存緩存

通過頁面靜態(tài)化的例子中，我們可以知道將“緩存”搭建在Web機(jī)器本機(jī)是不好維護(hù)的，會(huì)帶來更多問題（實(shí)際上，通過PHP的apc拓展，可通過Key/value操作Web服務(wù)器的本機(jī)內(nèi)存）。因此，我們選擇搭建的內(nèi)存緩存服務(wù)，也必須是一個(gè)獨(dú)立的服務(wù)。

內(nèi)存緩存的選擇，主要有redis/memcache。從性能上說，兩者差別不大，從功能豐富程度上說，Redis更勝一籌。

3. 內(nèi)存緩存集群

當(dāng)我們搭建單臺(tái)內(nèi)存緩存完畢，我們又會(huì)面臨單點(diǎn)故障的問題，因此，我們必須將它變成一個(gè)集群。簡單的做法，是給他增加一個(gè)slave作為備份機(jī)器。但是，如果請求量真的很多，我們發(fā)現(xiàn)cache命中率不高，需要更多的機(jī)器內(nèi)存呢？因此，我們更建議將它配置成一個(gè)集群。例如，類似redis cluster。

Redis cluster集群內(nèi)的Redis互為多組主從，同時(shí)每個(gè)節(jié)點(diǎn)都可以接受請求，在拓展集群的時(shí)候比較方便。客戶端可以向任意一個(gè)節(jié)點(diǎn)發(fā)送請求，如果是它的“負(fù)責(zé)”的內(nèi)容，則直接返回內(nèi)容。否則，查找實(shí)際負(fù)責(zé)Redis節(jié)點(diǎn)，然后將地址告知客戶端，客戶端重新請求。

對于使用緩存服務(wù)的客戶端來說，這一切是透明的。

內(nèi)存緩存服務(wù)在切換的時(shí)候，是有一定風(fēng)險(xiǎn)的。從A集群切換到B集群的過程中，必須保證B集群提前做好“預(yù)熱”（B集群的內(nèi)存中的熱點(diǎn)數(shù)據(jù)，應(yīng)該盡量與A集群相同，否則，切換的一瞬間大量請求內(nèi)容，在B集群的內(nèi)存緩存中查找不到，流量直接沖擊后端的數(shù)據(jù)庫服務(wù)，很可能導(dǎo)致數(shù)據(jù)庫宕機(jī)）。

4. 減少數(shù)據(jù)庫“寫”

上面的機(jī)制，都實(shí)現(xiàn)減少數(shù)據(jù)庫的“讀”的操作，但是，寫的操作也是一個(gè)大的壓力。寫的操作，雖然無法減少，但是可以通過合并請求，來起到減輕壓力的效果。這個(gè)時(shí)候，我們就需要在內(nèi)存緩存集群和數(shù)據(jù)庫集群之間，建立一個(gè)修改同步機(jī)制。

先將修改請求生效在cache中，讓外界查詢顯示正常，然后將這些sql修改放入到一個(gè)隊(duì)列中存儲(chǔ)起來，隊(duì)列滿或者每隔一段時(shí)間，合并為一個(gè)請求到數(shù)據(jù)庫中更新數(shù)據(jù)庫。

除了上述通過改變系統(tǒng)架構(gòu)的方式提升寫的性能外，MySQL本身也可以通過配置參數(shù)innodb_flush_log_at_trx_commit來調(diào)整寫入磁盤的策略。如果機(jī)器成本允許，從硬件層面解決問題，可以選擇老一點(diǎn)的RAID（Redundant Arrays of independent Disks，磁盤列陣）或者比較新的SSD（Solid State Drives，固態(tài)硬盤）。

5. NoSQL存儲(chǔ)

不管數(shù)據(jù)庫的讀還是寫，當(dāng)流量再進(jìn)一步上漲，終會(huì)達(dá)到“人力有窮時(shí)”的場景。繼續(xù)加機(jī)器的成本比較高，并且不一定可以真正解決問題的時(shí)候。這個(gè)時(shí)候，部分核心數(shù)據(jù)，就可以考慮使用NoSQL的數(shù)據(jù)庫。NoSQL存儲(chǔ)，大部分都是采用key-value的方式，這里比較推薦使用上面介紹過Redis，Redis本身是一個(gè)內(nèi)存cache，同時(shí)也可以當(dāng)做一個(gè)存儲(chǔ)來使用，讓它直接將數(shù)據(jù)落地到磁盤。

這樣的話，我們就將數(shù)據(jù)庫中某些被頻繁讀寫的數(shù)據(jù)，分離出來，放在我們新搭建的Redis存儲(chǔ)集群中，又進(jìn)一步減輕原來MySQL數(shù)據(jù)庫的壓力，同時(shí)因?yàn)镽edis本身是個(gè)內(nèi)存級別的Cache，讀寫的性能都會(huì)大幅度提升。

國內(nèi)一線互聯(lián)網(wǎng)公司，架構(gòu)上采用的解決方案很多是類似于上述方案，不過，使用的cache服務(wù)卻不一定是Redis，他們會(huì)有更豐富的其他選擇，甚至根據(jù)自身業(yè)務(wù)特點(diǎn)開發(fā)出自己的NoSQL服務(wù)。

6. 空節(jié)點(diǎn)查詢問題

當(dāng)我們搭建完前面所說的全部服務(wù)，認(rèn)為Web系統(tǒng)已經(jīng)很強(qiáng)的時(shí)候。我們還是那句話，新的問題還是會(huì)來的?？展?jié)點(diǎn)查詢，是指那些數(shù)據(jù)庫中根本不存在的數(shù)據(jù)請求。例如，我請求查詢一個(gè)不存在人員信息，系統(tǒng)會(huì)從各級緩存逐級查找，最后查到到數(shù)據(jù)庫本身，然后才得出查找不到的結(jié)論，返回給前端。因?yàn)楦骷塩ache對它無效，這個(gè)請求是非常消耗系統(tǒng)資源的，而如果大量的空節(jié)點(diǎn)查詢，是可以沖擊到系統(tǒng)服務(wù)的。

在我曾經(jīng)的工作經(jīng)歷中，曾深受其害。因此，為了維護(hù)Web系統(tǒng)的穩(wěn)定性，設(shè)計(jì)適當(dāng)?shù)目展?jié)點(diǎn)過濾機(jī)制，非常有必要。

我們當(dāng)時(shí)采用的方式，就是設(shè)計(jì)一張簡單的記錄映射表。將存在的記錄存儲(chǔ)起來，放入到一臺(tái)內(nèi)存cache中，這樣的話，如果還有空節(jié)點(diǎn)查詢，則在緩存這一層就被阻擋了。

異地部署（地理分布式）

完成了上述架構(gòu)建設(shè)之后，我們的系統(tǒng)是否就已經(jīng)足夠強(qiáng)大了呢？答案當(dāng)然是否定的哈，優(yōu)化是無極限的。Web系統(tǒng)雖然表面上看，似乎比較強(qiáng)大了，但是給予用戶的體驗(yàn)卻不一定是最好的。因?yàn)闁|北的同學(xué)，訪問深圳的一個(gè)網(wǎng)站服務(wù)，他還是會(huì)感到一些網(wǎng)絡(luò)距離上的慢。這個(gè)時(shí)候，我們就需要做異地部署，讓W(xué)eb系統(tǒng)離用戶更近。

一、核心集中與節(jié)點(diǎn)分散

有玩過大型網(wǎng)游的同學(xué)都會(huì)知道，網(wǎng)游是有很多個(gè)區(qū)的，一般都是按照地域來分，例如廣東專區(qū)，北京專區(qū)。如果一個(gè)在廣東的玩家，去北京專區(qū)玩，那么他會(huì)感覺明顯比在廣東專區(qū)卡。實(shí)際上，這些大區(qū)的名稱就已經(jīng)說明了，它的服務(wù)器所在地，所以，廣東的玩家去連接地處北京的服務(wù)器，網(wǎng)絡(luò)當(dāng)然會(huì)比較慢。

當(dāng)一個(gè)系統(tǒng)和服務(wù)足夠大的時(shí)候，就必須開始考慮異地部署的問題了。讓你的服務(wù)，盡可能離用戶更近。我們前面已經(jīng)提到了Web的靜態(tài)資源，可以存放在CDN上，然后通過DNS/GSLB的方式，讓靜態(tài)資源的分散“全國各地”。但是，CDN只解決的靜態(tài)資源的問題，沒有解決后端龐大的系統(tǒng)服務(wù)還只集中在某個(gè)固定城市的問題。

這個(gè)時(shí)候，異地部署就開始了。異地部署一般遵循：核心集中，節(jié)點(diǎn)分散。

·?核心集中：實(shí)際部署過程中，總有一部分的數(shù)據(jù)和服務(wù)存在不可部署多套，或者部署多套成本巨大。而對于這些服務(wù)和數(shù)據(jù)，就仍然維持一套，而部署地點(diǎn)選擇一個(gè)地域比較中心的地方，通過網(wǎng)絡(luò)內(nèi)部專線來和各個(gè)節(jié)點(diǎn)通訊。

·?節(jié)點(diǎn)分散：將一些服務(wù)部署為多套，分布在各個(gè)城市節(jié)點(diǎn)，讓用戶請求盡可能選擇近的節(jié)點(diǎn)訪問服務(wù)。

例如，我們選擇在上海部署為核心節(jié)點(diǎn)，北京，深圳，武漢，上海為分散節(jié)點(diǎn)（上海自己本身也是一個(gè)分散節(jié)點(diǎn)）。我們的服務(wù)架構(gòu)如圖：

需要補(bǔ)充一下的是，上圖中上海節(jié)點(diǎn)和核心節(jié)點(diǎn)是同處于一個(gè)機(jī)房的，其他分散節(jié)點(diǎn)各自獨(dú)立機(jī)房。?

國內(nèi)有很多大型網(wǎng)游，都是大致遵循上述架構(gòu)。它們會(huì)把數(shù)據(jù)量不大的用戶核心賬號等放在核心節(jié)點(diǎn)，而大部分的網(wǎng)游數(shù)據(jù)，例如裝備、任務(wù)等數(shù)據(jù)和服務(wù)放在地區(qū)節(jié)點(diǎn)里。當(dāng)然，核心節(jié)點(diǎn)和地域節(jié)點(diǎn)之間，也有緩存機(jī)制。?

二、節(jié)點(diǎn)容災(zāi)和過載保護(hù)

節(jié)點(diǎn)容災(zāi)是指，某個(gè)節(jié)點(diǎn)如果發(fā)生故障時(shí)，我們需要建立一個(gè)機(jī)制去保證服務(wù)仍然可用。毫無疑問，這里比較常見的容災(zāi)方式，是切換到附近城市節(jié)點(diǎn)。假如系統(tǒng)的天津節(jié)點(diǎn)發(fā)生故障，那么我們就將網(wǎng)絡(luò)流量切換到附近的北京節(jié)點(diǎn)上?？紤]到負(fù)載均衡，可能需要同時(shí)將流量切換到附近的幾個(gè)地域節(jié)點(diǎn)。另一方面，核心節(jié)點(diǎn)自身也是需要自己做好容災(zāi)和備份的，核心節(jié)點(diǎn)一旦故障，就會(huì)影響全國服務(wù)。

過載保護(hù)，指的是一個(gè)節(jié)點(diǎn)已經(jīng)達(dá)到最大容量，無法繼續(xù)接接受更多請求了，系統(tǒng)必須有一個(gè)保護(hù)的機(jī)制。一個(gè)服務(wù)已經(jīng)滿負(fù)載，還繼續(xù)接受新的請求，結(jié)果很可能就是宕機(jī)，影響整個(gè)節(jié)點(diǎn)的服務(wù)，為了至少保障大部分用戶的正常使用，過載保護(hù)是必要的。

解決過載保護(hù)，一般2個(gè)方向：

·?拒絕服務(wù)，檢測到滿負(fù)載之后，就不再接受新的連接請求。例如網(wǎng)游登入中的排隊(duì)。

·?分流到其他節(jié)點(diǎn)。這種的話，系統(tǒng)實(shí)現(xiàn)更為復(fù)雜，又涉及到負(fù)載均衡的問題。

小結(jié)

Web系統(tǒng)會(huì)隨著訪問規(guī)模的增長，漸漸地從1臺(tái)服務(wù)器可以滿足需求，一直成長為“龐然大物”的大集群。而這個(gè)Web系統(tǒng)變大的過程，實(shí)際上就是我們解決問題的過程。在不同的階段，解決不同的問題，而新的問題又誕生在舊的解決方案之上。

系統(tǒng)的優(yōu)化是沒有極限的，軟件和系統(tǒng)架構(gòu)也一直在快速發(fā)展，新的方案解決了老的問題，同時(shí)也帶來新的挑戰(zhàn)。

想做個(gè) 網(wǎng)站，求一段PHP編程代碼,PHP的MYSQL緩存怎么實(shí)現(xiàn)？最好舉個(gè)例子。

　數(shù)據(jù)庫屬于 IO 密集型的應(yīng)用程序，其主要職責(zé)就是數(shù)據(jù)的管理及存儲(chǔ)工作。而我們知道，從內(nèi)存中讀取一個(gè)數(shù)據(jù)庫的時(shí)間是微秒級別，而從一塊普通硬盤上讀取一個(gè)IO是在毫秒級別，二者相差3個(gè)數(shù)量級。所以，要優(yōu)化數(shù)據(jù)庫，首先第一步需要優(yōu)化的就是 IO，盡可能將磁盤IO轉(zhuǎn)化為內(nèi)存IO。本文先從 MySQL 數(shù)據(jù)庫IO相關(guān)參數(shù)(緩存參數(shù))的角度來看看可以通過哪些參數(shù)進(jìn)行IO優(yōu)化：

?query_cache_size/query_cache_type (global)

Query cache 作用于整個(gè) MySQL Instance，主要用來緩存 MySQL 中的 ResultSet，也就是一條SQL語句執(zhí)行的結(jié)果集，所以僅僅只能針對select語句。當(dāng)我們打開了 Query Cache 功能，MySQL在接受到一條select語句的請求后，如果該語句滿足Query Cache的要求(未顯式說明不允許使用Query Cache，或者已經(jīng)顯式申明需要使用Query Cache)，MySQL 會(huì)直接根據(jù)預(yù)先設(shè)定好的HASH算法將接受到的select語句以字符串方式進(jìn)行hash，然后到Query Cache 中直接查找是否已經(jīng)緩存。也就是說，如果已經(jīng)在緩存中，該select請求就會(huì)直接將數(shù)據(jù)返回，從而省略了后面所有的步驟(如 SQL語句的解析，優(yōu)化器優(yōu)化以及向存儲(chǔ)引擎請求數(shù)據(jù)等)，極大的提高性能。

當(dāng)然，Query Cache 也有一個(gè)致命的缺陷，那就是當(dāng)某個(gè)表的數(shù)據(jù)有任何任何變化，都會(huì)導(dǎo)致所有引用了該表的select語句在Query Cache 中的緩存數(shù)據(jù)失效。所以，當(dāng)我們的數(shù)據(jù)變化非常頻繁的情況下，使用Query Cache 可能會(huì)得不償失。

Query Cache的使用需要多個(gè)參數(shù)配合，其中最為關(guān)鍵的是 query_cache_size 和 query_cache_type ，前者設(shè)置用于緩存 ResultSet 的內(nèi)存大小，后者設(shè)置在何場景下使用 Query Cache。在以往的經(jīng)驗(yàn)來看，如果不是用來緩存基本不變的數(shù)據(jù)的MySQL數(shù)據(jù)庫，query_cache_size 一般 256MB 是一個(gè)比較合適的大小。當(dāng)然，這可以通過計(jì)算Query Cache的命中率(Qcache_hits/(Qcache_hits+Qcache_inserts)*100))來進(jìn)行調(diào)整。query_cache_type可以設(shè)置為0(OFF)，1(ON)或者2(DEMOND)，分別表示完全不使用query cache，除顯式要求不使用query cache(使用sql_no_cache)之外的所有的select都使用query cache，只有顯示要求才使用query cache(使用sql_cache)。

?binlog_cache_size (global)

Binlog Cache 用于在打開了二進(jìn)制日志(binlog)記錄功能的環(huán)境，是 MySQL 用來提高binlog的記錄效率而設(shè)計(jì)的一個(gè)用于短時(shí)間內(nèi)臨時(shí)緩存binlog數(shù)據(jù)的內(nèi)存區(qū)域。

一般來說，如果我們的數(shù)據(jù)庫中沒有什么大事務(wù)，寫入也不是特別頻繁，2MB～4MB是一個(gè)合適的選擇。但是如果我們的數(shù)據(jù)庫大事務(wù)較多，寫入量比較大，可與適當(dāng)調(diào)高binlog_cache_size。同時(shí)，我們可以通過binlog_cache_use 以及 binlog_cache_disk_use來分析設(shè)置的binlog_cache_size是否足夠，是否有大量的binlog_cache由于內(nèi)存大小不夠而使用臨時(shí)文件(binlog_cache_disk_use)來緩存了。

?key_buffer_size (global)

Key Buffer 可能是大家最為熟悉的一個(gè) MySQL 緩存參數(shù)了，尤其是在 MySQL 沒有更換默認(rèn)存儲(chǔ)引擎的時(shí)候，很多朋友可能會(huì)發(fā)現(xiàn)，默認(rèn)的 MySQL 配置文件中設(shè)置最大的一個(gè)內(nèi)存參數(shù)就是這個(gè)參數(shù)了。key_buffer_size 參數(shù)用來設(shè)置用于緩存 MyISAM存儲(chǔ)引擎中索引文件的內(nèi)存區(qū)域大小。如果我們有足夠的內(nèi)存，這個(gè)緩存區(qū)域最好是能夠存放下我們所有的 MyISAM 引擎表的所有索引，以盡可能提高性能。

此外，當(dāng)我們在使用MyISAM 存儲(chǔ)的時(shí)候有一個(gè)及其重要的點(diǎn)需要注意，由于 MyISAM 引擎的特性限制了他僅僅只會(huì)緩存索引塊到內(nèi)存中，而不會(huì)緩存表數(shù)據(jù)庫塊。所以，我們的 SQL 一定要盡可能讓過濾條件都在索引中，以便讓緩存幫助我們提高查詢效率。

?bulk_insert_buffer_size (thread)

和key_buffer_size一樣，這個(gè)參數(shù)同樣也僅作用于使用 MyISAM存儲(chǔ)引擎，用來緩存批量插入數(shù)據(jù)的時(shí)候臨時(shí)緩存寫入數(shù)據(jù)。當(dāng)我們使用如下幾種數(shù)據(jù)寫入語句的時(shí)候，會(huì)使用這個(gè)內(nèi)存區(qū)域來緩存批量結(jié)構(gòu)的數(shù)據(jù)以幫助批量寫入數(shù)據(jù)文件：

insert … select …

insert … values (…) ,(…),(…)…

load data infile… into… (非空表)

?innodb_buffer_pool_size(global)

當(dāng)我們使用InnoDB存儲(chǔ)引擎的時(shí)候，innodb_buffer_pool_size 參數(shù)可能是影響我們性能的最為關(guān)鍵的一個(gè)參數(shù)了，他用來設(shè)置用于緩存 InnoDB 索引及數(shù)據(jù)塊的內(nèi)存區(qū)域大小，類似于 MyISAM 存儲(chǔ)引擎的 key_buffer_size 參數(shù)，當(dāng)然，可能更像是 Oracle 的 db_cache_size。簡單來說，當(dāng)我們操作一個(gè) InnoDB 表的時(shí)候，返回的所有數(shù)據(jù)或者去數(shù)據(jù)過程中用到的任何一個(gè)索引塊，都會(huì)在這個(gè)內(nèi)存區(qū)域中走一遭。

和key_buffer_size 對于 MyISAM 引擎一樣，innodb_buffer_pool_size 設(shè)置了 InnoDB 存儲(chǔ)引擎需求最大的一塊內(nèi)存區(qū)域的大小，直接關(guān)系到 InnoDB存儲(chǔ)引擎的性能，所以如果我們有足夠的內(nèi)存，盡可將該參數(shù)設(shè)置到足夠打，將盡可能多的 InnoDB 的索引及數(shù)據(jù)都放入到該緩存區(qū)域中，直至全部。

我們可以通過 (Innodb_buffer_pool_read_requests – Innodb_buffer_pool_reads) / Innodb_buffer_pool_read_requests * 100% 計(jì)算緩存命中率，并根據(jù)命中率來調(diào)整 innodb_buffer_pool_size 參數(shù)大小進(jìn)行優(yōu)化。

?innodb_additional_mem_pool_size(global)

這個(gè)參數(shù)我們平時(shí)調(diào)整的可能不是太多，很多人都使用了默認(rèn)值，可能很多人都不是太熟悉這個(gè)參數(shù)的作用。innodb_additional_mem_pool_size 設(shè)置了InnoDB存儲(chǔ)引擎用來存放數(shù)據(jù)字典信息以及一些內(nèi)部數(shù)據(jù)結(jié)構(gòu)的內(nèi)存空間大小，所以當(dāng)我們一個(gè)MySQL Instance中的數(shù)據(jù)庫對象非常多的時(shí)候，是需要適當(dāng)調(diào)整該參數(shù)的大小以確保所有數(shù)據(jù)都能存放在內(nèi)存中提高訪問效率的。

這個(gè)參數(shù)大小是否足夠還是比較容易知道的，因?yàn)楫?dāng)過小的時(shí)候，MySQL 會(huì)記錄 Warning 信息到數(shù)據(jù)庫的 error log 中，這時(shí)候你就知道該調(diào)整這個(gè)參數(shù)大小了。

?innodb_log_buffer_size (global)

這是 InnoDB 存儲(chǔ)引擎的事務(wù)日志所使用的緩沖區(qū)。類似于 Binlog Buffer，InnoDB 在寫事務(wù)日志的時(shí)候，為了提高性能，也是先將信息寫入 Innofb Log Buffer 中，當(dāng)滿足 innodb_flush_log_trx_commit 參數(shù)所設(shè)置的相應(yīng)條件(或者日志緩沖區(qū)寫滿)之后，才會(huì)將日志寫到文件(或者同步到磁盤)中。可以通過 innodb_log_buffer_size 參數(shù)設(shè)置其可以使用的最大內(nèi)存空間。

注：innodb_flush_log_trx_commit 參數(shù)對 InnoDB Log 的寫入性能有非常關(guān)鍵的影響。該參數(shù)可以設(shè)置為0，1，2，解釋如下：

0：log buffer中的數(shù)據(jù)將以每秒一次的頻率寫入到log file中，且同時(shí)會(huì)進(jìn)行文件系統(tǒng)到磁盤的同步操作，但是每個(gè)事務(wù)的commit并不會(huì)觸發(fā)任何log buffer 到log file的刷新或者文件系統(tǒng)到磁盤的刷新操作;

1：在每次事務(wù)提交的時(shí)候?qū)og buffer 中的數(shù)據(jù)都會(huì)寫入到log file，同時(shí)也會(huì)觸發(fā)文件系統(tǒng)到磁盤的同步;

2：事務(wù)提交會(huì)觸發(fā)log buffer 到log file的刷新，但并不會(huì)觸發(fā)磁盤文件系統(tǒng)到磁盤的同步。此外，每秒會(huì)有一次文件系統(tǒng)到磁盤同步操作。

此外，MySQL文檔中還提到，這幾種設(shè)置中的每秒同步一次的機(jī)制，可能并不會(huì)完全確保非常準(zhǔn)確的每秒就一定會(huì)發(fā)生同步，還取決于進(jìn)程調(diào)度的問題。實(shí)際上，InnoDB 能否真正滿足此參數(shù)所設(shè)置值代表的意義正常 Recovery 還是受到了不同 OS 下文件系統(tǒng)以及磁盤本身的限制，可能有些時(shí)候在并沒有真正完成磁盤同步的情況下也會(huì)告訴 mysqld 已經(jīng)完成了磁盤同步。

?innodb_max_dirty_pages_pct (global)

這個(gè)參數(shù)和上面的各個(gè)參數(shù)不同，他不是用來設(shè)置用于緩存某種數(shù)據(jù)的內(nèi)存大小的一個(gè)參數(shù)，而是用來控制在 InnoDB Buffer Pool 中可以不用寫入數(shù)據(jù)文件中的Dirty Page 的比例(已經(jīng)被修但還沒有從內(nèi)存中寫入到數(shù)據(jù)文件的臟數(shù)據(jù))。這個(gè)比例值越大，從內(nèi)存到磁盤的寫入操作就會(huì)相對減少，所以能夠一定程度下減少寫入操作的磁盤IO。

但是，如果這個(gè)比例值過大，當(dāng)數(shù)據(jù)庫 Crash 之后重啟的時(shí)間可能就會(huì)很長，因?yàn)闀?huì)有大量的事務(wù)數(shù)據(jù)需要從日志文件恢復(fù)出來寫入數(shù)據(jù)文件中。同時(shí)，過大的比例值同時(shí)可能也會(huì)造成在達(dá)到比例設(shè)定上限后的 flush 操作“過猛”而導(dǎo)致性能波動(dòng)很大。

上面這幾個(gè)參數(shù)是 MySQL 中為了減少磁盤物理IO而設(shè)計(jì)的主要參數(shù)，對 MySQL 的性能起到了至關(guān)重要的作用。

廣州哪家PHP培訓(xùn)機(jī)構(gòu)好一點(diǎn)？

如果是為了求職的話，建議你還是需要一個(gè)大?；蛘弑究莆膽{，會(huì)對你以后的工作薪資很有幫助。然后其次就是技術(shù)了，如果是自學(xué)能力不強(qiáng)的話，建議去傳智之類的現(xiàn)場授課機(jī)構(gòu)，白天上課，晚上晚自習(xí)，老師壓著你學(xué)的那種。如果自學(xué)能力強(qiáng)，就直接在網(wǎng)上下載視頻自學(xué)吧，PHP說難很難，說簡單也很簡單。

PHP查詢結(jié)果如何對變量值進(jìn)行排序？比如說一個(gè)評分系統(tǒng)，對每個(gè)人員的每項(xiàng)評分相加后的總分再進(jìn)行排序！

數(shù)據(jù)庫設(shè)計(jì)方法、規(guī)范與技巧

一、數(shù)據(jù)庫設(shè)計(jì)過程

數(shù)據(jù)庫技術(shù)是信息資源管理最有效的手段。數(shù)據(jù)庫設(shè)計(jì)是指對于一個(gè)給定的應(yīng)用環(huán)境，構(gòu)造最優(yōu)的數(shù)據(jù)庫模式，建立數(shù)據(jù)庫及其應(yīng)用系統(tǒng)，有效存儲(chǔ)數(shù)據(jù)，滿足用戶信息要求和處理要求。

數(shù)據(jù)庫設(shè)計(jì)中需求分析階段綜合各個(gè)用戶的應(yīng)用需求（現(xiàn)實(shí)世界的需求），在概念設(shè)計(jì)階段形成獨(dú)立于機(jī)器特點(diǎn)、獨(dú)立于各個(gè)DBMS產(chǎn)品的概念模式（信息世界模型），用E-R圖來描述。在邏輯設(shè)計(jì)階段將E-R圖轉(zhuǎn)換成具體的數(shù)據(jù)庫產(chǎn)品支持的數(shù)據(jù)模型如關(guān)系模型，形成數(shù)據(jù)庫邏輯模式。然后根據(jù)用戶處理的要求，安全性的考慮，在基本表的基礎(chǔ)上再建立必要的視圖（VIEW）形成數(shù)據(jù)的外模式。在物理設(shè)計(jì)階段根據(jù)DBMS特點(diǎn)和處理的需要，進(jìn)行物理存儲(chǔ)安排，設(shè)計(jì)索引，形成數(shù)據(jù)庫內(nèi)模式。

1. 需求分析階段

需求收集和分析，結(jié)果得到數(shù)據(jù)字典描述的數(shù)據(jù)需求（和數(shù)據(jù)流圖描述的處理需求）。

需求分析的重點(diǎn)是調(diào)查、收集與分析用戶在數(shù)據(jù)管理中的信息要求、處理要求、安全性與完整性要求。

需求分析的方法：調(diào)查組織機(jī)構(gòu)情況、調(diào)查各部門的業(yè)務(wù)活動(dòng)情況、協(xié)助用戶明確對新系統(tǒng)的各種要求、確定新系統(tǒng)的邊界。

常用的調(diào)查方法有：跟班作業(yè)、開調(diào)查會(huì)、請專人介紹、詢問、設(shè)計(jì)調(diào)查表請用戶填寫、查閱記錄。

分析和表達(dá)用戶需求的方法主要包括自頂向下和自底向上兩類方法。自頂向下的結(jié)構(gòu)化分析方法（Structured Analysis，簡稱SA方法）從最上層的系統(tǒng)組織機(jī)構(gòu)入手，采用逐層分解的方式分析系統(tǒng)，并把每一層用數(shù)據(jù)流圖和數(shù)據(jù)字典描述。

數(shù)據(jù)流圖表達(dá)了數(shù)據(jù)和處理過程的關(guān)系。系統(tǒng)中的數(shù)據(jù)則借助數(shù)據(jù)字典（Data Dictionary，簡稱DD）來描述。

數(shù)據(jù)字典是各類數(shù)據(jù)描述的集合，它是關(guān)于數(shù)據(jù)庫中數(shù)據(jù)的描述，即元數(shù)據(jù)，而不是數(shù)據(jù)本身。數(shù)據(jù)字典通常包括數(shù)據(jù)項(xiàng)、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)流、數(shù)據(jù)存儲(chǔ)和處理過程五個(gè)部分(至少應(yīng)該包含每個(gè)字段的數(shù)據(jù)類型和在每個(gè)表內(nèi)的主外鍵)。

數(shù)據(jù)項(xiàng)描述＝｛數(shù)據(jù)項(xiàng)名，數(shù)據(jù)項(xiàng)含義說明，別名，數(shù)據(jù)類型，長度，

取值范圍，取值含義，與其他數(shù)據(jù)項(xiàng)的邏輯關(guān)系｝

數(shù)據(jù)結(jié)構(gòu)描述＝｛數(shù)據(jù)結(jié)構(gòu)名，含義說明，組成:｛數(shù)據(jù)項(xiàng)或數(shù)據(jù)結(jié)構(gòu)｝｝

數(shù)據(jù)流描述＝｛數(shù)據(jù)流名，說明，數(shù)據(jù)流來源，數(shù)據(jù)流去向，

組成:｛數(shù)據(jù)結(jié)構(gòu)｝，平均流量，高峰期流量｝

數(shù)據(jù)存儲(chǔ)描述＝｛數(shù)據(jù)存儲(chǔ)名，說明，編號，流入的數(shù)據(jù)流，流出的數(shù)據(jù)流，

組成:｛數(shù)據(jù)結(jié)構(gòu)｝，數(shù)據(jù)量，存取方式｝

處理過程描述＝｛處理過程名，說明，輸入:｛數(shù)據(jù)流｝，輸出:｛數(shù)據(jù)流｝,

處理:｛簡要說明｝｝

2. 概念結(jié)構(gòu)設(shè)計(jì)階段

通過對用戶需求進(jìn)行綜合、歸納與抽象，形成一個(gè)獨(dú)立于具體DBMS的概念模型，可以用E-R圖表示。

概念模型用于信息世界的建模。概念模型不依賴于某一個(gè)DBMS支持的數(shù)據(jù)模型。概念模型可以轉(zhuǎn)換為計(jì)算機(jī)上某一DBMS支持的特定數(shù)據(jù)模型。

概念模型特點(diǎn)：

(1) 具有較強(qiáng)的語義表達(dá)能力，能夠方便、直接地表達(dá)應(yīng)用中的各種語義知識。

(2) 應(yīng)該簡單、清晰、易于用戶理解，是用戶與數(shù)據(jù)庫設(shè)計(jì)人員之間進(jìn)行交流的語言。

概念模型設(shè)計(jì)的一種常用方法為IDEF1X方法，它就是把實(shí)體-聯(lián)系方法應(yīng)用到語義數(shù)據(jù)模型中的一種語義模型化技術(shù)，用于建立系統(tǒng)信息模型。

使用IDEF1X方法創(chuàng)建E-R模型的步驟如下所示:

2.1 第零步——初始化工程

這個(gè)階段的任務(wù)是從目的描述和范圍描述開始，確定建模目標(biāo)，開發(fā)建模計(jì)劃，組織建模隊(duì)伍，收集源材料，制定約束和規(guī)范。收集源材料是這階段的重點(diǎn)。通過調(diào)查和觀察結(jié)果，業(yè)務(wù)流程，原有系統(tǒng)的輸入輸出，各種報(bào)表，收集原始數(shù)據(jù)，形成了基本數(shù)據(jù)資料表。

2.2 第一步——定義實(shí)體

實(shí)體集成員都有一個(gè)共同的特征和屬性集，可以從收集的源材料——基本數(shù)據(jù)資料表中直接或間接標(biāo)識出大部分實(shí)體。根據(jù)源材料名字表中表示物的術(shù)語以及具有“代碼”結(jié)尾的術(shù)語，如客戶代碼、代理商代碼、產(chǎn)品代碼等將其名詞部分代表的實(shí)體標(biāo)識出來，從而初步找出潛在的實(shí)體，形成初步實(shí)體表。

2.3 第二步——定義聯(lián)系

IDEF1X模型中只允許二元聯(lián)系，n元聯(lián)系必須定義為n個(gè)二元聯(lián)系。根據(jù)實(shí)際的業(yè)務(wù)需求和規(guī)則，使用實(shí)體聯(lián)系矩陣來標(biāo)識實(shí)體間的二元關(guān)系，然后根據(jù)實(shí)際情況確定出連接關(guān)系的勢、關(guān)系名和說明，確定關(guān)系類型，是標(biāo)識關(guān)系、非標(biāo)識關(guān)系（強(qiáng)制的或可選的）還是非確定關(guān)系、分類關(guān)系。如果子實(shí)體的每個(gè)實(shí)例都需要通過和父實(shí)體的關(guān)系來標(biāo)識，則為標(biāo)識關(guān)系，否則為非標(biāo)識關(guān)系。非標(biāo)識關(guān)系中，如果每個(gè)子實(shí)體的實(shí)例都與而且只與一個(gè)父實(shí)體關(guān)聯(lián)，則為強(qiáng)制的，否則為非強(qiáng)制的。如果父實(shí)體與子實(shí)體代表的是同一現(xiàn)實(shí)對象，那么它們?yōu)榉诸愱P(guān)系。

2.4 第三步——定義碼

通過引入交叉實(shí)體除去上一階段產(chǎn)生的非確定關(guān)系，然后從非交叉實(shí)體和獨(dú)立實(shí)體開始標(biāo)識侯選碼屬性，以便唯一識別每個(gè)實(shí)體的實(shí)例，再從侯選碼中確定主碼。為了確定主碼和關(guān)系的有效性，通過非空規(guī)則和非多值規(guī)則來保證，即一個(gè)實(shí)體實(shí)例的一個(gè)屬性不能是空值，也不能在同一個(gè)時(shí)刻有一個(gè)以上的值。找出誤認(rèn)的確定關(guān)系，將實(shí)體進(jìn)一步分解，最后構(gòu)造出IDEF1X模型的鍵基視圖（KB圖）。

2.5 第四步——定義屬性

從源數(shù)據(jù)表中抽取說明性的名詞開發(fā)出屬性表，確定屬性的所有者。定義非主碼屬性，檢查屬性的非空及非多值規(guī)則。此外，還要檢查完全依賴函數(shù)規(guī)則和非傳遞依賴規(guī)則，保證一個(gè)非主碼屬性必須依賴于主碼、整個(gè)主碼、僅僅是主碼。以此得到了至少符合關(guān)系理論第三范式的改進(jìn)的IDEF1X模型的全屬性視圖。

2.6 第五步——定義其他對象和規(guī)則

定義屬性的數(shù)據(jù)類型、長度、精度、非空、缺省值、約束規(guī)則等。定義觸發(fā)器、存儲(chǔ)過程、視圖、角色、同義詞、序列等對象信息。

3. 邏輯結(jié)構(gòu)設(shè)計(jì)階段

將概念結(jié)構(gòu)轉(zhuǎn)換為某個(gè)DBMS所支持的數(shù)據(jù)模型（例如關(guān)系模型），并對其進(jìn)行優(yōu)化。設(shè)計(jì)邏輯結(jié)構(gòu)應(yīng)該選擇最適于描述與表達(dá)相應(yīng)概念結(jié)構(gòu)的數(shù)據(jù)模型，然后選擇最合適的DBMS。

將E-R圖轉(zhuǎn)換為關(guān)系模型實(shí)際上就是要將實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系轉(zhuǎn)化為關(guān)系模式,這種轉(zhuǎn)換一般遵循如下原則：

1）一個(gè)實(shí)體型轉(zhuǎn)換為一個(gè)關(guān)系模式。實(shí)體的屬性就是關(guān)系的屬性。實(shí)體的碼就是關(guān)系的碼。

2）一個(gè)m:n聯(lián)系轉(zhuǎn)換為一個(gè)關(guān)系模式。與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性。而關(guān)系的碼為各實(shí)體碼的組合。

3）一個(gè)1:n聯(lián)系可以轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式，也可以與n端對應(yīng)的關(guān)系模式合并。如果轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式，則與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性，而關(guān)系的碼為n端實(shí)體的碼。

4）一個(gè)1:1聯(lián)系可以轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式，也可以與任意一端對應(yīng)的關(guān)系模式合并。

5）三個(gè)或三個(gè)以上實(shí)體間的一個(gè)多元聯(lián)系轉(zhuǎn)換為一個(gè)關(guān)系模式。與該多元聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性。而關(guān)系的碼為各實(shí)體碼的組合。

6）同一實(shí)體集的實(shí)體間的聯(lián)系，即自聯(lián)系，也可按上述1:1、1:n和m:n三種情況分別處理。

7）具有相同碼的關(guān)系模式可合并。

為了進(jìn)一步提高數(shù)據(jù)庫應(yīng)用系統(tǒng)的性能，通常以規(guī)范化理論為指導(dǎo)，還應(yīng)該適當(dāng)?shù)匦薷摹⒄{(diào)整數(shù)據(jù)模型的結(jié)構(gòu)，這就是數(shù)據(jù)模型的優(yōu)化。確定數(shù)據(jù)依賴。消除冗余的聯(lián)系。確定各關(guān)系模式分別屬于第幾范式。確定是否要對它們進(jìn)行合并或分解。一般來說將關(guān)系分解為3NF的標(biāo)準(zhǔn)，即：

表內(nèi)的每一個(gè)值都只能被表達(dá)一次。

??表內(nèi)的每一行都應(yīng)該被唯一的標(biāo)識（有唯一鍵）。

表內(nèi)不應(yīng)該存儲(chǔ)依賴于其他鍵的非鍵信息。

4. 數(shù)據(jù)庫物理設(shè)計(jì)階段

為邏輯數(shù)據(jù)模型選取一個(gè)最適合應(yīng)用環(huán)境的物理結(jié)構(gòu)（包括存儲(chǔ)結(jié)構(gòu)和存取方法）。根據(jù)DBMS特點(diǎn)和處理的需要，進(jìn)行物理存儲(chǔ)安排，設(shè)計(jì)索引，形成數(shù)據(jù)庫內(nèi)模式。

5. 數(shù)據(jù)庫實(shí)施階段

運(yùn)用DBMS提供的數(shù)據(jù)語言（例如SQL）及其宿主語言（例如C），根據(jù)邏輯設(shè)計(jì)和物理設(shè)計(jì)的結(jié)果建立數(shù)據(jù)庫，編制與調(diào)試應(yīng)用程序，組織數(shù)據(jù)入庫，并進(jìn)行試運(yùn)行。數(shù)據(jù)庫實(shí)施主要包括以下工作：用DDL定義數(shù)據(jù)庫結(jié)構(gòu)、組織數(shù)據(jù)入庫、編制與調(diào)試應(yīng)用程序、數(shù)據(jù)庫試運(yùn)行 6. 數(shù)據(jù)庫運(yùn)行和維護(hù)階段

數(shù)據(jù)庫應(yīng)用系統(tǒng)經(jīng)過試運(yùn)行后即可投入正式運(yùn)行。在數(shù)據(jù)庫系統(tǒng)運(yùn)行過程中必須不斷地對其進(jìn)行評價(jià)、調(diào)整與修改。包括：數(shù)據(jù)庫的轉(zhuǎn)儲(chǔ)和恢復(fù)、數(shù)據(jù)庫的安全性、完整性控制、數(shù)據(jù)庫性能的監(jiān)督、分析和改進(jìn)、數(shù)據(jù)庫的重組織和重構(gòu)造。

建模工具的使用

為加快數(shù)據(jù)庫設(shè)計(jì)速度，目前有很多數(shù)據(jù)庫輔助工具（CASE工具），如Rational公司的Rational Rose，CA公司的Erwin和Bpwin，Sybase公司的PowerDesigner以及Oracle公司的Oracle Designer等。

ERwin主要用來建立數(shù)據(jù)庫的概念模型和物理模型。它能用圖形化的方式，描述出實(shí)體、聯(lián)系及實(shí)體的屬性。ERwin支持IDEF1X方法。通過使用ERwin建模工具自動(dòng)生成、更改和分析IDEF1X模型，不僅能得到優(yōu)秀的業(yè)務(wù)功能和數(shù)據(jù)需求模型，而且可以實(shí)現(xiàn)從IDEF1X模型到數(shù)據(jù)庫物理設(shè)計(jì)的轉(zhuǎn)變。ERwin工具繪制的模型對應(yīng)于邏輯模型和物理模型兩種。在邏輯模型中，IDEF1X工具箱可以方便地用圖形化的方式構(gòu)建和繪制實(shí)體聯(lián)系及實(shí)體的屬性。在物理模型中，ERwin可以定義對應(yīng)的表、列，并可針對各種數(shù)據(jù)庫管理系統(tǒng)自動(dòng)轉(zhuǎn)換為適當(dāng)?shù)念愋汀?/p>

設(shè)計(jì)人員可根據(jù)需要選用相應(yīng)的數(shù)據(jù)庫設(shè)計(jì)建模工具。例如需求分析完成之后，設(shè)計(jì)人員可以使用Erwin畫ER圖，將ER圖轉(zhuǎn)換為關(guān)系數(shù)據(jù)模型，生成數(shù)據(jù)庫結(jié)構(gòu)；畫數(shù)據(jù)流圖，生成應(yīng)用程序。

二、數(shù)據(jù)庫設(shè)計(jì)技巧

1. 設(shè)計(jì)數(shù)據(jù)庫之前（需求分析階段）

1) 理解客戶需求，詢問用戶如何看待未來需求變化。讓客戶解釋其需求，而且隨著開發(fā)的繼續(xù)，還要經(jīng)常詢問客戶保證其需求仍然在開發(fā)的目的之中。

2) 了解企業(yè)業(yè)務(wù)可以在以后的開發(fā)階段節(jié)約大量的時(shí)間。

3) 重視輸入輸出。

在定義數(shù)據(jù)庫表和字段需求（輸入）時(shí)，首先應(yīng)檢查現(xiàn)有的或者已經(jīng)設(shè)計(jì)出的報(bào)表、查詢和視圖（輸出）以決定為了支持這些輸出哪些是必要的表和字段。

舉例：假如客戶需要一個(gè)報(bào)表按照郵政編碼排序、分段和求和，你要保證其中包括了單獨(dú)的郵政編碼字段而不要把郵政編碼糅進(jìn)地址字段里。

4) 創(chuàng)建數(shù)據(jù)字典和ER 圖表

ER 圖表和數(shù)據(jù)字典可以讓任何了解數(shù)據(jù)庫的人都明確如何從數(shù)據(jù)庫中獲得數(shù)據(jù)。ER圖對表明表之間關(guān)系很有用，而數(shù)據(jù)字典則說明了每個(gè)字段的用途以及任何可能存在的別名。對SQL 表達(dá)式的文檔化來說這是完全必要的。

5) 定義標(biāo)準(zhǔn)的對象命名規(guī)范

數(shù)據(jù)庫各種對象的命名必須規(guī)范。

2. 表和字段的設(shè)計(jì)（數(shù)據(jù)庫邏輯設(shè)計(jì)）

表設(shè)計(jì)原則

1) 標(biāo)準(zhǔn)化和規(guī)范化

數(shù)據(jù)的標(biāo)準(zhǔn)化有助于消除數(shù)據(jù)庫中的數(shù)據(jù)冗余。標(biāo)準(zhǔn)化有好幾種形式，但Third Normal Form（3NF）通常被認(rèn)為在性能、擴(kuò)展性和數(shù)據(jù)完整性方面達(dá)到了最好平衡。簡單來說，遵守3NF 標(biāo)準(zhǔn)的數(shù)據(jù)庫的表設(shè)計(jì)原則是：“One Fact in One Place”即某個(gè)表只包括其本身基本的屬性，當(dāng)不是它們本身所具有的屬性時(shí)需進(jìn)行分解。表之間的關(guān)系通過外鍵相連接。它具有以下特點(diǎn)：有一組表專門存放通過鍵連接起來的關(guān)聯(lián)數(shù)據(jù)。

舉例：某個(gè)存放客戶及其有關(guān)定單的3NF 數(shù)據(jù)庫就可能有兩個(gè)表：Customer 和Order。Order 表不包含定單關(guān)聯(lián)客戶的任何信息，但表內(nèi)會(huì)存放一個(gè)鍵值，該鍵指向Customer 表里包含該客戶信息的那一行。

事實(shí)上，為了效率的緣故，對表不進(jìn)行標(biāo)準(zhǔn)化有時(shí)也是必要的。

2) 數(shù)據(jù)驅(qū)動(dòng)

采用數(shù)據(jù)驅(qū)動(dòng)而非硬編碼的方式，許多策略變更和維護(hù)都會(huì)方便得多，大大增強(qiáng)系統(tǒng)的靈活性和擴(kuò)展性。

舉例，假如用戶界面要訪問外部數(shù)據(jù)源（文件、XML 文檔、其他數(shù)據(jù)庫等），不妨把相應(yīng)的連接和路徑信息存儲(chǔ)在用戶界面支持表里。還有，如果用戶界面執(zhí)行工作流之類的任務(wù)（發(fā)送郵件、打印信箋、修改記錄狀態(tài)等），那么產(chǎn)生工作流的數(shù)據(jù)也可以存放在數(shù)據(jù)庫里。角色權(quán)限管理也可以通過數(shù)據(jù)驅(qū)動(dòng)來完成。事實(shí)上，如果過程是數(shù)據(jù)驅(qū)動(dòng)的，你就可以把相當(dāng)大的責(zé)任推給用戶，由用戶來維護(hù)自己的工作流過程。

3) 考慮各種變化

在設(shè)計(jì)數(shù)據(jù)庫的時(shí)候考慮到哪些數(shù)據(jù)字段將來可能會(huì)發(fā)生變更。舉例，姓氏就是如此（注意是西方人的姓氏，比如女性結(jié)婚后從夫姓等）。所以，在建立系統(tǒng)存儲(chǔ)客戶信息時(shí)，在單獨(dú)的一個(gè)數(shù)據(jù)表里存儲(chǔ)姓氏字段，而且還附加起始日和終止日等字段，這樣就可以跟蹤這一數(shù)據(jù)條目的變化。

字段設(shè)計(jì)原則

4) 每個(gè)表中都應(yīng)該添加的3 個(gè)有用的字段

??dRecordCreationDate，在VB 下默認(rèn)是Now()，而在SQL Server 下默認(rèn)為GETDATE()

??sRecordCreator，在SQL Server 下默認(rèn)為NOT NULL DEFAULT USER

??nRecordVersion，記錄的版本標(biāo)記；有助于準(zhǔn)確說明記錄中出現(xiàn)null 數(shù)據(jù)或者丟失數(shù)據(jù)的原因

5) 對地址和電話采用多個(gè)字段

描述街道地址就短短一行記錄是不夠的。Address_Line1、Address_Line2 和Address_Line3 可以提供更大的靈活性。還有，電話號碼和郵件地址最好擁有自己的數(shù)據(jù)表，其間具有自身的類型和標(biāo)記類別。

6) 使用角色實(shí)體定義屬于某類別的列

在需要對屬于特定類別或者具有特定角色的事物做定義時(shí)，可以用角色實(shí)體來創(chuàng)建特定的時(shí)間關(guān)聯(lián)關(guān)系，從而可以實(shí)現(xiàn)自我文檔化。

舉例：用PERSON 實(shí)體和PERSON_TYPE 實(shí)體來描述人員。比方說，當(dāng)John Smith, Engineer 提升為John Smith, Director 乃至最后爬到John Smith, CIO 的高位，而所有你要做的不過是改變兩個(gè)表PERSON 和PERSON_TYPE 之間關(guān)系的鍵值，同時(shí)增加一個(gè)日期/時(shí)間字段來知道變化是何時(shí)發(fā)生的。這樣，你的PERSON_TYPE 表就包含了所有PERSON 的可能類型，比如Associate、Engineer、Director、CIO 或者CEO 等。還有個(gè)替代辦法就是改變PERSON 記錄來反映新頭銜的變化，不過這樣一來在時(shí)間上無法跟蹤個(gè)人所處位置的具體時(shí)間。

7) 選擇數(shù)字類型和文本類型盡量充足

在SQL 中使用smallint 和tinyint 類型要特別小心。比如，假如想看看月銷售總額，總額字段類型是smallint，那么，如果總額超過了$32,767 就不能進(jìn)行計(jì)算操作了。

而ID 類型的文本字段，比如客戶ID 或定單號等等都應(yīng)該設(shè)置得比一般想象更大。假設(shè)客戶ID 為10 位數(shù)長。那你應(yīng)該把數(shù)據(jù)庫表字段的長度設(shè)為12 或者13 個(gè)字符長。但這額外占據(jù)的空間卻無需將來重構(gòu)整個(gè)數(shù)據(jù)庫就可以實(shí)現(xiàn)數(shù)據(jù)庫規(guī)模的增長了。

8) 增加刪除標(biāo)記字段

在表中包含一個(gè)“刪除標(biāo)記”字段，這樣就可以把行標(biāo)記為刪除。在關(guān)系數(shù)據(jù)庫里不要單獨(dú)刪除某一行；最好采用清除數(shù)據(jù)程序而且要仔細(xì)維護(hù)索引整體性。

3. 選擇鍵和索引（數(shù)據(jù)庫邏輯設(shè)計(jì)）

鍵選擇原則：

1) 鍵設(shè)計(jì)4 原則

??為關(guān)聯(lián)字段創(chuàng)建外鍵。

??所有的鍵都必須唯一。

??避免使用復(fù)合鍵。

??外鍵總是關(guān)聯(lián)唯一的鍵字段。

2) 使用系統(tǒng)生成的主鍵

設(shè)計(jì)數(shù)據(jù)庫的時(shí)候采用系統(tǒng)生成的鍵作為主鍵，那么實(shí)際控制了數(shù)據(jù)庫的索引完整性。這樣，數(shù)據(jù)庫和非人工機(jī)制就有效地控制了對存儲(chǔ)數(shù)據(jù)中每一行的訪問。采用系統(tǒng)生成鍵作為主鍵還有一個(gè)優(yōu)點(diǎn)：當(dāng)擁有一致的鍵結(jié)構(gòu)時(shí)，找到邏輯缺陷很容易。

3) 不要用用戶的鍵(不讓主鍵具有可更新性)

在確定采用什么字段作為表的鍵的時(shí)候，可一定要小心用戶將要編輯的字段。通常的情況下不要選擇用戶可編輯的字段作為鍵。

4) 可選鍵有時(shí)可做主鍵

把可選鍵進(jìn)一步用做主鍵，可以擁有建立強(qiáng)大索引的能力。

索引使用原則：

索引是從數(shù)據(jù)庫中獲取數(shù)據(jù)的最高效方式之一。95%的數(shù)據(jù)庫性能問題都可以采用索引技術(shù)得到解決。

1) 邏輯主鍵使用唯一的成組索引，對系統(tǒng)鍵（作為存儲(chǔ)過程）采用唯一的非成組索引，對任何外鍵列采用非成組索引。考慮數(shù)據(jù)庫的空間有多大，表如何進(jìn)行訪問，還有這些訪問是否主要用作讀寫。

2) 大多數(shù)數(shù)據(jù)庫都索引自動(dòng)創(chuàng)建的主鍵字段，但是可別忘了索引外鍵，它們也是經(jīng)常使用的鍵，比如運(yùn)行查詢顯示主表和所有關(guān)聯(lián)表的某條記錄就用得上。

3) 不要索引memo/note 字段，不要索引大型字段（有很多字符），這樣作會(huì)讓索引占用太多的存儲(chǔ)空間。

4) 不要索引常用的小型表

不要為小型數(shù)據(jù)表設(shè)置任何鍵，假如它們經(jīng)常有插入和刪除操作就更別這樣作了。對這些插入和刪除操作的索引維護(hù)可能比掃描表空間消耗更多的時(shí)間。

4. 數(shù)據(jù)完整性設(shè)計(jì)（數(shù)據(jù)庫邏輯設(shè)計(jì)）

1) 完整性實(shí)現(xiàn)機(jī)制：

實(shí)體完整性：主鍵

參照完整性：

父表中刪除數(shù)據(jù)：級聯(lián)刪除；受限刪除；置空值

父表中插入數(shù)據(jù)：受限插入；遞歸插入

父表中更新數(shù)據(jù)：級聯(lián)更新；受限更新；置空值

DBMS對參照完整性可以有兩種方法實(shí)現(xiàn)：外鍵實(shí)現(xiàn)機(jī)制（約束規(guī)則）和觸發(fā)器實(shí)現(xiàn)機(jī)制

用戶定義完整性：

NOT NULL；CHECK；觸發(fā)器

2) 用約束而非商務(wù)規(guī)則強(qiáng)制數(shù)據(jù)完整性

采用數(shù)據(jù)庫系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)的完整性。這不但包括通過標(biāo)準(zhǔn)化實(shí)現(xiàn)的完整性而且還包括數(shù)據(jù)的功能性。在寫數(shù)據(jù)的時(shí)候還可以增加觸發(fā)器來保證數(shù)據(jù)的正確性。不要依賴于商務(wù)層保證數(shù)據(jù)完整性；它不能保證表之間（外鍵）的完整性所以不能強(qiáng)加于其他完整性規(guī)則之上。

3) 強(qiáng)制指示完整性

在有害數(shù)據(jù)進(jìn)入數(shù)據(jù)庫之前將其剔除。激活數(shù)據(jù)庫系統(tǒng)的指示完整性特性。這樣可以保持?jǐn)?shù)據(jù)的清潔而能迫使開發(fā)人員投入更多的時(shí)間處理錯(cuò)誤條件。

4) 使用查找控制數(shù)據(jù)完整性

控制數(shù)據(jù)完整性的最佳方式就是限制用戶的選擇。只要有可能都應(yīng)該提供給用戶一個(gè)清晰的價(jià)值列表供其選擇。這樣將減少鍵入代碼的錯(cuò)誤和誤解同時(shí)提供數(shù)據(jù)的一致性。某些公共數(shù)據(jù)特別適合查找：國家代碼、狀態(tài)代碼等。

5) 采用視圖

為了在數(shù)據(jù)庫和應(yīng)用程序代碼之間提供另一層抽象，可以為應(yīng)用程序建立專門的視圖而不必非要應(yīng)用程序直接訪問數(shù)據(jù)表。這樣做還等于在處理數(shù)據(jù)庫變更時(shí)給你提供了更多的自由。

5. 其他設(shè)計(jì)技巧

1) 避免使用觸發(fā)器

觸發(fā)器的功能通?？梢杂闷渌绞綄?shí)現(xiàn)。在調(diào)試程序時(shí)觸發(fā)器可能成為干擾。假如你確實(shí)需要采用觸發(fā)器，你最好集中對它文檔化。

2) 使用常用英語（或者其他任何語言）而不要使用編碼

在創(chuàng)建下拉菜單、列表、報(bào)表時(shí)最好按照英語名排序。假如需要編碼，可以在編碼旁附上用戶知道的英語。

3) 保存常用信息

讓一個(gè)表專門存放一般數(shù)據(jù)庫信息非常有用。在這個(gè)表里存放數(shù)據(jù)庫當(dāng)前版本、最近檢查/修復(fù)（對Access）、關(guān)聯(lián)設(shè)計(jì)文檔的名稱、客戶等信息。這樣可以實(shí)現(xiàn)一種簡單機(jī)制跟蹤數(shù)據(jù)庫，當(dāng)客戶抱怨他們的數(shù)據(jù)庫沒有達(dá)到希望的要求而與你聯(lián)系時(shí)，這樣做對非客戶機(jī)/服務(wù)器環(huán)境特別有用。

4) 包含版本機(jī)制

在數(shù)據(jù)庫中引入版本控制機(jī)制來確定使用中的數(shù)據(jù)庫的版本。時(shí)間一長，用戶的需求總是會(huì)改變的。最終可能會(huì)要求修改數(shù)據(jù)庫結(jié)構(gòu)。把版本信息直接存放到數(shù)據(jù)庫中更為方便。

5) 編制文檔

對所有的快捷方式、命名規(guī)范、限制和函數(shù)都要編制文檔。

采用給表、列、觸發(fā)器等加注釋的數(shù)據(jù)庫工具。對開發(fā)、支持和跟蹤修改非常有用。

對數(shù)據(jù)庫文檔化，或者在數(shù)據(jù)庫自身的內(nèi)部或者單獨(dú)建立文檔。這樣，當(dāng)過了一年多時(shí)間后再回過頭來做第2 個(gè)版本，犯錯(cuò)的機(jī)會(huì)將大大減少。

6) 測試、測試、反復(fù)測試

建立或者修訂數(shù)據(jù)庫之后，必須用用戶新輸入的數(shù)據(jù)測試數(shù)據(jù)字段。最重要的是，讓用戶進(jìn)行測試并且同用戶一道保證選擇的數(shù)據(jù)類型滿足商業(yè)要求。測試需要在把新數(shù)據(jù)庫投入實(shí)際服務(wù)之前完成。

7) 檢查設(shè)計(jì)

在開發(fā)期間檢查數(shù)據(jù)庫設(shè)計(jì)的常用技術(shù)是通過其所支持的應(yīng)用程序原型檢查數(shù)據(jù)庫。換句話說，針對每一種最終表達(dá)數(shù)據(jù)的原型應(yīng)用，保證你檢查了數(shù)據(jù)模型并且查看如何取出數(shù)據(jù)。

三、數(shù)據(jù)庫命名規(guī)范

1. 實(shí)體（表）的命名

1) 表以名詞或名詞短語命名，確定表名是采用復(fù)數(shù)還是單數(shù)形式，此外給表的別名定義簡單規(guī)則（比方說，如果表名是一個(gè)單詞，別名就取單詞的前4 個(gè)字母；如果表名是兩個(gè)單詞，就各取兩個(gè)單詞的前兩個(gè)字母組成4 個(gè)字母長的別名；如果表的名字由3 個(gè)單詞組成，從頭兩個(gè)單詞中各取一個(gè)然后從最后一個(gè)單詞中再取出兩個(gè)字母，結(jié)果還是組成4 字母長的別名，其余依次類推）

對工作用表來說，表名可以加上前綴WORK_ 后面附上采用該表的應(yīng)用程序的名字。在命名過程當(dāng)中，根據(jù)語義拼湊縮寫即可。注意，由于ORCLE會(huì)將字段名稱統(tǒng)一成大寫或者小寫中的一種，所以要求加上下劃線。

舉例：

定義的縮寫 Sales: Sal 銷售；

Order: Ord 訂單；

Detail: Dtl 明細(xì)；

則銷售訂單明細(xì)表命名為：Sal_Ord_Dtl;

2) 如果表或者是字段的名稱僅有一個(gè)單詞，那么建議不使用縮寫，而是用完整的單詞。

舉例：

定義的縮寫 Material Ma 物品；

物品表名為：Material, 而不是 Ma.

但是字段物品編碼則是：Ma_ID;而不是Material_ID

3) 所有的存儲(chǔ)值列表的表前面加上前綴Z

目的是將這些值列表類排序在數(shù)據(jù)庫最后。

4) 所有的冗余類的命名(主要是累計(jì)表)前面加上前綴X

冗余類是為了提高數(shù)據(jù)庫效率，非規(guī)范化數(shù)據(jù)庫的時(shí)候加入的字段或者表

5) 關(guān)聯(lián)類通過用下劃線連接兩個(gè)基本類之后，再加前綴R的方式命名,后面按照字母順序羅列兩個(gè)表名或者表名的縮寫。

關(guān)聯(lián)表用于保存多對多關(guān)系。

如果被關(guān)聯(lián)的表名大于10個(gè)字母，必須將原來的表名的進(jìn)行縮寫。如果沒有其他原因，建議都使用縮寫。

舉例：表Object與自身存在多對多的關(guān)系,則保存多對多關(guān)系的表命名為：R_Object；

表 Depart和Employee;存在多對多的關(guān)系；則關(guān)聯(lián)表命名為R_Dept_Emp

2. 屬性（列）的命名

1) 采用有意義的列名，表內(nèi)的列要針對鍵采用一整套設(shè)計(jì)規(guī)則。每一個(gè)表都將有一個(gè)自動(dòng)ID作為主健,邏輯上的主健作為第一組候選主健來定義,如果是數(shù)據(jù)庫自動(dòng)生成的編碼，統(tǒng)一命名為：ID;如果是自定義的邏輯上的編碼則用縮寫加“ID”的方法命名。如果鍵是數(shù)字類型，你可以用_NO 作為后綴；如果是字符類型則可以采用_CODE 后綴。對列名應(yīng)該采用標(biāo)準(zhǔn)的前綴和后綴。

舉例：銷售訂單的編號字段命名：Sal_Ord_ID；如果還存在一個(gè)數(shù)據(jù)庫生成的自動(dòng)編號，則命名為：ID。

2) 所有的屬性加上有關(guān)類型的后綴，注意，如果還需要其它的后綴，都放在類型后綴之前。

注: 數(shù)據(jù)類型是文本的字段，類型后綴TX可以不寫。有些類型比較明顯的字段，可以不寫類型后綴。

3) 采用前綴命名

給每個(gè)表的列名都采用統(tǒng)一的前綴，那么在編寫SQL表達(dá)式的時(shí)候會(huì)得到大大的簡化。這樣做也確實(shí)有缺點(diǎn)，比如破壞了自動(dòng)表連接工具的作用，后者把公共列名同某些數(shù)據(jù)庫聯(lián)系起來。

3. 視圖的命名

1) 視圖以V作為前綴，其他命名規(guī)則和表的命名類似；

2) 命名應(yīng)盡量體現(xiàn)各視圖的功能。

4. 觸發(fā)器的命名

觸發(fā)器以TR作為前綴，觸發(fā)器名為相應(yīng)的表名加上后綴，Insert觸發(fā)器加'_I'，Delete觸發(fā)器加'_D'，Update觸發(fā)器加'_U'，如：TR_Customer_I，TR_Customer_D，TR_Customer_U。

5. 存儲(chǔ)過程名

存儲(chǔ)過程應(yīng)以'UP_'開頭，和系統(tǒng)的存儲(chǔ)過程區(qū)分，后續(xù)部分主要以動(dòng)賓形式構(gòu)成，并用下劃線分割各個(gè)組成部分。如增加代理商的帳戶的存儲(chǔ)過程為'UP_Ins_Agent_Account'。

6. 變量名

變量名采用小寫，若屬于詞組形式，用下劃線分隔每個(gè)單詞，如@my_err_no。

7. 命名中其他注意事項(xiàng)

1) 以上命名都不得超過30個(gè)字符的系統(tǒng)限制。變量名的長度限制為29（不包括標(biāo)識字符@）。

2) 數(shù)據(jù)對象、變量的命名都采用英文字符，禁止使用中文命名。絕對不要在對象名的字符之間留空格。

3) 小心保留詞，要保證你的字段名沒有和保留詞、數(shù)據(jù)庫系統(tǒng)或者常用訪問方法沖突

5) 保持字段名和類型的一致性，在命名字段并為其指定數(shù)據(jù)類型的時(shí)候一定要保證一致性。假如數(shù)據(jù)類型在一個(gè)表里是整數(shù)，那在另一個(gè)表里可就別變成字符型了。

網(wǎng)頁名稱：php數(shù)據(jù)庫物理設(shè)計(jì) PHP數(shù)據(jù)庫設(shè)計(jì)
當(dāng)前鏈接：http://jinyejixie.com/article10/hehddo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供Google、動(dòng)態(tài)網(wǎng)站、微信公眾號、品牌網(wǎng)站制作、外貿(mào)建站、移動(dòng)網(wǎng)站建設(shè)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

php數(shù)據(jù)庫物理設(shè)計(jì) PHP數(shù)據(jù)庫設(shè)計(jì)

php怎么處理高并發(fā)

想做個(gè) 網(wǎng)站 ，求一段PHP編程代碼,PHP的MYSQL緩存怎么實(shí)現(xiàn)？ 最好舉個(gè)例子。

廣州哪家PHP培訓(xùn)機(jī)構(gòu)好一點(diǎn)？

PHP查詢結(jié)果如何對變量值進(jìn)行排序？比如說一個(gè)評分系統(tǒng)，對每個(gè)人員的每項(xiàng)評分相加后的總分再進(jìn)行排序！

想做個(gè) 網(wǎng)站，求一段PHP編程代碼,PHP的MYSQL緩存怎么實(shí)現(xiàn)？最好舉個(gè)例子。

廣州哪家PHP培訓(xùn)機(jī)構(gòu)好一點(diǎn)？

PHP查詢結(jié)果如何對變量值進(jìn)行排序？比如說一個(gè)評分系統(tǒng)，對每個(gè)人員的每項(xiàng)評分相加后的總分再進(jìn)行排序！