成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

nosql列族,nosql 列存儲

Apache Cassandra數(shù)據(jù)庫的優(yōu)缺點有哪些

Apache Cassandra數(shù)據(jù)庫的優(yōu)缺點有哪些?

10多年的鼎城網(wǎng)站建設經(jīng)驗,針對設計、前端、開發(fā)、售后、文案、推廣等六對一服務,響應快,48小時及時工作處理。營銷型網(wǎng)站建設的優(yōu)勢是能夠根據(jù)用戶設備顯示端的尺寸不同,自動調(diào)整鼎城建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設計,從而大程度地提升瀏覽體驗。創(chuàng)新互聯(lián)公司從事“鼎城網(wǎng)站設計”,“鼎城網(wǎng)站推廣”以來,每個客戶項目都認真落實執(zhí)行。

本文將超越眾所周知的一些細節(jié),探討與 Cassandra 相關的不太明顯的細節(jié)。您將檢查 Cassandra 數(shù)據(jù)模型、存儲模式設計、架構(gòu),以及與 Cassandra 相關的潛在驚喜。

在數(shù)據(jù)庫歷史文章 “What Goes Around Comes Around”中,Michal Stonebraker 詳細描述了存儲技術是如何隨著時間的推移而發(fā)展的。實現(xiàn)關系模型之前,開發(fā)人員曾嘗試過其他模型,比如層次圖和有向圖。值得注意的是,基于 SQL 的關系模型(即使到現(xiàn)在也仍然是事實上的標準)已經(jīng)盛行了大約 30 年。鑒于計算機科學的短暫歷史及其快速發(fā)展的步伐,這是一項非凡的成就。關系模型建立已久,以至于許多年來,解決方案架構(gòu)師很容易為應用程序選擇數(shù)據(jù)存儲。他們的選擇總是關系數(shù)據(jù)庫。

諸如增加系統(tǒng)、移動設備、擴展的用戶在線狀態(tài)、云計算和多核系統(tǒng)的用戶群之類的開發(fā)已經(jīng)導致產(chǎn)生越來越多的大型系統(tǒng)。Google 和 Amazon 之類的高科技公司都是首批觸及規(guī)模問題的公司。他們很快就發(fā)現(xiàn)關系數(shù)據(jù)庫并不足以支持大型系統(tǒng)。

為了避免這些挑戰(zhàn),Google 和 Amazon 提出了兩個可供選擇的解決方案:Big Table 和 Dynamo,他們可以由此放松關系數(shù)據(jù)模型提供的保證,從而實現(xiàn)更高的可擴展性。Eric Brewer 的 “CAP Theorem”后來官方化了這些觀察結(jié)果。它宣稱,對于可擴展性系統(tǒng),一致性、可用性和分區(qū)容錯性都是權(quán)衡因素,因為根本不可能構(gòu)建包含所有這些屬性的系統(tǒng)。不久之后,根據(jù) Google 和 Amazon 早期的工作,以及所獲得的對可擴展性系統(tǒng)的理解,計劃創(chuàng)建一種新的存儲系統(tǒng)。這些系統(tǒng)被命名為 “NoSQL” 系統(tǒng)。該名稱最初的意思是 “如果想縮放就不要使用 SQL”,后來被重新定義為 “不只是 SQL”,意思是說,除了基于 SQL 的解決方案外,還有其他的解決方案。

有許多 NoSQL 系統(tǒng),而且每一個系統(tǒng)都緩和或改變了關系模型的某些方面。值得注意的是,沒有一個 NoSQL 解決方案適用于所有的場景。每一個解決方案都優(yōu)于關系模型,且針對一些用例子集進行了縮放。我的早期文章 “在 Data Storage Haystack 中為您的應用程序?qū)ふ艺_的數(shù)據(jù)解決方案” 討論了如何使應用程序需求和 NoSQL 解決方案相匹配。

Apache Cassandra是其中一個最早也是最廣泛使用的 NoSQL 解決方案。本文詳細介紹了 Cassandra,并指出了一些首次使用 Cassandra 時不容易發(fā)現(xiàn)的細節(jié)和復雜之處。

Apache Cassandra

Cassandra 是一個 NoSQL 列族 (column family) 實現(xiàn),使用由 Amazon Dynamo 引入的架構(gòu)方面的特性來支持 Big Table 數(shù)據(jù)模型。Cassandra 的一些優(yōu)勢如下所示:

高度可擴展性和高度可用性,沒有單點故障

NoSQL 列族實現(xiàn)

非常高的寫入吞吐量和良好的讀取吞吐量

類似 SQL 的查詢語言(從 0.8 起),并通過二級索引支持搜索

可調(diào)節(jié)的一致性和對復制的支持

靈活的模式

這些優(yōu)點很容易讓人們推薦使用 Cassandra,但是,對于開發(fā)人員來說,至關重要的一點是要深入探究 Cassandra 的細節(jié)和復雜之處,從而掌握該程序的復雜性。

什么是列?

列 有點用詞不當,使用名稱單元格 很可能更容易理解一些。我會堅持使用列,因為這是一種習慣用法。

Cassandra 數(shù)據(jù)模型包括列、行、列族和密鑰空間 (keyspace)。讓我們逐一進行詳細介紹它們。

?列:Cassandra 數(shù)據(jù)模型中最基本的單元,每一個列包括一個名稱、一個值和一個時間戳。在本文的討論中,我們忽略了時間戳,您可以將一個列表示為一個名稱值對(例如 author="Asimov")。

?行:用一個名稱標記的列的集合。例如,清單 1 顯示了如何表示一個行:

清單 1. 行的示例

"Second Foundation"- {

author="Asimov",

publishedDate="..",

tag1="sci-fi", tag2="Asimov"

}

Cassandra 包括許多存儲節(jié)點,并且在單個存儲節(jié)點內(nèi)存儲每一個行。在每一行內(nèi),Cassandra 總是存儲按照列名稱排序的列。使用這種排序順序,Cassandra 支持切片查詢,在該查詢中,給定了一個行,用戶可以檢索屬于給定的列名稱范圍內(nèi)的列的子集。例如,范圍 tag0 到 tag9999 內(nèi)的切片查詢會獲得所有名稱范圍在 tag0 和 tag9999 內(nèi)的列。

?列族:用一個名稱標記的行的集合。清單 2 顯示了樣例數(shù)據(jù)的可能形式:

清單 2. 列族示例

Books-{

"Foundation"-{author="Asimov", publishedDate=".."},

"Second Foundation"-{author="Asimov", publishedDate=".."},

}

人們常說列族就像是關系模型中的一個表格。如下例所示,相似點將不復存在。

?密鑰空間:許多列族共同形成的一個組。它只是列族的一個邏輯組合,并為名稱提供獨立的范圍。

最后,超級列位于一個列族中,該列族對一個密鑰下的多個列進行分組。正如開發(fā)人員不贊成使用超級列一樣,在此,我對此也不作任何討論。

Cassandra 與 RDBMS 數(shù)據(jù)模型

根據(jù)以上對 Cassandra 數(shù)據(jù)模型的描述,數(shù)據(jù)被放入每一個列族的二維 (2D) 空間中。要想在列族中檢索數(shù)據(jù),用戶需要兩個密鑰:行名稱和列名稱。從這個意義上來說,盡管還存在多處至關重要的差異,關系模型和 Cassandra 仍然非常相似。

?關系列均勻分布在表中的所有行之間。數(shù)據(jù)項之間通常有明顯的縱向關系,但這種情況并不適用于 Cassandra 列。這就是 Cassandra 使用各個數(shù)據(jù)項(列)來存儲列名稱的原因。

?有了關系模型,2D 數(shù)據(jù)空間就完整了。2D 空間內(nèi)的每一個點至少應當擁有存儲在此處的 null 值。另外,這種情況不適用于 Cassandra,Cassandra 可以擁有只包括少數(shù)項的行,而其他行可以擁有數(shù)百萬個項。

?有了關系模型,就可以對模式進行預定義,而且在運行時不可以更改模式,而 Cassandra 允許用戶在運行時更改模式。

?Cassandra 始終存儲數(shù)據(jù),這樣就可以根據(jù)其名稱對列進行排序。這使得使用切片查詢在列中搜索數(shù)據(jù)變得很容易,但在行中搜索數(shù)據(jù)變得很困難,除非您使用的是保序分區(qū)程序。

?另一個重要差異是,RDMBS 中的列名稱表示與數(shù)據(jù)有關的元數(shù)據(jù),但絕不是數(shù)據(jù)。而在 Cassandra 中,列名稱可以包括數(shù)據(jù)。因此,Cassandra 行可以擁有數(shù)百萬個列,而關系模型通常只有數(shù)十個列。

?關系模型使用定義良好的不可變模式來支持復雜的查詢,這些查詢中包括 JOIN 和聚合等。使用關系模型,用戶無需擔心查詢就可定義數(shù)據(jù)模式。Cassandra 不支持 JOIN 和大多數(shù) SQL 搜索方法。因此,模式必須滿足應用程序的查詢要求。

nosql數(shù)據(jù)庫的幾大類型

1. 鍵值數(shù)據(jù)庫

相關產(chǎn)品:Redis、Riak、SimpleDB、Chordless、Scalaris、Memcached

應用:內(nèi)容緩存

優(yōu)點:擴展性好、靈活性好、大量寫操作時性能高

缺點:無法存儲結(jié)構(gòu)化信息、條件查詢效率較低

使用者:百度云(Redis)、GitHub(Riak)、BestBuy(Riak)、Twitter(Ridis和Memcached)

2. 列族數(shù)據(jù)庫

相關產(chǎn)品:BigTable、HBase、Cassandra、HadoopDB、GreenPlum、PNUTS

應用:分布式數(shù)據(jù)存儲與管理

優(yōu)點:查找速度快、可擴展性強、容易進行分布式擴展、復雜性低

使用者:Ebay(Cassandra)、Instagram(Cassandra)、NASA(Cassandra)、Facebook(HBase)

3. 文檔數(shù)據(jù)庫

相關產(chǎn)品:MongoDB、CouchDB、ThruDB、CloudKit、Perservere、Jackrabbit

應用:存儲、索引并管理面向文檔的數(shù)據(jù)或者類似的半結(jié)構(gòu)化數(shù)據(jù)

優(yōu)點:性能好、靈活性高、復雜性低、數(shù)據(jù)結(jié)構(gòu)靈活

缺點:缺乏統(tǒng)一的查詢語言

使用者:百度云數(shù)據(jù)庫(MongoDB)、SAP(MongoDB)

4. 圖形數(shù)據(jù)庫

圖形數(shù)據(jù)庫-使用圖作為數(shù)據(jù)模型來存儲數(shù)據(jù)。

相關產(chǎn)品:Neo4J、OrientDB、InfoGrid、GraphDB

應用:大量復雜、互連接、低結(jié)構(gòu)化的圖結(jié)構(gòu)場合,如社交網(wǎng)絡、推薦系統(tǒng)等

優(yōu)點:靈活性高、支持復雜的圖形算法、可用于構(gòu)建復雜的關系圖譜

缺點:復雜性高、只能支持一定的數(shù)據(jù)規(guī)模

使用者:Adobe(Neo4J)、Cisco(Neo4J)、T-Mobile(Neo4J)

有哪些nosql軟件能在windows平臺下運行

Membase Membase 是 NoSQL 家族的一個新的重量級的成員。Membase是開源項目,源代碼采用了Apache2.0的使用許可。該項目托管在GitHub.Source tarballs上,可以下載beta版本的Linux二進制包。該產(chǎn)品主要是由North Scale的memcached核心團隊成員開發(fā)完成,其中還包括Zynga和NHN這兩個主要貢獻者的工程師,這兩個組織都是很大的在線游戲和社區(qū)網(wǎng)絡空間的供應商。 Membase容易安裝、操作,可以從單節(jié)點方便的擴展到集群,而且為memcached(有線協(xié)議的兼容性)實現(xiàn)了即插即用功能,在應用方面為開發(fā)者和經(jīng)營者提供了一個比較低的門檻。做為緩存解決方案,Memcached已經(jīng)在不同類型的領域(特別是大容量的Web應用)有了廣泛的使用,其中 Memcached的部分基礎代碼被直接應用到了Membase服務器的前端。 通過兼容多種編程語言和框架,Membase具備了很好的復用性。在安裝和配置方面,Membase提供了有效的圖形化界面和編程接口,包括可配置 的告警信息。 Membase的目標是提供對外的線性擴展能力,包括為了增加集群容量,可以針對統(tǒng)一的節(jié)點進行復制。 另外,對存儲的數(shù)據(jù)進行再分配仍然是必要的。 這方面的一個有趣的特性是NoSQL解決方案所承諾的可預測的性能,類準確性的延遲和吞吐量。通過如下方式可以獲得上面提到的特性: ◆ 自動將在線數(shù)據(jù)遷移到低延遲的存儲介質(zhì)的技術(內(nèi)存,固態(tài)硬盤,磁盤) ◆ 可選的寫操作一一異步,同步(基于復制,持久化) ◆ 反向通道再平衡[未來考慮支持] ◆ 多線程低鎖爭用 ◆ 盡可能使用異步處理 ◆ 自動實現(xiàn)重復數(shù)據(jù)刪除 ◆ 動態(tài)再平衡現(xiàn)有集群 ◆ 通過把數(shù)據(jù)復制到多個集群單元和支持快速失敗轉(zhuǎn)移來提供系統(tǒng)的高可用性。 MongoDB MongoDB是一個介于關系數(shù)據(jù)庫和非關系數(shù)據(jù)庫之間的產(chǎn)品,是非關系數(shù)據(jù)庫當中功能最豐富,最像關系數(shù)據(jù)庫的。他支持的數(shù)據(jù)結(jié)構(gòu)非常松散,是類似json的bjson格式,因此可以存儲比較復雜的數(shù)據(jù)類型。Mongo最大的特點是他支持的查詢語言非常強大,其語法有點類似于面向?qū)ο蟮牟樵冋Z言,幾乎可以實現(xiàn)類似關系數(shù)據(jù)庫單表查詢的絕大部分功能,而且還支持對數(shù)據(jù)建立索引。它的特點是高性能、易部署、易使用,存儲數(shù)據(jù)非常方便。 主要功能特性: ◆ 面向集合存儲,易存儲對象類型的數(shù)據(jù) “面向集合”(Collenction-Oriented),意思是數(shù)據(jù)被分組存儲在數(shù)據(jù)集中,被稱為一個集合(Collenction)。每個 集合在數(shù)據(jù)庫中都有一個唯一的標識名,并且可以包含無限數(shù)目的文檔。集合的概念類似關系型數(shù)據(jù)庫(RDBMS)里的表(table),不同的是它不需要定 義任何模式(schema)。 ◆ 模式自由 模式自由(schema-free),意味著對于存儲在mongodb數(shù)據(jù)庫中的文件,我們不需要知道它的任何結(jié)構(gòu)定義。如果需要的話,你完全可以把不同結(jié)構(gòu)的文件存儲在同一個數(shù)據(jù)庫里。 ◆支持動態(tài)查詢 ◆支持完全索引,包含內(nèi)部對象 ◆支持查詢 ◆支持復制和故障恢復 ◆使用高效的二進制數(shù)據(jù)存儲,包括大型對象(如視頻等) ◆自動處理碎片,以支持云計算層次的擴展性 ◆支持RUBY,PYTHON,JAVA,C++,PHP等多種語言 ◆文件存儲格式為BSON(一種JSON的擴展) BSON(Binary Serialized document Format)存儲形式是指:存儲在集合中的文檔,被存儲為鍵-值對的形式。鍵用于唯一標識一個文檔,為字符串類型,而值則可以是各種復雜的文件類型。 ◆可通過網(wǎng)絡訪問 MongoDB服務端可運行在Linux、Windows或OS X平臺,支持32位和64位應用,默認端口為27017。推薦運行在64位平臺,因為MongoDB在32位模式運行時支持的最大文件尺寸為2GB。 MongoDB把數(shù)據(jù)存儲在文件中(默認路徑為:/data/db),為提高效率使用內(nèi)存映射文件進行管理。 Hypertable Hypertable是一個開源、高性能、可伸縮的數(shù)據(jù)庫,它采用與Google的Bigtable相似的模型。在過去數(shù)年中,Google為在PC集群 上運行的可伸縮計算基礎設施設計建造了三個關鍵部分。第一個關鍵的基礎設施是Google File System(GFS),這是一個高可用的文件系統(tǒng),提供了一個全局的命名空間。它通過跨機器(和跨機架)的文件數(shù)據(jù)復制來達到高可用性,并因此免受傳統(tǒng) 文件存儲系統(tǒng)無法避免的許多失敗的影響,比如電源、內(nèi)存和網(wǎng)絡端口等失敗。第二個基礎設施是名為Map-Reduce的計算框架,它與GFS緊密協(xié)作,幫 助處理收集到的海量數(shù)據(jù)。第三個基礎設施是Bigtable,它是傳統(tǒng)數(shù)據(jù)庫的替代。Bigtable讓你可以通過一些主鍵來組織海量數(shù)據(jù),并實現(xiàn)高效的 查詢。Hypertable是Bigtable的一個開源實現(xiàn),并且根據(jù)我們的想法進行了一些改進。 Apache Cassandra Apache Cassandra是一套開源分布式Key-Value存儲系統(tǒng)。它最初由Facebook開發(fā),用于儲存特別大的數(shù)據(jù)。Facebook在使用此系統(tǒng)。 主要特性: ◆ 分布式 ◆ 基于column的結(jié)構(gòu)化 ◆ 高伸展性 Cassandra的主要特點就是它不是一個數(shù)據(jù)庫,而是由一堆數(shù)據(jù)庫節(jié)點共同構(gòu)成的一個分布式網(wǎng)絡服務,對Cassandra 的一個寫操作,會被復制到其他節(jié)點上去,對Cassandra的讀操作,也會被路由到某個節(jié)點上面去讀取。對于一個Cassandra群集來說,擴展性能 是比較簡單的事情,只管在群集里面添加節(jié)點就可以了。 Cassandra是一個混合型的非關系的數(shù)據(jù)庫,類似于Google的BigTable。其主要功能比 Dynomite(分布式的Key-Value存 儲系統(tǒng))更豐富,但支持度卻不如文檔存儲MongoDB(介于關系數(shù)據(jù)庫和非關系數(shù)據(jù)庫之間的開源產(chǎn)品,是非關系數(shù)據(jù)庫當中功能最豐富,最像關系數(shù)據(jù)庫 的。Cassandra最初由Facebook開發(fā),后轉(zhuǎn)變成了開源項目。它是一個網(wǎng)絡社交云計算方面理想的數(shù)據(jù)庫。以Amazon專有的完全分布式的Dynamo為基礎,結(jié)合了Google BigTable基于列族(Column Family)的數(shù)據(jù)模型。P2P去中心化的存儲。很多方面都可以稱之為Dynamo 2.0。 CouchDB 所用語言: Erlang 特點:DB一致性,易于使用 使用許可: Apache 協(xié)議: HTTP/REST 雙向數(shù)據(jù)復制,持續(xù)進行或臨時處理,處理時帶沖突檢查,因此,采用的是master-master復制 MVCC – 寫操作不阻塞讀操作 可保存文件之前的版本 Crash-only(可靠的)設計 需要不時地進行數(shù)據(jù)壓縮 視圖:嵌入式 映射/減少 格式化視圖:列表顯示 支持進行服務器端文檔驗證 支持認證 根據(jù)變化實時更新 支持附件處理 因此, CouchApps(獨立的 js應用程序) 需要 jQuery程序庫 最佳應用場景:適用于數(shù)據(jù)變化較少,執(zhí)行預定義查詢,進行數(shù)據(jù)統(tǒng)計的應用程序。適用于需要提供數(shù)據(jù)版本支持的應用程序。 例如:CRM、CMS系統(tǒng)。 master-master復制對于多站點部署是非常有用的。 和其他數(shù)據(jù)庫比較,其突出特點是: ◆ 模式靈活 :使用Cassandra,像文檔存儲,你不必提前解決記錄中的字段。你可以在系統(tǒng)運行時隨意的添加或移除字段。這是一個驚人的效率提升,特別是在大型部 署上。 ◆ 真正的可擴展性 :Cassandra是純粹意義上的水平擴展。為給集群添加更多容量,可以指向另一臺電腦。你不必重啟任何進程,改變應用查詢,或手動遷移任何數(shù)據(jù)。 ◆ 多數(shù)據(jù)中心識別 :你可以調(diào)整你的節(jié)點布局來避免某一個數(shù)據(jù)中心起火,一個備用的數(shù)據(jù)中心將至少有每條記錄的完全復制。 ◆ 范圍查詢 :如果你不喜歡全部的鍵值查詢,則可以設置鍵的范圍來查詢。 ◆ 列表數(shù)據(jù)結(jié)構(gòu) :在混合模式可以將超級列添加到5維。對于每個用戶的索引,這是非常方便的。 ◆ 分布式寫操作 :有可以在任何地方任何時間集中讀或?qū)懭魏螖?shù)據(jù)。并且不會有任何單點失敗。 問度娘,啥都有。

新聞名稱:nosql列族,nosql 列存儲
標題來源:http://jinyejixie.com/article12/dssoggc.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、標簽優(yōu)化、企業(yè)建站、動態(tài)網(wǎng)站、全網(wǎng)營銷推廣網(wǎng)頁設計公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

手機網(wǎng)站建設
新乡县| 比如县| 北流市| 凤山市| 科技| 汕头市| 龙陵县| 丹棱县| 汕头市| 邳州市| 涞源县| 陇南市| 赣州市| 刚察县| 大埔县| 万全县| 临桂县| 任丘市| 舞钢市| 渭南市| 调兵山市| 琼中| 宁安市| 松阳县| 双牌县| 崇左市| 灵台县| 海晏县| 韩城市| 兴业县| 安陆市| 张家界市| 都江堰市| 旬阳县| 余姚市| 鸡东县| 阜宁县| 龙井市| 甘孜县| 宜章县| 湖州市|