本篇內(nèi)容主要講解“數(shù)據(jù)分析師怎么應(yīng)對數(shù)據(jù)庫取數(shù)后的離線分析”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“數(shù)據(jù)分析師怎么應(yīng)對數(shù)據(jù)庫取數(shù)后的離線分析”吧!
因?yàn)槿狈糜霉ぞ叩闹С?,?shù)據(jù)分析人員的離線分析動作總是先由一個(gè)事先寫好的復(fù)雜查詢或經(jīng)多步驟處理后臨時(shí)表導(dǎo)出的數(shù)據(jù),之后在 Excel 中用 vlookup(),過濾器等來完成,當(dāng)數(shù)據(jù)更新或范圍擴(kuò)大后又要重新取數(shù),重新在 Excel 中操作。如果能有一個(gè)桌面工具每次會實(shí)時(shí)讀取單表數(shù)據(jù),既能完成上述復(fù)雜查詢和多步驟處理到臨時(shí)表的計(jì)算,又能取代在 Excel 中的計(jì)算動作,免除重復(fù)勞動,將會是很多數(shù)據(jù)分析人員的福音。
如果你會寫 SQL 或 VBA,非常在意獲取數(shù)據(jù)后能夠靈活的多次計(jì)算,而不是想用一個(gè)圖形界面工具完成有限的計(jì)算,又不想花費(fèi)很多時(shí)間去學(xué)習(xí) Python,集算器或許是一個(gè)不錯(cuò)的選擇。
比如,數(shù)據(jù)庫里有以下 3 張表:
SQL Query 1 result: (T1)
Col1 Col2 A 1 B 2
Query 2 result: (T2)
Col3 Col4 1 # 2 *
Query 3 result: (T3)
Col5 1 3
需要對上面 T1,T2,T3 三張表,完成類似下面 SQL 的關(guān)聯(lián)操作:
Select T1.col1,T2.col4 from T1,T2 where T1.col2=T2.col3 and T1.col2 in (Select T3.col5 from T3)
結(jié)果是:
Col1 Col4 A #
如果數(shù)據(jù)量不大,直接內(nèi)存計(jì)算,集算器 SPL 代碼如下:
T1=DB.query("select Col1,Col2 from T1") T2=DB.query("select Col3,Col4 from T2") T3=DB.query("select Col5 from T3") Result=T1.join@i(Col2,T2:Col3,Col1,Col4).select(T3.(Col5).contain(Col2)).new(Col1,Col4)
T1,T2,T3 也可以分別來自不同的數(shù)據(jù)庫或者數(shù)據(jù)文件
如果數(shù)據(jù)量比較大,可以用集算器的游標(biāo),和數(shù)據(jù)庫游標(biāo)類似,代碼如下:
CS1=DB.cursor("select Col1,Col2 from T1 orderby Col2") CS2=DB.cursor("select Col3,Col4 from T2 orderby Col3") S3=DB.query@i("select Col5 from T3") Result=joinx(CS1,Col2;CS2,Col3).select(S3.contain(#1.Col2)).new(#1.Col1,#2.Col4).fetch()
如果想利用最終計(jì)算后的結(jié)果在 Excel 中做圖表,導(dǎo)出到 Excel 也很方便
file("Result.xlsx").xlsexport(Result)
集算器即裝即用,應(yīng)對上述問題非常得心應(yīng)手。集算器也支持先將大數(shù)據(jù)保存成本地文件,然后讀取這些類型已確定、已壓縮的數(shù)據(jù)做高效計(jì)算,這樣可以減輕數(shù)據(jù)庫的負(fù)載,也能讓本地計(jì)算效率更高。
到此,相信大家對“數(shù)據(jù)分析師怎么應(yīng)對數(shù)據(jù)庫取數(shù)后的離線分析”有了更深的了解,不妨來實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
網(wǎng)站名稱:數(shù)據(jù)分析師怎么應(yīng)對數(shù)據(jù)庫取數(shù)后的離線分析-創(chuàng)新互聯(lián)
本文來源:http://jinyejixie.com/article22/gehjc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計(jì)、網(wǎng)站內(nèi)鏈、軟件開發(fā)、網(wǎng)站建設(shè)、移動網(wǎng)站建設(shè)、企業(yè)建站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)