本篇文章為大家展示了Jupyter Notebook如何適應(yīng)數(shù)據(jù)科學(xué)的發(fā)展方向,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。
創(chuàng)新互聯(lián)建站服務(wù)項(xiàng)目包括華池網(wǎng)站建設(shè)、華池網(wǎng)站制作、華池網(wǎng)頁制作以及華池網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢(shì)、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,華池網(wǎng)站推廣取得了明顯的社會(huì)效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到華池省份的部分城市,未來相信會(huì)繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
下面將討論數(shù)據(jù)科學(xué)的前景,以及推動(dòng)我們的工具發(fā)展的力量。
下面將回顧我在數(shù)據(jù)科學(xué)中經(jīng)常使用的工具——Jupyter Notebook,
我想看看在過去的幾年里,數(shù)據(jù)科學(xué)的實(shí)踐是如何變化的。然后,我將強(qiáng)調(diào)三種主要力量,它們改變了我今天使用Notebook的方式。
數(shù)據(jù)科學(xué)領(lǐng)域正在迅速變化。我們現(xiàn)在已經(jīng)進(jìn)入了這樣一個(gè)時(shí)代:“21世紀(jì)最性感的工作”和“數(shù)據(jù)是新石油”之類的說法已經(jīng)過時(shí),取而代之的是更現(xiàn)實(shí)的業(yè)務(wù)問題和基于技術(shù)的挑戰(zhàn)。我認(rèn)為這種變化是雙重的:我們現(xiàn)在需要支持(1)生產(chǎn)分析和實(shí)驗(yàn)的需求,以及(2)快速采用云技術(shù)。
第一,生產(chǎn)的需要。在軟件工程的生命周期中,創(chuàng)建數(shù)據(jù)產(chǎn)品或者部署實(shí)驗(yàn)工件,這些年來都在增長(zhǎng)。隨著機(jī)器學(xué)習(xí)工程師和數(shù)據(jù)科學(xué)軟件開發(fā)人員的崛起,越來越多的工程類工作被采用,這就是明證。此外,分析不再局限于出版物或圖表,因?yàn)楝F(xiàn)在對(duì)復(fù)制實(shí)驗(yàn)和部署人工制品的需求越來越大。
接下來,數(shù)據(jù)的指數(shù)增長(zhǎng)需要采用云技術(shù)。我們不能僅僅使用我們自己的筆記本電腦來加載Pandas的1TB數(shù)據(jù)集!Docker和Kubernetes等工具的流行使我們能夠以前所未有的水平擴(kuò)展數(shù)據(jù)處理工作負(fù)載。采用云意味著我們?cè)诠芾砉ぷ髫?fù)載時(shí)要考慮可伸縮性、資源供應(yīng)和基礎(chǔ)設(shè)施。然而,之前的Jupyter Notebook生態(tài)系統(tǒng),盡管它是數(shù)據(jù)科學(xué)家工具箱中的一個(gè)重要部分,并不意味著有相應(yīng)的變化:
正如我所說的,我們所知道的Jupyter Notebook并不意味著這些變化。它們是用來探索的,不是用來生產(chǎn)的。它們應(yīng)該在一臺(tái)機(jī)器上運(yùn)行,而不是在集群中。然而,在過去的五年中,Jupyter Notebook的生態(tài)系統(tǒng)已經(jīng)發(fā)展壯大:我們現(xiàn)在有了JupyterLab、一些插件、用于其他語言的新內(nèi)核,以及可供我們使用的第三方工具。當(dāng)然,我們?nèi)匀豢梢酝ㄟ^在終端中輸入jupyter Notebook來運(yùn)行筆記本,但是現(xiàn)在已經(jīng)遠(yuǎn)遠(yuǎn)不止這些了!
這就引出了一個(gè)問題:是什么力量促使了這些變化?,我們?nèi)绾卫眠@個(gè)更大的筆記本生態(tài)系統(tǒng)來應(yīng)對(duì)當(dāng)今數(shù)據(jù)科學(xué)的變化?
Jupyter Notebook的生態(tài)系統(tǒng)正在成長(zhǎng),我認(rèn)為這是由三種力量驅(qū)動(dòng)的:
在云上做實(shí)驗(yàn):大數(shù)據(jù)需要大量的計(jì)算和存儲(chǔ),而一般的消費(fèi)級(jí)機(jī)器并不總是能夠做到這一點(diǎn)。
支持開發(fā)人員工作流程:越來越多的數(shù)據(jù)科學(xué)團(tuán)隊(duì)開始采用軟件工程的最佳實(shí)踐——版本控制、gitfow、拉請(qǐng)求等等。
從分析到生產(chǎn)的快速轉(zhuǎn)變:在受控環(huán)境下測(cè)試假設(shè)是不夠的。為分析而編寫的軟件應(yīng)該可以很容易地為生產(chǎn)重用。
朝著云優(yōu)先的環(huán)境發(fā)展意味著我們可以在比我們更強(qiáng)大的機(jī)器上執(zhí)行基于notebook的任務(wù)。例如,托管的notebook實(shí)例使我們能夠從遠(yuǎn)程服務(wù)器運(yùn)行Jupyter notebook,而無需操作和設(shè)置。另一方面,朝著更加生產(chǎn)工作流程的方向發(fā)展,為我們提供了一組工具,將基于記事本的任務(wù)賦予軟件工程實(shí)踐。在這篇文章的下一部分,我們將看到更多這樣的工具。
最后,請(qǐng)注意,工具的發(fā)展并不依賴于單個(gè)實(shí)體或組織。正如我們將在后面看到的,填補(bǔ)這些空白可能來自于那些提供第三方插件的個(gè)人或者那些提供管理服務(wù)的組織。
我們研究了數(shù)據(jù)科學(xué)領(lǐng)域增長(zhǎng)的兩個(gè)驅(qū)動(dòng)因素:(1)云計(jì)算的采用,以及(2)生產(chǎn)需求的增長(zhǎng)。我們發(fā)現(xiàn)Jupyter notebook只占了這個(gè)生態(tài)系統(tǒng)的一小部分,也就是它通常用于探索(而不是生產(chǎn)),并且只運(yùn)行在我們的本地機(jī)器上(不是在云中)。
然后,使用相同的框架,我們確定了三種變化的力量,使Jupyter筆記本生態(tài)系統(tǒng)得以發(fā)展:在云上增加實(shí)驗(yàn),支持開發(fā)人員工作流,以及更快地從分析轉(zhuǎn)向生產(chǎn)。這些力量可能帶來了新工具、插件和類似記事本的產(chǎn)品的開發(fā),以滿足這些差距。
上述內(nèi)容就是Jupyter Notebook如何適應(yīng)數(shù)據(jù)科學(xué)的發(fā)展方向,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
分享題目:JupyterNotebook如何適應(yīng)數(shù)據(jù)科學(xué)的發(fā)展方向
分享地址:http://jinyejixie.com/article32/poscpc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App開發(fā)、、全網(wǎng)營銷推廣、動(dòng)態(tài)網(wǎng)站、品牌網(wǎng)站制作、網(wǎng)站導(dǎo)航
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)