本篇內(nèi)容主要講解“如何利用Python做數(shù)據(jù)篩選”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學(xué)習(xí)“如何利用Python做數(shù)據(jù)篩選”吧!
創(chuàng)新互聯(lián)是一家以網(wǎng)站建設(shè)公司、網(wǎng)頁設(shè)計、品牌設(shè)計、軟件運維、成都網(wǎng)站營銷、小程序App開發(fā)等移動開發(fā)為一體互聯(lián)網(wǎng)公司。已累計為成都銅雕雕塑等眾行業(yè)中小客戶提供優(yōu)質(zhì)的互聯(lián)網(wǎng)建站和軟件開發(fā)服務(wù)。
EXCEL篩選
我們回顧一下上一篇文章里的數(shù)據(jù)需求,第一個是根據(jù)訂單日期篩選2010年的訂單,第二個是根據(jù)訂單等級去篩選高級的訂單,這一次我們把篩選條件進行升級,增加一個條件:在原先兩個篩選條件的基礎(chǔ)上,篩選出利潤金額前10的訂單。如果在EXCEL里操作的話,可以利用公式或者自身的篩選功能去實現(xiàn),但是在python又是怎樣實現(xiàn)的呢?
我們可以在pycharm等軟件上寫python腳本去實現(xiàn),但是我推薦大家用Smartbi智分析的ETL功能去實現(xiàn),Smartbi智分析的ETL界面里也提供了python腳本的編寫頁面,并且很多簡單的需求通過ETL就能實現(xiàn),無需撰寫復(fù)雜的代碼,非常適合編程小白。
加載數(shù)據(jù)
打開Smartbi智分析里ETL界面,我們先連接好數(shù)據(jù)源,我已經(jīng)提前把EXCEL文件導(dǎo)入到了Smartbi智分析的系統(tǒng)里,然后把關(guān)系數(shù)據(jù)源拉拽到展示區(qū)里,并在右邊找到數(shù)據(jù)源存放的路徑:
加載完成后,我們可以對數(shù)據(jù)源進行預(yù)覽:
條件過濾
當(dāng)完成了數(shù)據(jù)連接后,接下來就可以利用Smartbi智分析ETL里自帶的python腳本對數(shù)據(jù)進行各種處理,我們先把python的組件拉拽到中間的展示區(qū),并與上面的關(guān)系數(shù)據(jù)源進行相連:
以下腳本是Smartbi智分析自帶的腳本,已經(jīng)提前安裝好了pandas和numpy的庫,后面的函數(shù)也寫好了一部分代碼,只要根據(jù)以下腳本進行擴展,便可以在ETL上利用python進行數(shù)據(jù)清洗:
在輸入python腳本之前,我們再明確一下要實現(xiàn)的需求,其中前面兩個條件是和上次一樣的,我們無需進行改動,直接復(fù)制腳本過來即可,如果不懂的可以查看我前一篇文章。第三個條件需要做的是篩選利潤額前10的訂單,這里我們引用pandas中的sort_values函數(shù)進行排序,原理類似于SQL中的order by,可以將數(shù)據(jù)集依照某個字段中的數(shù)據(jù)進行排序,后面接ascending=False,即對數(shù)據(jù)進行降序排列,head(10)代表的是取前10的值:
我們看一下python腳本執(zhí)行后的效果,年份這一列把2010年給篩選出來了,訂單這一列篩選的是高級的訂單,訂單利潤這一列的數(shù)據(jù)按照降序把前10的數(shù)據(jù)給篩選出來了:
數(shù)據(jù)輸出
完成python的篩選程序后,我們把執(zhí)行篩選后的表格進行保存,可以選擇保存在數(shù)據(jù)庫中,也可以保存在數(shù)據(jù)集里,這里我依舊選擇數(shù)據(jù)集的保存方式,因為方便在EXCEL里進行調(diào)用:
回到EXCEL里,點擊EXCEL插件里的“視圖”,在右邊會出現(xiàn)Smartbi智分析的數(shù)據(jù)集面板界面,點擊下拉菜單,便可以找到保存在云端的數(shù)據(jù)集,也可以直接輸入文件名進行搜索:
點擊EXCEL工具欄上的“刷新”,數(shù)據(jù)集里的字段便會顯示在EXCEL里,我們就可以利用這些數(shù)據(jù)在EXCEL里進行數(shù)據(jù)分析了:
到此,相信大家對“如何利用Python做數(shù)據(jù)篩選”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
分享文章:如何利用Python做數(shù)據(jù)篩選
路徑分享:http://jinyejixie.com/article48/jjhehp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供動態(tài)網(wǎng)站、微信小程序、小程序開發(fā)、網(wǎng)站排名、軟件開發(fā)、
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)