本文將為大家詳細介紹“python操作excel實現(xiàn)數(shù)據(jù)清洗的示例”,內(nèi)容步驟清晰詳細,細節(jié)處理妥當,而小編每天都會更新不同的知識點,希望這篇“python操作excel實現(xiàn)數(shù)據(jù)清洗的示例”能夠給你意想不到的收獲,請大家跟著小編的思路慢慢深入,具體內(nèi)容如下,一起去收獲新知識吧。
碧江ssl適用于網(wǎng)站、小程序/APP、API接口等需要進行數(shù)據(jù)傳輸應(yīng)用場景,ssl證書未來市場廣闊!成為創(chuàng)新互聯(lián)公司的ssl證書銷售渠道,可以享受市場價格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:028-86922220(備注:SSL證書合作)期待與您的合作!
Python主要應(yīng)用于:1、Web開發(fā);2、數(shù)據(jù)科學(xué)研究;3、網(wǎng)絡(luò)爬蟲;4、嵌入式應(yīng)用開發(fā);5、游戲開發(fā);6、桌面應(yīng)用開發(fā)。
python 在對 excel 操作的同時,前面文章中說了數(shù)據(jù)的讀取、插入、簡單分析,還有一個非常重要的點就是數(shù)據(jù)清洗。那什么叫數(shù)據(jù)清洗,說白了就是去除數(shù)據(jù)文本中的垃圾值,比如:存在的空值、多余的空格、數(shù)據(jù)格式等等的處理。
# 導(dǎo)入 pandas 庫import pandas as pd# read_excel() 讀取 excel 數(shù)據(jù)# DataFrame() 將讀取到的數(shù)據(jù)轉(zhuǎn)換為 DataFrame 數(shù)據(jù)df = pd.DataFrame(pd.read_excel('data.xlsx'))
# dropna() 函數(shù)去除 df 數(shù)據(jù)表中存在空值的所有行df.dropna(how='any')# mean() 函數(shù)計算 age 字段所在列的平均值age_pre = df['age'].mean()# 使用 fillna() 函數(shù)對存在的空值進行填充,將 age_pre 的值填充到字段為空的值內(nèi)面df['age'].fillna(age_pre)
# 清除字段的空格df['name'] = df['name'].map(str.strip)
# rename() 函數(shù)對列進行重命名df.rename(columns={'name': 'name_new'})
# 從前往后查找某個列中的重復(fù)值,如果存在則清除后面所出現(xiàn)的重復(fù)值df['name'].drop_duplicates()# 從后往前查找某個列中的重復(fù)值,如果存在則清除前面所出現(xiàn)的重復(fù)值df['city'].drop_duplicates(keep='last')# 兩種正好是按照相反的清除順序
# 將某一列中的具體值進行替換df['name'].replace('laow', 'lwsbc')
如果你能讀到這里,小編希望你對“python操作excel實現(xiàn)數(shù)據(jù)清洗的示例”這一關(guān)鍵問題有了從實踐層面最深刻的體會,具體使用情況還需要大家自己動手實踐使用過才能領(lǐng)會,如果想閱讀更多相關(guān)內(nèi)容的文章,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!
網(wǎng)站題目:python操作excel實現(xiàn)數(shù)據(jù)清洗的示例
瀏覽路徑:http://jinyejixie.com/article28/ijjicp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供自適應(yīng)網(wǎng)站、App設(shè)計、全網(wǎng)營銷推廣、定制網(wǎng)站、外貿(mào)網(wǎng)站建設(shè)、定制開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)