成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

python計算IV值及使用

更多大數(shù)據(jù)分析、建模等內(nèi)容請關(guān)注公眾號《bigdatamodeling》

秀嶼網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)建站!從網(wǎng)頁設(shè)計、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、成都響應(yīng)式網(wǎng)站建設(shè)公司等網(wǎng)站項目制作,到程序開發(fā),運營維護(hù)。創(chuàng)新互聯(lián)建站自2013年創(chuàng)立以來到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進(jìn)行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)建站

在對變量分箱后,需要計算變量的重要性,IV是評估變量區(qū)分度或重要性的統(tǒng)計量之一,python計算IV值的代碼如下:

def CalcIV(Xvar, Yvar): 
   N_0  = np.sum(Yvar==0)
   N_1 = np.sum(Yvar==1)
   N_0_group = np.zeros(np.unique(Xvar).shape)
   N_1_group = np.zeros(np.unique(Xvar).shape)
   for i in range(len(np.unique(Xvar))):
       N_0_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 0)].count()
       N_1_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 1)].count()
   iv = np.sum((N_0_group/N_0 - N_1_group/N_1) * np.log((N_0_group/N_0)/(N_1_group/N_1)))
   return  iv   

def caliv_batch(df, Kvar, Yvar):
   df_Xvar = df.drop([Kvar, Yvar], axis=1)
   ivlist = []
   for col in df_Xvar.columns:
       iv = CalcIV(df[col], df[Yvar])
       ivlist.append(iv)
   names = list(df_Xvar.columns)
   iv_df = pd.DataFrame({'Var': names, 'Iv': ivlist}, columns=['Var', 'Iv'])

   return iv_df

其中,df是分箱后的數(shù)據(jù)集,Kvar是主鍵,Yvar是y變量(0是好,1是壞)。代碼運行結(jié)果如下:
python計算IV值及使用

新聞標(biāo)題:python計算IV值及使用
網(wǎng)頁路徑:http://jinyejixie.com/article10/gcejdo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、網(wǎng)站內(nèi)鏈網(wǎng)站收錄、手機(jī)網(wǎng)站建設(shè)、定制網(wǎng)站、網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作
乌什县| 宁蒗| 古浪县| 石泉县| 台东市| 凤台县| 赤城县| 平阳县| 福鼎市| 长泰县| 仙居县| 固阳县| 石景山区| 南皮县| 教育| 临澧县| 莆田市| 额敏县| 泸州市| 固阳县| 信宜市| 通河县| 永城市| 堆龙德庆县| 连城县| 华容县| 阆中市| 大名县| 杭锦后旗| 浦北县| 万源市| 贡山| 陵水| 东港市| 古交市| 武清区| 河东区| 黎平县| 海丰县| 延津县| 宝山区|