Python之woe:woe库的简介、安装、使用方法之详细攻略
生活随笔
收集整理的這篇文章主要介紹了
Python之woe:woe库的简介、安装、使用方法之详细攻略
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
Python之woe:woe庫的簡介、安裝、使用方法之詳細(xì)攻略
?
?
?
?
目錄
woe庫的簡介
1、離散值分箱原理
2、連續(xù)值分箱原理
woe庫函數(shù)的安裝
woe庫函數(shù)的使用方法
1、woe模塊功能樹
?
?
?
?
woe庫的簡介
? ? ? ?woe轉(zhuǎn)換工具主要用于信用評級的記分卡模型。在woe中,對變量進(jìn)行分箱的原理類似于二叉決策樹,其中決定如何劃分的目標(biāo)函數(shù)是iv值。特點(diǎn)如下:
- 基于IV準(zhǔn)則的分裂樹
- 豐富的模型評價(jià)方法
- 格式統(tǒng)一,輸出方便
- IV樹的儲存以備后續(xù)使用
官網(wǎng):https://github.com/boredbird/woe
?
1、離散值分箱原理
將每個(gè)值作為一個(gè)分組,計(jì)算個(gè)分組woe值,再計(jì)算IV值。
?
?
2、連續(xù)值分箱原理
- 計(jì)算將整體數(shù)據(jù)作為一個(gè)分組的IV值(命名為IV0);
- 對所有值排序,根據(jù)最大,最小值平均劃分100個(gè)取值區(qū)間(99個(gè)區(qū)間分割點(diǎn),每個(gè)分割點(diǎn)可以將整體數(shù)據(jù)分割為左右兩部分);
- 針對每個(gè)分割點(diǎn),嘗試將左右兩部分作為兩個(gè)分組,計(jì)算IV值(如果此種分組中,左右有一個(gè)分組中數(shù)據(jù)少于總體數(shù)據(jù)量的5%,不計(jì)算此分組IV)。獲取99中分組方式中的最大IV值(IVmax);
- 假如此最大IV值(IVmax)大于不分組IV值的101%(IV0),不進(jìn)行分割。否則,以此分割點(diǎn)將數(shù)據(jù)整體分為左右兩個(gè)組。每個(gè)組獨(dú)立重新進(jìn)行1步驟,進(jìn)入下一輪循環(huán)。
- 根據(jù)記錄所有分組點(diǎn)進(jìn)行數(shù)據(jù)整體分組,計(jì)算IV。
?
?
woe庫函數(shù)的安裝
pip install woe
?
?
woe庫函數(shù)的使用方法
1、woe模塊功能樹
|- __init__ |- config.py | |-- config | |-- __init__ | |-- change_config_var_dtype() | |-- load_file() |- eval.py | |-- compute_ks() | |-- eval_data_summary() | |-- eval_feature_detail() | |-- eval_feature_stability() | |-- eval_feature_summary() | |-- eval_model_stability() | |-- eval_model_summary() | |-- eval_segment_metrics() | |-- plot_ks() | |-- proc_cor_eval() | |-- proc_validation() | |-- wald_test() |- feature_process.py | |-- binning_data_split() | |-- calculate_iv_split() | |-- calulate_iv() | |-- change_feature_dtype() | |-- check_point() | |-- fillna() | |-- format_iv_split() | |-- proc_woe_continuous() | |-- proc_woe_discrete() | |-- process_train_woe() | |-- process_woe_trans() | |-- search() | |-- woe_trans() |- ftrl.py | |-- FTRL() | |-- LR() |- GridSearch.py | |-- fit_single_lr() | |-- grid_search_lr_c() | |-- grid_search_lr_c_main() | |-- grid_search_lr_validation()?
?
?
?
?
?
?
?
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的Python之woe:woe库的简介、安装、使用方法之详细攻略的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python之sklearn-panda
- 下一篇: 成功解决ERROR: Could not