Scikit-learn数据预处理分类变量编码之等级变量编码
生活随笔
收集整理的這篇文章主要介紹了
Scikit-learn数据预处理分类变量编码之等级变量编码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
? ? ? ? ? ? ? Scikit-learn數據預處理分類變量編碼之等級變量編碼
1 聲明
本文的數據來自網絡,部分代碼也有所參照,這里做了注釋和延伸,旨在技術交流,如有冒犯之處請聯系博主及時處理。
2 等級分類變量編碼簡介
有序分類變量,又等級分類變量,比如學歷的??啤⒈究?、研究生等,即變量間的差值有意義。這類編碼一般通過map進行映射。
注:這里主要針對原始分類變量是字符串的情況。
import pandas as pd dataframe = pd.DataFrame({"Score": ["Low", "Low", "Medium", "Medium", "High", "Barely More Than Medium"]}) scale_mapper = {"Low":1, "Medium":2, "Barely More Than Medium": 2.1,#3 這里需要根據業務需求設定閾段 "High":4} print(dataframe["Score"].replace(scale_mapper)) stlizer_data)總結
以上是生活随笔為你收集整理的Scikit-learn数据预处理分类变量编码之等级变量编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 平安普惠怎么申请退息
- 下一篇: 京东方a属于哪个板块