【python数据挖掘课程】二十九.数据预处理之字符型转换数值型、标准化、归一化处理
這是《Python數(shù)據(jù)挖掘課程》系列文章,前面很多文章都講解了數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí),這篇文章主要講解數(shù)據(jù)分析預(yù)處理中字符特征轉(zhuǎn)換為數(shù)值特征、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)歸一化,這都是非常基礎(chǔ)的工作。最后通過KNN實(shí)現(xiàn)KDD CUP99數(shù)據(jù)集的分類。
文章比較基礎(chǔ),希望對(duì)你有所幫助,提供些思路,也是自己教學(xué)的內(nèi)容。推薦大家購買作者新書《Python網(wǎng)絡(luò)數(shù)據(jù)爬取及分析從入門到精通(分析篇)》,如果文章中存在錯(cuò)誤或不足之處,還請(qǐng)海涵。
安全資源下載地址:https://github.com/eastmountyxz/NetworkSecuritySelf-study
惡意代碼下載地址:https://github.com/eastmountyxz/AI-for-Malware-Analysis-
數(shù)據(jù)分析系列代碼:https://github.com/eastmountyxz/Python-for-Data-Mining
希望讀者能幫Github點(diǎn)個(gè)贊,一起加油。
文章目錄
- 一.KDD CUP背景知識(shí)
- 二.數(shù)據(jù)特征描述
- 1.TCP連接基本特征(共9種,序號(hào)1~9)</
總結(jié)
以上是生活随笔為你收集整理的【python数据挖掘课程】二十九.数据预处理之字符型转换数值型、标准化、归一化处理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [网络安全自学篇] 二十四.基于机器学习
- 下一篇: [Python人工智能] 一.Tenso