【Python】Autoviz: 一行代码搞定数据集探索并可视化
數據集各個特征有什么變化趨勢、各個特征之間有何關系,我們可以借助Matplotlib、Seaborn等諸多工具來可視化展示,那么有沒有一種工具能一次展示所有的關系了?
本文要介紹的Python工具Autoviz,一行代碼即可完成對數據集所有關系的探索 (Exploratory Data Analysis,EDA)。
安裝
pip?install?autoviz一行代碼搞定數據探索
本次以探索鳶尾花 (iris)數據集為例子,數據集詳細介紹👉👉鳶尾花數據集詳細介紹autoviz使用,
from?autoviz.AutoViz_Class?import?AutoViz_Class#AutoViz實例化 AV?=?AutoViz_Class()#一行代碼實現數據探索 dft?=?AV.AutoViz(filename='/Users/xmy/Desktop/jobs/py/iris.csv',??#讀入數據集,注意和dfte的區別sep=",",??#設置數據集分隔符,默認為逗號depVar="species",??#設置因變量dfte=None,??#傳入一個pandas.DataFrame,如果filename已設置,此處為None,反之亦然header=0,verbose=0,??#可選0,?1或者2,設置圖形的保存形式lowess=False,??#是否啟用lowess回歸,適合小數據量數據集,100,000行以上數據不建議用chart_format="svg",??#設置圖形保存格式max_rows_analyzed=150000,??#設置數據集待分析的行數max_cols_analyzed=30,??#設置數據集待分析的列數 )結果輸出一部分為Dataset的簡單介紹,結果輸出另一部分為大量可視化圖表,?以上整個過程僅僅需要4.226秒
No categorical or boolean vars in data set. Hence no pivot plots...
No categorical or numeric vars in data set. Hence no bar charts.
Time to run AutoViz \(in seconds\) = 4.226
###################### VISUALIZATION Completed ########################
參考:https://github.com/AutoViML/AutoViz
-END-
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯黃海廣老師《機器學習課程》視頻課本站qq群851320808,加入微信群請掃碼:
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的【Python】Autoviz: 一行代码搞定数据集探索并可视化的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: RTSP、RTMP、HTTP协议区别
- 下一篇: PP视频怎么设置文件的缓存路径