python数据建模优缺点_Python数据分析\建模入门建议
編程語言只是工具,核心在于你要做什么,很多python的高級方法和語言特性,前期可以全部不管。
作為數據分析和建模,先用python實現基本的需求,更高級的用法慢慢掌握,萬事開頭難。
一、掌握基本的數據結構和控制流程(1周即可)
基本的數據結構:元組、列表、字典。
基本的控制流程:if判斷、for循環、while循環。
剩下的事情就是把數據存在合適的數據結構中,然后使用控制流程操作數據。
其實數據操作和sql很像,就是增刪改排序查找,不同數據結構有不同的方法,需要掌握,大致知道就好,用多了就熟了。
可以如下百度(示例如下):python 列表操作
https://www.cnblogs.com/Devilf/p/8039805.html
二、掌握pandas包的數據操作(1-2個月為宜)
python的優勢:包。通過導入包,利用別人封裝好的方法,可以更加高效的處理數據。
數據處理基本上用pandas就夠了(熟悉之后可以逐步使用numpy、scipy等),pandas學習方法:
1、10 minutes to pandas(http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html),官網的入門教程,雖然是英文,但很好讀,花一周堅持讀下來,會對pandas有很清晰的了解。
2、pandas的核心在于:
將數據存儲為dataframe類型,然后基于此數據類型進行數據操作。
常見的數據操作有:數據輸入輸出、篩選數據、groupby數據、時間數據操作、數據可視化。閱讀官方教程即可:
http://pandas.pydata.org/pandas-docs/stable/getting_started/basics.html
3、閱讀Python for Data Analysis,中文版是:利用Python進行數據分析。基本是在更加詳細的介紹如何使用pandas操作數據。
三、數據建模(長期,難點在于知道應該做什么,具體實現熟了很簡單)
建模常用的包有pytorch、sklearn、tensorflow等,使用sklearn就可以滿足常見建模需求。
事實上,利用包建模很簡單,基本就是:
1、導入包
2、利用包已實現的算法fit一下訓練數據得到model;
3、利用model對測試數據做個predict;
4、利用各種模型性能評價指標評估model性能。
5、調整參數、入模變量等,得到滿足性能指標的model。
大量的工作是花費在調參和模型性能指標的驗證上的,因為性能指標可以反饋出數據本身的特點以及如何更好的調參得到好的模型。
四、其他
有了基礎后,注意提高自己的代碼效率或者通過不同的方法得到更好的結果。
可以關注pythonic方面的文章,會提高自己的編程能力。
總結
以上是生活随笔為你收集整理的python数据建模优缺点_Python数据分析\建模入门建议的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python数学建模|综合评价方法
- 下一篇: ADS学习笔记—3.仿真实例