python 数组升序_python简单数据清洗和分析
利用python學習了簡單一維數組和二維數組,明白了集合、數組、字典大概的關聯,并學會從中點用不同的數組類型進行更好的分析。
讀取excel文件,開始進行最簡單的數據清洗。
將購藥時間重新命名為銷售時間,即python可以實現對列名稱進行更換。
因為最開始引用的數據格式全部為文本格式,現在需要將銷售數據、應收金額、實收金額轉換為浮點數據進行運算。
還需要進行一步:對數據表中的空值進行刪除,以便后續處理。
函數的那一步意義為:將銷售時間‘2018-01-01 星期五’用split函數進行分列,提取分析所需的信息,即‘2018-01-01’。其中用到了for循環和自定義函數。
然后將銷售時間數據的格式轉換為日期格式,便于進一步的統計分析。(注意:在這一步的時候可能會出現日期格式數據出現控制,所以需要將空值進行刪除)
在完成數據格式轉換以后,用file.dtypes可以看到每一列的數據格式。
接下來將數據按照銷售時間的升序排列。
數據清洗完成后,可以開始數據分析或者數據運算。
這里用到了分組功能,因之前已經把銷售時間數據變為了日期數據,所以可以根據月份分類,直接可以顯示各個月份的銷售數量、應收、實收金額。
應用以上內容,我將針對某微信公眾號在2019年的數據進行簡單統計分析。首先導入excel文件。
刪除空值,將閱讀量、當日漲、掉粉量和分享量的數據轉為浮點型,把日期數據轉為日期格式。
根據每個月的閱讀量、分享量、當日漲粉、掉粉情況進行統計,并計算了2019年總的閱讀量。
根據以上的學習,大概了解了用python清洗數據的過程,可以類比excel來想。在excel中可能運用數據透視表就可以很簡單運行的東西,在python中對應的相對較復雜的變成語句,這個時候可以結合自己的熟練程度,進行不同軟件的選擇。在統計分析方面,python有固定的格式,可能以后會學到不同的語句。
在python語句運行中,需要特別小心,可能前一個語句重復運行盡毀導致下一個語句的無法運行,要更加細心。
總結
以上是生活随笔為你收集整理的python 数组升序_python简单数据清洗和分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 复仇者联盟4在啥时候上映?
- 下一篇: 看上一款手机壳,但是在某宝上搜不到,求链