excel处置4000行数据卡_懂Excel就能轻松入门Python数据分析包pandas(三):制作成绩条...
系列文章:
經(jīng)常聽別人說 Python 在數(shù)據(jù)領域有多厲害,結果學了很長時間,連數(shù)據(jù)處理都麻煩得要死。后來才發(fā)現(xiàn),原來不是 Python 數(shù)據(jù)處理厲害,而是他有數(shù)據(jù)分析神器—— pandas
前言
很多從未接觸 pandas 的小伙伴看到相關資料后,會覺得這玩意無法處理像 Excel 那樣格式復雜多變的數(shù)據(jù)。其實 pandas 比起手動操作、透視表操作甚至 Vba 操作,他可以更靈活快速處理復雜形狀的數(shù)據(jù)。
這次,我們來看看怎么用 pandas 一次生成各種形如工資條的格式數(shù)據(jù)。
案例
繼續(xù)沿用成績單數(shù)據(jù):
我們希望把每位學生的成績單獨列出來,也就是一行記錄成為一個小表:
Excel 技巧
用 Excel 自帶功能可不可以批量完成這個工作呢?當然可以,只不過需要許多技巧。但我總是說,思路比方法更重要,這是因為,如果你理解這 Excel 操作過程,同樣的思路就可以應用在 pandas 中完成。
看看 Excel 是怎么完成此需求的,我們用10條記錄做演示:
添加輔助序列,每個數(shù)值相隔2(這是因為結果數(shù)據(jù)每行相隔2行)
在輔助列下面,生成序列(結束值為上一步序列的尾數(shù))
使用 Excel 自帶的生成系列功能即可
批量添加標題行
從3開始,每隔3行設置一標題
去除重復的序列行
最后根據(jù)輔助列排序,即可得到結果
pandas 做法
pandas 中有多種實現(xiàn)方式,本節(jié)先介紹與上述 Excel 的解決思路基本一致的方式。如下:
修改行索引值,相當于 Excel 的第一步
reindex 可以給予不存在的行索引值,此時那些行會變成空行
相當于 Excel 中的第二與第四步
最后,把從索引3開始,每隔3行賦值列標題即可
完整代碼如下:
最后
本文介紹的方式實際限制比較大,比如不能按任意維度劃分等,并且需要使用者對 pandas 中的索引有深入理解。下次將介紹一種通用的方式,而且還可以在每個小表格中添加匯總行。
如果希望從零開始學習 pandas ,那么可以看看我的 pandas 專欄。
總結
以上是生活随笔為你收集整理的excel处置4000行数据卡_懂Excel就能轻松入门Python数据分析包pandas(三):制作成绩条...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: db2 jdbc驱动参数_JDBC详细整
- 下一篇: git两个账号切换_Git切换账号方法