Pandas数据结构简介
Series
Series 類似一維數組,由一組數據及一組相關數據標簽組成。使用pandas的Series類即可創建。
import pandas as pd s1 = pd.Series(['a', 'b', 'c,', 'd']) print(s1) 復制代碼#輸出: 0 a # 1 b # 2 c # 3 d # dtype: object復制代碼上面是傳入一個列表實現,上面的0,1,2,3就是數據的默認標簽。另外可以通過index屬性自定義標簽。
s2 = pd.Series(['1', '2', '3,', '4'],index=['a', 'b', 'c,', 'd']) # index設置自定義索引 print(s2)復制代碼另外Series還可以通過字典傳參。
s3 = pd.Series({'a':1,'b':2}) print(s3.values) # 通過values獲取它的值復制代碼DataFrame
DataFrame是由一組數據和一組索引組成的數據結構,有行索引和列索引。和excel類似,是一種表格型數據結構。下面的就是一種簡單的DataFrame數據格式。
技能 0 python 1 Java復制代碼DataFrame類中可傳入列表實例化一個dataframe的表格數據對象,此時行和列索引默認都是0.常見的是傳入嵌套的列表,嵌套的里面的列表也可以是元祖,如果不指定索引行列索引都是從0,1開始自增,并可以通過columns、index自定義的列索引和行索引。詳見下面的代碼。
import pandas as pd df2 = pd.DataFrame([('a','A'),('b','B'),('c','C'),('d','D')]) # 傳一個嵌套列表,嵌套里的數據可以是元祖,也可是列表 print(df2)復制代碼輸出的格式如下:? ??
? ? 0? ? ?1?
0? ?a? ? A?
1? ?b? ? B?
2? ? c? ? C?
3? ? d? ? D
? ? 小寫? 大寫??
0? a? ? ? ? A
1? b? ? ? ? B
2? c? ? ? ? C
3? d? ? ? ?D
DataFrame類中也可傳入字典來實例化一個dataframe的表格數據對象,此時字典的key就相當于列索引,此時行索引默認還是從0開始,另外也可通過 index來自定義列索引。
轉載于:https://juejin.im/post/5cc0895a5188250a80187d2e
總結
以上是生活随笔為你收集整理的Pandas数据结构简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 高吞吐、低延迟 Java 应用的 GC
- 下一篇: 数据分析---ipython使用