ipython --pandas
生活随笔
收集整理的這篇文章主要介紹了
ipython --pandas
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
d定義:
pandas是一個強大的Python數據分析的工具包。
pandas是基于NumPy構建的。
安裝方法:
pip install pandas
import pandas as pd
pandas的主要功能
具備對其功能的數據結構DataFrame、Series
集成時間序列功能
提供豐富的數學運算和操作
靈活處理缺失數據
?
Series
定義:Series是一種類似于一位數組的對象,由一組數據和一組與之相關的數據標簽(索引)組成。
創建方式:
創建方式: pd.Series([4,7,-5,3]) pd.Series([4,7,-5,3],index=['a','b','c','d']) pd.Series({'a':1, 'b':2}) pd.Series(0, index=['a','b','c','d’])
?
獲取值數組和索引數組:values屬性和index屬性
Series比較像列表(數組)和字典的結合體。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
實例:
sr=pd.Series([1,2,3,4],index=['a','b','c','d'])sr['a':'c']==> a -4 b 3 c 5 dtype: int64sr[['a','d']]== a -4 d 6 dtype: int64判斷 條件是鍵不是值 'b' in sr == true1 in sr == flase取值: 取值的方法和字典相類似 sr.get('a',0)判斷,切片,取值
?
sr=pd.Series([1,2,3,4],index=['b','c','d','a'])b 1 c 2 d 3 a 4 dtype: int64sr.iloc[1] #取索引為1 == 2sr.ilc[2] #取索引為2 == 3取索引
?
sr=pd.Series([1,2,3,4],index=['b','c','d','a']) sr1=pd.Series([5,6,7,8,9],index=['a','b','c','d','e']) sr2=pd.Series([5,6,7,8,9,10],index=['a','b','c','d','e','f'])sr+sr1 == a 9.0 b 7.0 c 9.0 d 11.0 e NaN dtype: float64 PS:多出來的值只是NANadd方法 sr3=sr.add(sr2,fill_value=0)sr3: == a 9.0 b 7.0 c 9.0 d 11.0 e 9.0 f 10.0 dtype: float64用add方法:沒有就加上,不會出現Nanadd方法和 a+b區別
sr4a 9.0 b 7.0 c 9.0 d 11.0 e NaN dtype: float64sr4.notnull() a True b True c True d True e False dtype: boolsr4[sr4.notnull()] #把是NAN的去掉a 9.0 b 7.0 c 9.0 d 11.0sr4.dropna() #也是直接去掉為nan的 a 9.0 b 7.0 c 9.0 d 11.0 dtype: float64notnull()和dropna()
?
sr=pd.DataFrame({'one':[1,2,3,4],'two':[32,4,5,6]},index=['a','s','d','q']) import random li = [random.uniform(10,20) for _ in range(1000)] ratio = 6.3list(map(lambda x:x*ratio, li))map函數調用
df = pd.read_csv('601318.csv', header=None, names=list('asdfghjk'))
?
?
df = pd.read_csv('601318.csv',index_col=1, parse_dates=['date']) df
?
? ?
?
df.groupby('key1').sum()
?
?
轉載于:https://www.cnblogs.com/52forjie/p/8379924.html
總結
以上是生活随笔為你收集整理的ipython --pandas的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 先换卡卡修还是换佐罗门
- 下一篇: 新晋孕妇一枚、求推荐孕妇能用的护肤品。。