Pandas处理Excel文件源码学习
pandas.read_excel
pandas.read_excel API
pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None) 讀取Excel文件并轉(zhuǎn)化為DataFrame結(jié)構(gòu)Parameters
默認(rèn)將第0行設(shè)置為DataFrame的列標(biāo)簽,也可指定任一行為列標(biāo)簽;如果excel文件中沒(méi)有列標(biāo)簽,則將其設(shè)置為None
默認(rèn)用序列[0-n]作為DataFrame的行標(biāo)簽
Example
新建一個(gè)temp.xlsx文件
pandas中,行列標(biāo)簽不計(jì)入df的shape中
pandas.DataFrame.set_index
pandas.DataFrame.set_index API:
DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 將已存在的列設(shè)置為DataFrame的行標(biāo)簽Parameters
1. keys: label or array-like or list of labels/arrays 這個(gè)參數(shù)可以是單個(gè)列標(biāo)簽、含有多個(gè)列標(biāo)簽的列表、與DataFrame行數(shù)相同的一維Series數(shù)組、含有列標(biāo)簽和Series數(shù)組的列表……2. drop: bool, default True 刪除原先的列,并將其作為新的行索引Example
import pandas as pd df = pd.DataFrame({'month': [1, 4, 7, 10],'year': [2012, 2014, 2013, 2014],'sale': [55, 40, 84, 31]}) dfmonth year sale 0 1 2012 55 1 4 2014 40 2 7 2013 84 3 10 2014 31 df.set_index('month')year sale month 1 2012 55 4 2014 40 7 2013 84 10 2014 31 df.set_index([pd.Index([1, 2, 3, 4]), 'year'])month saleyear 1 2012 1 55 2 2014 4 40 3 2013 7 84 4 2014 10 31numpy.sum()
numpy.sum() API
在某個(gè)axis上對(duì)numpy數(shù)組求和
a是求和對(duì)象
axis=0: 沿著行做垂直方向的運(yùn)算,將Numpy數(shù)組壓縮成一行
axis=1: 沿著列做水平方向的運(yùn)算,將Numpy數(shù)組壓縮成一列
閱讀文章: numpy.sum()的使用
pandas.DataFrame.stack
pandas.DataFrame.stack API
stack的意思是堆疊,堆積
DataFrame結(jié)構(gòu)中,表格在行列方向上均有索引,而將DataFrame進(jìn)行Stack后,只有列方向上的索引,這類似于層次化的Series結(jié)構(gòu)。stack函數(shù)會(huì)將數(shù)據(jù)從表格結(jié)構(gòu)變成花括號(hào)結(jié)構(gòu),即將其行索引變成列索引,反之,unstack函數(shù)將數(shù)據(jù)從花括號(hào)結(jié)構(gòu)變成表格結(jié)構(gòu),即要將其中一層的列索引變成行索引。
閱讀文章:python pandas stack和unstack函數(shù)
但是將DataFrame進(jìn)行stack的目的是什么?
總結(jié)
以上是生活随笔為你收集整理的Pandas处理Excel文件源码学习的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Python的__str__()方法
- 下一篇: 为什么Servlet程序的init(Se