當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

Pandas处理Excel文件源码学习

發(fā)布時(shí)間：2025/4/5 编程问答 15 豆豆

生活随笔收集整理的這篇文章主要介紹了 Pandas处理Excel文件源码学习小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

pandas.read_excel

pandas.read_excel API

pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None) 讀取Excel文件并轉(zhuǎn)化為DataFrame結(jié)構(gòu)

Parameters

io: str, bytes, ExcelFile, xlrd.Book, path object, or file-like object

header: int, list of int, default 0
默認(rèn)將第0行設(shè)置為DataFrame的列標(biāo)簽，也可指定任一行為列標(biāo)簽；如果excel文件中沒(méi)有列標(biāo)簽，則將其設(shè)置為None

index_col: int, list of int, default None
默認(rèn)用序列[0-n]作為DataFrame的行標(biāo)簽

Example

新建一個(gè)temp.xlsx文件

import pandas as pd pd.read_excel('./temp.xlsx')Name Value 0 string1 1 1 string2 2 2 #Comment 3 df = pd.read_excel('./temp.xlsx', index_col=None, header=0) print(df) df.shapeName Value 0 string1 1 1 string2 2 2 #Comment 3 (3, 2)

pandas中，行列標(biāo)簽不計(jì)入df的shape中

pandas.DataFrame.set_index

pandas.DataFrame.set_index API:

DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 將已存在的列設(shè)置為DataFrame的行標(biāo)簽

Parameters

1. keys: label or array-like or list of labels/arrays 這個(gè)參數(shù)可以是單個(gè)列標(biāo)簽、含有多個(gè)列標(biāo)簽的列表、與DataFrame行數(shù)相同的一維Series數(shù)組、含有列標(biāo)簽和Series數(shù)組的列表……2. drop: bool, default True 刪除原先的列，并將其作為新的行索引

Example

import pandas as pd df = pd.DataFrame({'month': [1, 4, 7, 10],'year': [2012, 2014, 2013, 2014],'sale': [55, 40, 84, 31]}) dfmonth year sale 0 1 2012 55 1 4 2014 40 2 7 2013 84 3 10 2014 31 df.set_index('month')year sale month 1 2012 55 4 2014 40 7 2013 84 10 2014 31 df.set_index([pd.Index([1, 2, 3, 4]), 'year'])month saleyear 1 2012 1 55 2 2014 4 40 3 2013 7 84 4 2014 10 31

numpy.sum()

numpy.sum() API
在某個(gè)axis上對(duì)numpy數(shù)組求和

sum(a, axis=None, dtype=None, out=None, keepdims=np._NoValue)

a是求和對(duì)象
axis=0: 沿著行做垂直方向的運(yùn)算,將Numpy數(shù)組壓縮成一行
axis=1: 沿著列做水平方向的運(yùn)算,將Numpy數(shù)組壓縮成一列

閱讀文章: numpy.sum()的使用

pandas.DataFrame.stack

pandas.DataFrame.stack API

stack的意思是堆疊，堆積
DataFrame結(jié)構(gòu)中，表格在行列方向上均有索引，而將DataFrame進(jìn)行Stack后，只有列方向上的索引，這類似于層次化的Series結(jié)構(gòu)。stack函數(shù)會(huì)將數(shù)據(jù)從表格結(jié)構(gòu)變成花括號(hào)結(jié)構(gòu)，即將其行索引變成列索引，反之，unstack函數(shù)將數(shù)據(jù)從花括號(hào)結(jié)構(gòu)變成表格結(jié)構(gòu)，即要將其中一層的列索引變成行索引。

閱讀文章：python pandas stack和unstack函數(shù)

但是將DataFrame進(jìn)行stack的目的是什么？

總結(jié)

以上是生活随笔為你收集整理的Pandas处理Excel文件源码学习的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Python的__str__()方法
下一篇：为什么Servlet程序的init(Se