當前位置：首頁 > 编程语言 > python >内容正文

python

python：dataframe保存成csv文件和读取

發布時間：2025/3/20 python 31 豆豆

生活随笔收集整理的這篇文章主要介紹了 python：dataframe保存成csv文件和读取小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、從csv文件讀取數據為dataframe

函數原型： pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False,infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer',thousands=None, decimal=b'.', lineterminator=None, quotechar='"',quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)常用參數：filepath_or_buffer : 類型str，代表CSV文件地址。sep : 類型str, 默認值為‘,’，用于指定分隔符。如果不指定參數，則會嘗試使用逗號分隔。header : 類型為int或者int的列表,它指定用來作為列名行號，然后數據從行號的下一行開始讀取。默認情況下header是根據參數names（如下）來推斷header的值。如果names為None，則等價于header=0，默認把文件中第一行作為列名，數據從第一行開始讀取。如果names顯示地傳入，則等價于header=None，則數據從0行開始讀取。如果傳入header=0，names不為None，則將替換原有的列名。header參數可以是一個list。例如：[0,1,3]，這個list表示將文件中的這些行作為列標題（意味著每一列有多個標題），介于中間的行將被忽略掉（例如本例中的2；本例中的數據1,2,4行將被作為多級標題出現，第3行數據將被丟棄，dataframe的數據從第5行開始。）。names : 一個數組, 默認為None。列名列表，如果數據文件中沒有列標題行，就需要執行header=None。usecols : 一個數組, 默認為None，返回數據列一個子集。如果傳入字符，則列名需要與表中列名對應。如果傳入整數列表，則表示列的索引值。例如：usecols有效參數可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。prefix : 類型str, 默認為None。在沒有列標題時，給列添加前綴。例如：添加‘X’ 成為 X0, X1, ...engine : {‘c’, ‘python’},可選。使用的分析引擎。可以選擇C或者是python。C引擎快但是Python引擎功能更加完備。nrows : 類型int, 默認為None。需要讀取的行數（從文件頭開始算起）。iterator : 類型boolean, 默認為False。返回一個TextFileReader 對象，以便逐塊處理文件。

二、dataframe保存為csv文件

函數原型： DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,escapechar=None, decimal='.') 常用參數：path_or_buf : 文件路徑，如果沒有指定則將會直接返回字符串的 jsonsep : 輸出文件的字段分隔符，默認為 “,”na_rep : 用于替換空數據的字符串，默認為''float_format : 設置浮點數的格式（幾位小數點）columns : 要寫的列header : 是否保存列名，默認為 True ，保存index : 是否保存索引，默認為 True ，保存

總結

以上是生活随笔為你收集整理的python：dataframe保存成csv文件和读取的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Scala，Spark和IDEA学习笔记
下一篇： Spark：获取dataframe某列最