python:dataframe保存成csv文件和读取
生活随笔
收集整理的這篇文章主要介紹了
python:dataframe保存成csv文件和读取
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、從csv文件讀取數據為dataframe
函數原型: pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False,infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer',thousands=None, decimal=b'.', lineterminator=None, quotechar='"',quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)常用參數:filepath_or_buffer : 類型str,代表CSV文件地址。sep : 類型str, 默認值為‘,’,用于指定分隔符。如果不指定參數,則會嘗試使用逗號分隔。header : 類型為int或者int的列表,它指定用來作為列名行號,然后數據從行號的下一行開始讀取。 默認情況下header是根據參數names(如下) 來推斷header的值。如果names為None,則等價于header=0,默認把文件中第一行作為列名,數據從第一行開始讀取。如果names顯示地傳入, 則等價于header=None,則數據從0行開始讀取。如果傳入header=0,names不為None,則將替換原有的列名。header參數可以是一個list。 例如:[0,1,3],這個list表示將文件中的這些行作為列標題(意味著每一列有多個標題),介于中間的行將被忽略掉(例如本例中的2; 本例中的數據1,2,4行將被作為多級標題出現,第3行數據將被丟棄,dataframe的數據從第5行開始。)。names : 一個數組, 默認為None。列名列表,如果數據文件中沒有列標題行,就需要執行header=None。usecols : 一個數組, 默認為None,返回數據列一個子集。如果傳入字符,則列名需要與表中列名對應。如果傳入整數列表,則表示列的索引值。 例如:usecols有效參數可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。prefix : 類型str, 默認為None。在沒有列標題時,給列添加前綴。例如:添加‘X’ 成為 X0, X1, ...engine : {‘c’, ‘python’},可選。使用的分析引擎。可以選擇C或者是python。C引擎快但是Python引擎功能更加完備。nrows : 類型int, 默認為None。需要讀取的行數(從文件頭開始算起)。iterator : 類型boolean, 默認為False。返回一個TextFileReader 對象,以便逐塊處理文件。二、dataframe保存為csv文件
函數原型: DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,escapechar=None, decimal='.') 常用參數:path_or_buf : 文件路徑,如果沒有指定則將會直接返回字符串的 jsonsep : 輸出文件的字段分隔符,默認為 “,”na_rep : 用于替換空數據的字符串,默認為''float_format : 設置浮點數的格式(幾位小數點)columns : 要寫的列header : 是否保存列名,默認為 True ,保存index : 是否保存索引,默認為 True ,保存總結
以上是生活随笔為你收集整理的python:dataframe保存成csv文件和读取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Scala,Spark和IDEA学习笔记
- 下一篇: Spark:获取dataframe某列最