读取csv和tsv文件以及两者的相互转换
生活随笔
收集整理的這篇文章主要介紹了
读取csv和tsv文件以及两者的相互转换
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
一、csv和tsv的區別
二、tsv文件和csv文件的相互轉換
1、讀取tsv文件,并將其改寫成csv文件
2、讀取csv文件,并將其改寫成tsv文件
?補充理解:
一、csv和tsv的區別
(1)csv文件:逗號分隔符文件,可以使用excel打開
(2)tsv文件:制表符Tab分隔文件,可以使用文本文檔打開
二、tsv文件和csv文件的相互轉換
1、讀取tsv文件,并將其改寫成csv文件
import pandas as pd data = pd.read_csv(r'E:\XX.tsv', sep='\t') data.to_csv(r'E:\XX.csv')注意:?
2、讀取csv文件,并將其改寫成tsv文件
import pandas as pd data = pd.read_csv(r"E:\XX.csv", sep=',', encoding='utf-8') data.to_csv(r"E:\XX.tsv", index=False, sep='\t', encoding='utf-8')?補充理解:
(1) read_csv函數中的sep參數是指定文本的分隔符的,如果分隔符指定錯誤,在讀取數據的時候,每一行數據將連成一片。
(2) encoding代表文件的編碼格式,常用的編碼有utf-8、utf-16、gbk、gb2312、gb18030等。如果編碼指定錯誤數據將無法讀取,IPython解釋器會報解析錯誤
(3) index=False可用于強制不使用第一列作為索引。換句話說,當index=False時,tsv文件沒有第一列的索引。
(4) sep最好不要缺省,因為缺少sep后,data作為一個dataframe會將第一行作為一個整體,導致只有一個key,難以對列進行處理。如下,如果沒有sep的結果為:
data = pd.read_csv(r'E:\soundscapes.tsv')結果:
Index(['filename\tevent_label'], dtype='object')?若加上sep,
data = pd.read_csv(r'E:\soundscapes.tsv', sep='\t')結果:
Index(['filename', 'event_label'], dtype='object')總結
以上是生活随笔為你收集整理的读取csv和tsv文件以及两者的相互转换的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 贪心算法之埃及分数问题
- 下一篇: 小程序抽奖效果demo滚筒抽奖3d动画抽