Python3 文件操作
Python3 文件操作
講師:張學(xué)亮 百度:學(xué)亮編程手記 網(wǎng)易云課堂:@張學(xué)亮
open() 方法
Python open() 方法用于打開一個文件,并返回文件對象,在對文件進行處理過程都需要使用到這個函數(shù),如果該文件無法被打開,會拋出 OSError。
**注意:**使用 open() 方法一定要保證關(guān)閉文件對象,即調(diào)用 close() 方法。
open() 函數(shù)常用形式是接收兩個參數(shù):文件名(file)和模式(mode)。
open(file, mode='r')完整的語法格式為:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)參數(shù)說明:
- file: 必需,文件路徑(相對或者絕對路徑)。
- mode: 可選,文件打開模式
- buffering: 設(shè)置緩沖
- encoding: 一般使用utf8
- errors: 報錯級別
- newline: 區(qū)分換行符
- closefd: 傳入的file參數(shù)類型
- opener
mode 參數(shù)有:
| t | 文本模式 (默認)。 |
| x | 寫模式,新建一個文件,如果該文件已存在則會報錯。 |
| b | 二進制模式。 |
| + | 打開一個文件進行更新(可讀可寫)。 |
| U | 通用換行模式(Python 3 不支持)。 |
| r | 以只讀方式打開文件。文件的指針將會放在文件的開頭。這是默認模式。 |
| rb | 以二進制格式打開一個文件用于只讀。文件指針將會放在文件的開頭。這是默認模式。一般用于非文本文件如圖片等。 |
| r+ | 打開一個文件用于讀寫。文件指針將會放在文件的開頭。 |
| rb+ | 以二進制格式打開一個文件用于讀寫。文件指針將會放在文件的開頭。一般用于非文本文件如圖片等。 |
| w | 打開一個文件只用于寫入。如果該文件已存在則打開文件,并從開頭開始編輯,即原有內(nèi)容會被刪除。如果該文件不存在,創(chuàng)建新文件。 |
| wb | 以二進制格式打開一個文件只用于寫入。如果該文件已存在則打開文件,并從開頭開始編輯,即原有內(nèi)容會被刪除。如果該文件不存在,創(chuàng)建新文件。一般用于非文本文件如圖片等。 |
| w+ | 打開一個文件用于讀寫。如果該文件已存在則打開文件,并從開頭開始編輯,即原有內(nèi)容會被刪除。如果該文件不存在,創(chuàng)建新文件。 |
| wb+ | 以二進制格式打開一個文件用于讀寫。如果該文件已存在則打開文件,并從開頭開始編輯,即原有內(nèi)容會被刪除。如果該文件不存在,創(chuàng)建新文件。一般用于非文本文件如圖片等。 |
| a | 打開一個文件用于追加。如果該文件已存在,文件指針將會放在文件的結(jié)尾。也就是說,新的內(nèi)容將會被寫入到已有內(nèi)容之后。如果該文件不存在,創(chuàng)建新文件進行寫入。 |
| ab | 以二進制格式打開一個文件用于追加。如果該文件已存在,文件指針將會放在文件的結(jié)尾。也就是說,新的內(nèi)容將會被寫入到已有內(nèi)容之后。如果該文件不存在,創(chuàng)建新文件進行寫入。 |
| a+ | 打開一個文件用于讀寫。如果該文件已存在,文件指針將會放在文件的結(jié)尾。文件打開時會是追加模式。如果該文件不存在,創(chuàng)建新文件用于讀寫。 |
| ab+ | 以二進制格式打開一個文件用于追加。如果該文件已存在,文件指針將會放在文件的結(jié)尾。如果該文件不存在,創(chuàng)建新文件用于讀寫。 |
默認為文本模式,如果要以二進制模式打開,加上 b 。
file 對象
file 對象使用 open 函數(shù)來創(chuàng)建,下表列出了 file 對象常用的函數(shù):
| 1 | file.close()關(guān)閉文件。關(guān)閉后文件不能再進行讀寫操作。 |
| 2 | file.flush()刷新文件內(nèi)部緩沖,直接把內(nèi)部緩沖區(qū)的數(shù)據(jù)立刻寫入文件, 而不是被動的等待輸出緩沖區(qū)寫入。 |
| 3 | file.fileno()返回一個整型的文件描述符(file descriptor FD 整型), 可以用在如os模塊的read方法等一些底層操作上。 |
| 4 | file.isatty()如果文件連接到一個終端設(shè)備返回 True,否則返回 False。 |
| 5 | file.next()**Python 3 中的 File 對象不支持 next() 方法。**返回文件下一行。 |
| 6 | [file.read(size])從文件讀取指定的字節(jié)數(shù),如果未給定或為負則讀取所有。 |
| 7 | [file.readline(size])讀取整行,包括 “\n” 字符。 |
| 8 | [file.readlines(sizeint])讀取所有行并返回列表,若給定sizeint>0,返回總和大約為sizeint字節(jié)的行, 實際讀取值可能比 sizeint 較大, 因為需要填充緩沖區(qū)。 |
| 9 | [file.seek(offset, whence])移動文件讀取指針到指定位置 |
| 10 | file.tell()返回文件當(dāng)前位置。 |
| 11 | [file.truncate(size])從文件的首行首字符開始截斷,截斷文件為 size 個字符,無 size 表示從當(dāng)前位置截斷;截斷之后后面的所有字符被刪除,其中 Widnows 系統(tǒng)下的換行代表2個字符大小。 |
| 12 | file.write(str)將字符串寫入文件,返回的是寫入的字符長度。 |
| 13 | file.writelines(sequence)向文件寫入一個序列字符串列表,如果需要換行則要自己加入每行的換行符。 |
一、文件操作
使用python來讀寫文件使用open()函數(shù)來打開一個文件,獲取到文件句柄,然后通過文件句柄就可以進行各種操作了。根據(jù)打開方式不同能夠執(zhí)行的操作也有差異。
打開文件的方式:r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b默認使用的是r(只讀)模式
二、只讀操作(r, rb)
file = open("文件名", mode="r", encoding="utf-8") content = file.read() print(content) file.close()要注意encoding表示編碼集
rb讀取出來的數(shù)據(jù)是bytes類型,在rb模式下,不能選擇encoding字符集
file = open("文件名", mode="rb") content = file.read() print(content) file.close()rb的作用是在讀取非文本文件的時候,比如讀取音視頻等信息的時候就要用到rb
讀取文件的方法:
1.read()將文件中的內(nèi)容全部讀取出來;占內(nèi)存。如果文件過大,容易導(dǎo)致內(nèi)存崩潰
2.read(n)讀取n個字符;注意,如果再次讀取就會在當(dāng)前位置繼續(xù)去讀而不是從頭讀,如果是rb模式則讀取出來的是n個字節(jié)
3.readline()一次讀取一行數(shù)據(jù),每次讀取出來的數(shù)據(jù)結(jié)尾都會有一個\n,所以要使用strip()方法來去掉\n或者空格
4.readlines()將每一行形成一個元素,放到一個列表中;將所有內(nèi)容都讀取出來,所以也是占內(nèi)存大
5.循環(huán)讀取,這是最建議使用的方式,每次讀取一行內(nèi)容。
注意:讀取完的文件句柄一定要關(guān)閉 f.close()
三、寫模式(w, wb)
寫的時候,如果沒有文件,則會創(chuàng)建文件,如果文件存在,則將原來文件中原內(nèi)容刪除,再寫入新內(nèi)容
file = open("文件名", mode="w", encoding="utf-8") file.write("寫內(nèi)容") file.flush() file.close()wb模式下可以不指定打開文件的編碼,但是在寫文件的時候必須將字符串轉(zhuǎn)化成utf8的bytes數(shù)據(jù)
file = open("文件名", mode="wb") file.write("寫內(nèi)容".encode("utf-8")) file.flush() file.close()四、追加(a, ab)
在追加模式下,我們寫入的內(nèi)容會追加在文件結(jié)尾
五、讀寫模式(r+, r+b)
對于讀寫模式,必須是先讀,因為默認光標(biāo)是在開頭的,準備讀取的;當(dāng)讀完了之后再進行寫入,使用頻率最高的模式就是r+
file = open("文件名", mode="r+", encoding="utf-8") content = file.read() file.write("寫內(nèi)容") print(content) file.flush() file.close()六、寫讀(w+, w+b)
先將所有的內(nèi)容清空,然后寫入,最后讀取,但是讀取的內(nèi)容是空的,不常用。
file = open("文件名", mode="w+", encoding="utf-8") file.write("寫內(nèi)容") content = file.read() print(content) file.flush() file.close()七、追加讀(a+)
a+模式下,不論先讀還是后讀,都讀取不到數(shù)據(jù);
八、其他相關(guān)操作
1.seek(n)
光標(biāo)移動到n位置,注意,移動的單位是byte,所以如果是utf-8的中文部分要是3的倍數(shù)。
通常我們使用seek都是移動到開頭或者結(jié)尾
移動到開頭:seek(0)
移動到結(jié)尾:seek(0,2)
seek的第二個參數(shù)表示的是從哪個位置進行偏移,默認是0表示從開頭,1表示當(dāng)前位置,2表示結(jié)尾
file = open("文件名", mode="r+", encoding="utf-8") file.seek(0) # 光標(biāo)移動到開頭 content = file.read() # 讀取內(nèi)容,此時光標(biāo)移動到結(jié)尾 print(content) file.seek(0) # 再次將光標(biāo)移動到開頭 file.seek(0,2) # 將光標(biāo)移動到結(jié)尾 content2 = file.read() # 讀取內(nèi)容,什么都沒有 print(content2)file.seek(0) # 移動到開頭 file.write("新寫內(nèi)容") # 寫入信息,此時光標(biāo)在9,中文3*3 file.flush() file.close()2.tell()
可以獲取到當(dāng)前光標(biāo)在什么位置
file = open("文件名", mode="r+", encoding="utf-8") file.seek(0) # 光標(biāo)移動到開頭 content = file.read() # 讀取內(nèi)容,此時光標(biāo)移動到結(jié)尾 print(content) file.seek(0) # 再次將光標(biāo)移動到開頭 file.seek(0,2) # 將光標(biāo)移動到結(jié)尾 content2 = file.read() # 讀取內(nèi)容,什么都沒有 print(content2) file.seek(0) file.write("寫內(nèi)容") print(file.tell()) # 光標(biāo)位置 file.flush() file.close()3.truncate()截斷文件
如果想做截斷的時候,要先移動光標(biāo),挪動到想要截斷的位置再進行截斷;
truncate(n),如果給出了n,則從開頭進行截斷,如果不給n,則從當(dāng)前位置截斷,后面的內(nèi)容將會被刪除;
注意:在r+模式下,如果讀取了內(nèi)容,不論讀取內(nèi)容多少,光標(biāo)顯示的是多少,再寫入或者操作文件的時候都是在結(jié)尾進行的操作。
九、修改文件以及另一種打開文件的方式
文件修改只能將文件中的內(nèi)容讀取到內(nèi)存中,將信息修改完畢后再將源文件刪除,將新文件的名字改成老文件的名字
import os with open("文件名", mode="r", encoding="utf-8") as file1,\ open("文件名_new", mode="w", encoding="UTF-8") as file2:for line in f1:new_line = line.replace("大白梨", "冰糖葫蘆")file2.write(new_line) os.remove("文件名") # 刪除源?文件 os.rename("文件名_new", "文件名") # 重命名新?文件代碼演示:
總結(jié)
以上是生活随笔為你收集整理的Python3 文件操作的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python爬虫开发:正则表达式re的使
- 下一篇: sublime text使用正则表达式批