當(dāng)前位置：首頁 > 编程语言 > python >内容正文

python

Python学习笔记：Io编程序列化

發(fā)布時間：2025/3/15 python 14 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python学习笔记：Io编程序列化小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

前言

最近在學(xué)習(xí)深度學(xué)習(xí)，已經(jīng)跑出了幾個模型，但Pyhton的基礎(chǔ)不夠扎實，因此，開始補習(xí)Python了，大家都推薦廖雪峰的課程，因此，開始了學(xué)習(xí)，但光學(xué)有沒有用，還要和大家討論一下，因此，寫下這些帖子，廖雪峰的課程連接在這里：廖雪峰
Python的相關(guān)介紹，以及它的歷史故事和運行機制，可以參見這篇：python介紹
Python的安裝可以參見這篇：Python安裝
Python的運行模式以及輸入輸出可以參見這篇：Python IO
Python的基礎(chǔ)概念介紹，可以參見這篇：Python 基礎(chǔ)
Python字符串和編碼的介紹，可以參見這篇：Python字符串與編碼
Python基本數(shù)據(jù)結(jié)構(gòu)：list和tuple介紹，可以參見這篇：Python list和tuple
Python控制語句介紹：ifelse，可以參見這篇：Python 條件判斷
Python控制語句介紹：循環(huán)實現(xiàn)，可以參見這篇：Python循環(huán)語句
Python數(shù)據(jù)結(jié)構(gòu)：dict和set介紹Python數(shù)據(jù)結(jié)構(gòu)dict和set
Python函數(shù)相關(guān)：Python函數(shù)
Python高階特性：Python高級特性
Python高階函數(shù)：Python高階函數(shù)
Python匿名函數(shù)：Python匿名函數(shù)
Python裝飾器：Python裝飾器
Python偏函數(shù)：Python偏函數(shù)
Python模塊：Python模塊
Python面向?qū)ο缶幊?#xff08;1）：Python面向?qū)ο?
Python面向?qū)ο缶幊?#xff08;2）：Python面向?qū)ο?#xff08;2）
Python面向?qū)ο缶幊?#xff08;3）：Python面向?qū)ο?#xff08;3）
Python面向?qū)ο缶幊?#xff08;4）：Pyhton面向?qū)ο?#xff08;4）
Python面向?qū)ο蟾呒壘幊?#xff08;上）：Python面向?qū)ο蟾呒壘幊?#xff08;上）
Python面向?qū)ο蟾呒壘幊?#xff08;中上）：Python面向?qū)ο蟾呒壘幊?#xff08;中上）
Python面向?qū)ο蟾呒壘幊?#xff08;中下）：Python面向?qū)ο蟾呒壘幊?#xff08;中下）
Python面向?qū)ο蟾呒壘幊?#xff08;完）：Python面向?qū)ο蟾呒壘幊?#xff08;完）
Python錯誤調(diào)試（起）：Python調(diào)試：起
Python錯誤調(diào)試（承）：Python調(diào)試：承
Python錯誤調(diào)試（轉(zhuǎn)）：Python調(diào)試：轉(zhuǎn)
Python錯誤調(diào)試（合）：python調(diào)試：合
Python文件IO編程：Python文件IO
Python文件IO編程2：Python文件IO2
目錄：

前言
序列化
- JSON
- JSON進階
- 小結(jié)

序列化

在程序運行的過程中，所有的變量都是在內(nèi)存中，比如，定義一個dict：

d = dict(name='Bob', age=20, score=88)

可以隨時修改變量，比如把name改成’Bill’，但是一旦程序結(jié)束，變量所占用的內(nèi)存就被操作系統(tǒng)全部回收。如果沒有把修改后的’Bill’存儲到磁盤上，下次重新運行程序，變量又被初始化為’Bob’。

我們把變量從內(nèi)存中變成可存儲或傳輸?shù)倪^程稱之為序列化，在Python中叫pickling，在其他語言中也被稱之為serialization，marshalling，flattening等等，都是一個意思。

序列化之后，就可以把序列化后的內(nèi)容寫入磁盤，或者通過網(wǎng)絡(luò)傳輸?shù)絼e的機器上。

反過來，把變量內(nèi)容從序列化的對象重新讀到內(nèi)存里稱之為反序列化，即unpickling。

Python提供了pickle模塊來實現(xiàn)序列化。

首先，我們嘗試把一個對象序列化并寫入文件：

>>> import pickle >>> d = dict(name='Bob', age=20, score=88) >>> pickle.dumps(d) b'\x80\x03}q\x00(X\x03\x00\x00\x00ageq\x01K\x14X\x05\x00\x00\x00scoreq\x02KXX\x04\x00\x00\x00nameq\x03X\x03\x00\x00\x00Bobq\x04u.'

pickle.dumps()方法把任意對象序列化成一個bytes，然后，就可以把這個bytes寫入文件。或者用另一個方法pickle.dump()直接把對象序列化后寫入一個file-like Object：

>>> f = open('dump.txt', 'wb') >>> pickle.dump(d, f) >>> f.close()

看看寫入的dump.txt文件，一堆亂七八糟的內(nèi)容，這些都是Python保存的對象內(nèi)部信息。

當(dāng)我們要把對象從磁盤讀到內(nèi)存時，可以先把內(nèi)容讀到一個bytes，然后用pickle.loads()方法反序列化出對象，也可以直接用pickle.load()方法從一個file-like Object中直接反序列化出對象。我們打開另一個Python命令行來反序列化剛才保存的對象：

>>> f = open('dump.txt', 'rb') >>> d = pickle.load(f) >>> f.close() >>> d {'age': 20, 'score': 88, 'name': 'Bob'}

變量的內(nèi)容又回來了！

當(dāng)然，這個變量和原來的變量是完全不相干的對象，它們只是內(nèi)容相同而已。

Pickle的問題和所有其他編程語言特有的序列化問題一樣，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的數(shù)據(jù)，不能成功地反序列化也沒關(guān)系。

JSON

如果我們要在不同的編程語言之間傳遞對象，就必須把對象序列化為標準格式，比如XML，但更好的方法是序列化為JSON，因為JSON表示出來就是一個字符串，可以被所有語言讀取，也可以方便地存儲到磁盤或者通過網(wǎng)絡(luò)傳輸。JSON不僅是標準格式，并且比XML更快，而且可以直接在Web頁面中讀取，非常方便。

JSON表示的對象就是標準的JavaScript語言的對象，JSON和Python內(nèi)置的數(shù)據(jù)類型對應(yīng)如下： JSON類型 Python類型 {} dict [] list "string" str 1234.56 int或float true/false True/False null None

Python內(nèi)置的json模塊提供了非常完善的Python對象到JSON格式的轉(zhuǎn)換。我們先看看如何把Python對象變成一個JSON：

>>> import json >>> d = dict(name='Bob', age=20, score=88) >>> json.dumps(d) '{"age": 20, "score": 88, "name": "Bob"}'

dumps()方法返回一個str，內(nèi)容就是標準的JSON。類似的，dump()方法可以直接把JSON寫入一個file-like Object。
帶s的是序列化，不帶s的是文件流對象。
要把JSON反序列化為Python對象，用loads()或者對應(yīng)的load()方法，前者把JSON的字符串反序列化，后者從file-like Object中讀取字符串并反序列化：

>>> json_str = '{"age": 20, "score": 88, "name": "Bob"}' >>> json.loads(json_str) {'age': 20, 'score': 88, 'name': 'Bob'}

由于JSON標準規(guī)定JSON編碼是UTF-8，所以我們總是能正確地在Python的str與JSON的字符串之間轉(zhuǎn)換。

JSON進階

Python的dict對象可以直接序列化為JSON的{}，不過，很多時候，我們更喜歡用class表示對象，比如定義Student類，然后序列化：

import jsonclass Student(object):def __init__(self, name, age, score):self.name = nameself.age = ageself.score = scores = Student('Bob', 20, 88) print(json.dumps(s))

運行代碼，毫不留情地得到一個TypeError：

Traceback (most recent call last):... TypeError: <__main__.Student object at 0x10603cc50> is not JSON serializable

錯誤的原因是Student對象不是一個可序列化為JSON的對象。

如果連class的實例對象都無法序列化為JSON，這肯定不合理！

別急，我們仔細看看dumps()方法的參數(shù)列表，可以發(fā)現(xiàn)，除了第一個必須的obj參數(shù)外，dumps()方法還提供了一大堆的可選參數(shù)：

官方文檔

這些可選參數(shù)就是讓我們來定制JSON序列化。前面的代碼之所以無法把Student類實例序列化為JSON，是因為默認情況下，dumps()方法不知道如何將Student實例變?yōu)橐粋€JSON的{}對象。

可選參數(shù)default就是把任意一個對象變成一個可序列為JSON的對象，我們只需要為Student專門寫一個轉(zhuǎn)換函數(shù)，再把函數(shù)傳進去即可：

def student2dict(std):return {'name': std.name,'age': std.age,'score': std.score}

不是類的方法。

這樣，Student實例首先被student2dict()函數(shù)轉(zhuǎn)換成dict，然后再被順利序列化為JSON：

>>> print(json.dumps(s, default=student2dict)) {"age": 20, "name": "Bob", "score": 88}

不過，下次如果遇到一個Teacher類的實例，照樣無法序列化為JSON。我們可以偷個懶，把任意class的實例變?yōu)閐ict：

print(json.dumps(s, default=lambda obj: obj.__dict__))

因為通常class的實例都有一個_dict__屬性，它就是一個dict，用來存儲實例變量。也有少數(shù)例外，比如定義了__slots_的class。

同樣的道理，如果我們要把JSON反序列化為一個Student對象實例，loads()方法首先轉(zhuǎn)換出一個dict對象，然后，我們傳入的object_hook函數(shù)負責(zé)把dict轉(zhuǎn)換為Student實例：

def dict2student(d):return Student(d['name'], d['age'], d['score'])

運行結(jié)果如下：

>>> json_str = '{"age": 20, "score": 88, "name": "Bob"}' >>> print(json.loads(json_str, object_hook=dict2student)) <__main__.Student object at 0x10cd3c190>

打印出的是反序列化的Student實例對象。

小結(jié)

Python語言特定的序列化模塊是pickle，但如果要把序列化搞得更通用、更符合Web標準，就可以使用json模塊。
json模塊的dumps()和loads()函數(shù)是定義得非常好的接口的典范。當(dāng)我們使用時，只需要傳入一個必須的參數(shù)。但是，當(dāng)默認的序列化或反序列機制不滿足我們的要求時，我們又可以傳入更多的參數(shù)來定制序列化或反序列化的規(guī)則，既做到了接口簡單易用，又做到了充分的擴展性和靈活性。

總結(jié)

以上是生活随笔為你收集整理的Python学习笔记：Io编程序列化的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Python学习笔记：IO编程Strin
下一篇：语法和c区别_史冠新 | 汉语语法单位辨