python写内存挂_编写高效内存Python代码的3个技巧
介紹
大多數(shù)時候,我們不需要優(yōu)化Python中的內存使用情況。我們的程序太小而無法占用大量內存,或者我們正在將數(shù)據存儲在程序外部的數(shù)據庫中。無論如何,在某些情況下,我們必須在內存中保留過大的結構或大量的對象。因此,我希望舉例說明可以減少程序內存使用量的做法。
議程
用__slots__限制類字段
Generator惰性加載
用數(shù)組約束元素類型
用__slots__限制類字段
默認情況下,每當您在Python中創(chuàng)建對象時,即使在創(chuàng)建之后,您也能夠將新字段添加到對象。
例如,假設我有一個名為Dog的類:
class?Dog:
def?__init__(self,?name,?age):
self.name?=?name
self.age?=?age
def?main():
dog?=?Dog("James",?5)
dog.breed?=?"Pitbull"
print(dog.breed)
main()
盡管名稱和年齡是我傳遞給構造函數(shù)的唯一字段,但是請注意,在創(chuàng)建dog之后,如何初始化一個名為繁殖的新字段。本質上,dog的字段存儲在內部字典中,可通過.__ dict__訪問,并且在初始化dog.breed時,將其值為“ Pitbull”的字段“ breed”添加到內部字典中。
def?main():
dog?=?Dog("James",?5)
print(dog.__dict__)
'''
output:?{'name':?'James',?'age':?5}
'''
dog.breed?=?"Pitbull"
print(dog.__dict__)
'''
output:?{'name':?'James',?'age':?5,?'breed':?'Pitbull'}
'''
main()
盡管這提供了靈活性,但大多數(shù)時候我們不需要在實例化之外添加新字段。為了節(jié)省內存占用量,我們可以設置Dog的__slots__屬性來預定義其字段。
class?Dog:
__slots__?=?("name",?"age")
def?__init__(self,?name,?age):
self.name?=?name
self.age?=?age
使用__slots__可以防止創(chuàng)建內部字典,從而使我們可以更緊湊地存儲實例字段。但是,現(xiàn)在,我們不再能夠即時創(chuàng)建新字段。
def?main():
dog?=?Dog("James",?5)
dog.breed?=?"Pitbull"
'''
output:?AttributeError:'Dog'?object?has?no?attribute?'breed'
'''
main()
為了測試__slots__的內存使用情況,我創(chuàng)建了100,000個Dog和SlotDog對象。
class?Dog:
def?__init__(self,?name,?age):
self.name?=?name
self.age?=?age
class?SlotDog:
__slots__=("name",?"age")
def?__init__(self,?name,?age):
self.name?=?name
self.age?=?age
然后,我使用memory_profiler分解了創(chuàng)建100,000個對象后內存使用量的增加情況。創(chuàng)建Dog對象后,內存使用量增加了16.5 MiB,而SlotDog對象則增加了5.8 MiB,這表明使用__slots__有了很大的改進。您可以在GitHub上查看創(chuàng)建代碼(https://github.com/Ramko9999/Medium-Memory-Efficient-Python/blob/main/slots_perf.py)。
在必須實例化具有預定字段的大量對象的情況下,使用__slots__將是有益的。
用Genertor惰性加載
當使用大文件或集合時,可能無法加載整個文件或將集合維護在內存中。如果我們可以一次處理多個文件或集合中的一個元素,那就太好了。
進入生成器!
讓我們考慮一個例子。說我需要獲取前n個奇數(shù)進行處理。自然地,我們可以創(chuàng)建一個列表并附加前n個奇數(shù)。
def?get_odds_list(n):
odds?=?[]
num?=?1
for?i?in?range(n):
odds.append(num)
num?+=?2
return?odds
但是,如果我們要處理前幾百萬的賠率,那么在內存中維護此列表將變得昂貴。更好的方法是在我們計算賠率時利用生成器迭代賠率,而不是計算和存儲所有百萬賠率。
這是上面的函數(shù)作為生成器的樣子:
def?get_odds_generator(n):
num?=?1
for?i?in?range(n):
yield?num
num?+=?2
odds?=?get_odds_generator(1000000)
當我們初始化賠率時,尚未計算任何奇數(shù)。此刻的賠率只是一個迭代器,一個值序列。為了訪問迭代器中的元素,我們必須在迭代器上調用next。顧名思義,next返回序列中的下一個值。
神奇之處在于yield關鍵字:它使函數(shù)成為生成器。本質上,當按賠率調用next時,生成器get_odds_generator將評估其代碼,直到達到y(tǒng)ield為止。然后,生成器將返回該值,并且其狀態(tài)將凍結。然后,再次調用next時,生成器將從中斷狀態(tài)重新開始評估其代碼。
def?get_odds_generator(n):
num?=?1
for?i?in?range(n):
yield?num
num?+=?2
odds?=?get_odds_generator(1000000)
first?=?next(odds)
'''
first?=?1
Explanation:?num?is?1.?We?enter?the?for?loop?and?immediately?yield?num
'''
second?=?next(odds)
'''
second?=?3
Explanation:?num?is?1.?We?add?2?to?num,?so?its?now?3.
We?go?the?next?iteration?of?the?loop?and?yield?num
'''
third?=?next(odds)
'''
third?=?5
Explanation:?num?is?3.?We?add?2?to?num,?so?its?now?5.
We?go?to?the?next?iteration?of?the?loop?and?yield?num
'''
我們還可以按照以下方式瀏覽生成器生成的值。
odds?=?get_odds_generator(1000000)
for?odd?in?odds:
pass?//process?the?odd
我們可以使用生成器來計算賠率。因此,我們不需要任何額外的內存來存儲賠率。
使用生成器的一個警告是,我們將無法獲取先前的元素或跳過元素的序列。如果您需要訪問以前的元素,則最好直接使用列表。
用數(shù)組約束元素類型
盡管許多人認為列表在Python中是數(shù)組,但實際上存在一個單獨的數(shù)組模塊。列表和數(shù)組之間的核心區(qū)別在于,數(shù)組僅限于一種類型的元素。
我們可以使用多種類型的值在Python中創(chuàng)建列表。
lst?=?[1.0,?1,?{},?"hi"]
數(shù)組不是這種情況。我們必須使用類型代碼指定數(shù)組中元素的類型。類型代碼是代表數(shù)組類型的字符:“ i”代表整數(shù),“ b”代表字符,依此類推…
from?array?import?array
arr?=?array('i',?[])?#?create?an?array?of?integers
arr.append(4)?#?append?4?to?arr
arr.append('')?#?type?error:?integer?is?required?not?string
數(shù)組與列表有很多共同的方法,例如append和pop(文檔)。數(shù)組的主要優(yōu)點是它們更加緊湊。為了測試這一點,我制作了一個包含一百萬個整數(shù)的列表和數(shù)組,發(fā)現(xiàn)該列表的內存使用量增加了19.5 MiB,而數(shù)組僅增加了4 MiB。簽出測量代碼(代碼)。
如果您有大量相同類型的數(shù)據序列,請考慮使用數(shù)組。
結論
過早的優(yōu)化是萬惡之源。
-唐納德·埃文·克努斯
我已經展示了可以減少內存占用的多種實踐,從使用__slots__到數(shù)組不等。僅在真正需要優(yōu)化內存的最壞情況下考慮使用這些做法。在大多數(shù)情況下,不需要__slots__和數(shù)組。另一方面,標準API很可能已經使用了生成器,因此您可以放輕松。
【編輯推薦】
【責任編輯:華軒 TEL:(010)68476606】
點贊 0
總結
以上是生活随笔為你收集整理的python写内存挂_编写高效内存Python代码的3个技巧的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 美股周一:特斯拉涨逾5%,马斯克重夺全球
- 下一篇: 游戏第一神U上新!AMD锐龙9 7950