python基础:迭代器、生成器(yield)详细解读
1. 迭代器
? ? ? 迭代器是訪問集合元素的一種方式。迭代器對象從集合的第一個(gè)元素開始訪問,知道所有的元素被訪問完結(jié)束。迭代器只能往前不會(huì)后退,不過這也沒什么,因?yàn)槿藗兒苌僭诘局型笸恕?/p>
1.1 使用迭代器的優(yōu)點(diǎn)
? ? ? 對于原生支持隨機(jī)訪問的數(shù)據(jù)結(jié)構(gòu)(如tuple、list),迭代器和經(jīng)典for循環(huán)的索引訪問相比并無優(yōu)勢,反而丟失了索引值(可以使用內(nèi)建函數(shù)enumerate()找回這個(gè)索引值)。但對于無法隨機(jī)訪問的數(shù)據(jù)結(jié)構(gòu)(比如set)而言,迭代器是唯一的訪問元素的方式。
? ? ? 另外,迭代器的一大優(yōu)點(diǎn)是不要求事先準(zhǔn)備好整個(gè)迭代過程中所有的元素。迭代器僅僅在迭代到某個(gè)元素時(shí)才計(jì)算該元素,而在這之前或之后,元素可以不存在或者被銷毀。這個(gè)特點(diǎn)使得它特別適合用于遍歷一些巨大的或是無限的集合,比如幾個(gè)G的文件,或是斐波那契數(shù)列等等。
? ? ? 迭代器更大的功勞是提供了一個(gè)統(tǒng)一的訪問集合的接口,只要定義了__iter__()方法對象,就可以使用迭代器訪問。
迭代器有兩個(gè)基本的方法
- next方法:返回迭代器的下一個(gè)元素
- __iter__方法:返回迭代器對象本身
下面用生成斐波那契數(shù)列為例子,說明為何用迭代器
代碼1
def fab(max): n, a, b = 0, 0, 1 while n < max: print b a, b = b, a + b n = n + 1直接在函數(shù)fab(max)中用print打印會(huì)導(dǎo)致函數(shù)的可復(fù)用性變差,因?yàn)閒ab返回None。其他函數(shù)無法獲得fab函數(shù)返回的數(shù)列。
代碼2
def fab(max): L = []n, a, b = 0, 0, 1 while n < max: L.append(b) a, b = b, a + b n = n + 1return L代碼2滿足了可復(fù)用性的需求,但是占用了內(nèi)存空間,最好不要。
代碼3
對比
for i in range(1000): pass for i in xrange(1000): pass前一個(gè)返回1000個(gè)元素的列表,而后一個(gè)在每次迭代中返回一個(gè)元素,因此可以使用迭代器來解決復(fù)用可占空間的問題
class Fab(object): def __init__(self, max): self.max = max self.n, self.a, self.b = 0, 0, 1 def __iter__(self): return self def next(self): if self.n < self.max: r = self.b self.a, self.b = self.b, self.a + self.b self.n = self.n + 1 return r raise StopIteration()執(zhí)行
| 1 2 3 4 5 6 7 8 9 | >>> for key in Fabs(5): ????print?key ????? 1 1 2 3 5 |
Fabs 類通過 next() 不斷返回?cái)?shù)列的下一個(gè)數(shù),內(nèi)存占用始終為常數(shù)
1.2 使用迭代器
使用內(nèi)建的工廠函數(shù)iter(iterable)可以獲取迭代器對象:
| 1 2 3 4 | >>> lst = range(5) >>> it = iter(lst) >>> it <listiterator object at?0x01A63110> |
使用next()方法可以訪問下一個(gè)元素:
| 1 2 3 4 5 6 | >>> it.next() 0 >>> it.next() 1 >>> it.next() 2 |
python處理迭代器越界是拋出StopIteration異常
| 1 2 3 4 5 6 7 8 9 10 11 12 | >>> it.next() 3 >>> it.next <method-wrapper?'next'?of listiterator object at?0x01A63110> >>> it.next() 4 >>> it.next() Traceback (most recent call last): ??File?"<pyshell#27>", line?1, in <module> ????it.next() StopIteration |
了解了StopIteration,可以使用迭代器進(jìn)行遍歷了
lst = range(5) it = iter(lst) try:while True:val = it.next()print val except StopIteration:pass結(jié)果
| 1 2 3 4 5 6 | >>> 0 1 2 3 4 |
事實(shí)上,因?yàn)榈魅绱似毡?#xff0c;python專門為for關(guān)鍵字做了迭代器的語法糖。在for循環(huán)中,Python將自動(dòng)調(diào)用工廠函數(shù)iter()獲得迭代器,自動(dòng)調(diào)用next()獲取元素,還完成了檢查StopIteration異常的工作。如下
>>> a = (1, 2, 3, 4) >>> for key in a:print key1 2 3 4首先python對關(guān)鍵字in后的對象調(diào)用iter函數(shù)迭代器,然后調(diào)用迭代器的next方法獲得元素,直到拋出StopIteration異常。
1.3 定義迭代器
下面一個(gè)例子——斐波那契數(shù)列
# -*- coding: cp936 -*- class Fabs(object):def __init__(self,max):self.max = maxself.n, self.a, self.b = 0, 0, 1 #特別指出:第0項(xiàng)是0,第1項(xiàng)是第一個(gè)1.整個(gè)數(shù)列從1開始def __iter__(self):return selfdef next(self):if self.n < self.max:r = self.bself.a, self.b = self.b, self.a + self.bself.n = self.n + 1return rraise StopIteration()print Fabs(5) for key in Fabs(5):print key結(jié)果
| 1 2 3 4 5 6 | <__main__.Fabs object at?0x01A63090> 1 1 2 3 5 |
?
2. 生成器
? ? ? 帶有 yield 的函數(shù)在 Python 中被稱之為 generator(生成器),幾個(gè)例子說明下(還是用生成斐波那契數(shù)列說明)
可以看出代碼3遠(yuǎn)沒有代碼1簡潔,生成器(yield)既可以保持代碼1的簡潔性,又可以保持代碼3的效果
代碼4
def fab(max):n, a, b = 0, 0, 1while n < max:yield ba, b = b, a + bn = n + 1執(zhí)行
| 1 2 3 4 5 6 7 8 9 | >>> for n in fab(5): ????print?n ????? 1 1 2 3 5 |
? ? ? 簡單地講,yield 的作用就是把一個(gè)函數(shù)變成一個(gè) generator,帶有 yield 的函數(shù)不再是一個(gè)普通函數(shù),Python 解釋器會(huì)將其視為一個(gè) generator,調(diào)用 fab(5) 不會(huì)執(zhí)行 fab 函數(shù),而是返回一個(gè)?iterable 對象!在 for 循環(huán)執(zhí)行時(shí),每次循環(huán)都會(huì)執(zhí)行 fab 函數(shù)內(nèi)部的代碼,執(zhí)行到?yield b 時(shí),fab 函數(shù)就返回一個(gè)迭代值,下次迭代時(shí),代碼從 yield b 的下一條語句繼續(xù)執(zhí)行,而函數(shù)的本地變量看起來和上次中斷執(zhí)行前是完全一樣的,于是函數(shù)繼續(xù)執(zhí)行,直到再次遇到 yield。看起來就好像一個(gè)函數(shù)在正常執(zhí)行的過程中被 yield 中斷了數(shù)次,每次中斷都會(huì)通過 yield 返回當(dāng)前的迭代值。
也可以手動(dòng)調(diào)用 fab(5) 的 next() 方法(因?yàn)?fab(5) 是一個(gè) generator 對象,該對象具有 next() 方法),這樣我們就可以更清楚地看到 fab 的執(zhí)行流程:
| 1 2 3 4 5 6 7 8 9 10 11 12 13 | >>> f = fab(3) >>> f.next() 1 >>> f.next() 1 >>> f.next() 2 >>> f.next() Traceback (most recent call last): ??File?"<pyshell#62>", line?1, in <module> ????f.next() StopIteration |
return作用
在一個(gè)生成器中,如果沒有return,則默認(rèn)執(zhí)行到函數(shù)完畢;如果遇到return,如果在執(zhí)行過程中 return,則直接拋出 StopIteration 終止迭代。例如
| 1 2 3 4 5 6 7 8 9 | >>> s = fab(5) >>> s.next() 1 >>> s.next() Traceback (most recent call last): ??File?"<pyshell#66>", line?1, in <module> ????s.next() StopIteration |
代碼5??文件讀取
def read_file(fpath): BLOCK_SIZE = 1024 with open(fpath, 'rb') as f: while True: block = f.read(BLOCK_SIZE) if block: yield block else: return如果直接對文件對象調(diào)用 read() 方法,會(huì)導(dǎo)致不可預(yù)測的內(nèi)存占用。好的方法是利用固定長度的緩沖區(qū)來不斷讀取文件內(nèi)容。通過 yield,我們不再需要編寫讀文件的迭代類,就可以輕松實(shí)現(xiàn)文件讀取。
?3.列表生成式→生成器
只要把一個(gè)列表生成式的[]改成(),就創(chuàng)建了一個(gè)generator:
1 #列表生成式 2 li=[x*x for x in range(10) if x%2==0] #占用內(nèi)存 3 4 5 #生成器 6 g=(x*x for x in range(10) if x%2==0) 7 #用for來循環(huán)訪問,不用考慮異常溢出問題 8 for i in g: 9 print(i) View Code4.迭代器讀取文件
使用迭代器一個(gè)顯而易見的好處就是:每次只從對象中讀取一條數(shù)據(jù),不會(huì)造成內(nèi)存的過大開銷。
?
比如要逐行讀取一個(gè)文件的內(nèi)容,利用readlines()方法,我們可以這么寫:
?
| 1 2 | for line in open("test.txt").readlines(): print line |
?
這樣雖然可以工作,但不是最好的方法。因?yàn)樗麑?shí)際上是把文件一次加載到內(nèi)存中,然后逐行打印。當(dāng)文件很大時(shí),這個(gè)方法的內(nèi)存開銷就很大了。
?
利用file的迭代器,我們可以這樣寫:
?
| 1 2 | for line in open("test.txt"): #use file iterators print line |
?
這是最簡單也是運(yùn)行速度最快的寫法,他并沒顯式的讀取文件,而是利用迭代器每次讀取下一行。
?
轉(zhuǎn)載于:https://www.cnblogs.com/yizhenfeng168/p/6916729.html
總結(jié)
以上是生活随笔為你收集整理的python基础:迭代器、生成器(yield)详细解读的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Request的getParameter
- 下一篇: ZOJ Monthly, Novembe