python3 yield 大文件_详解Python3中yield生成器的用法
任何使用yield的函數都稱之為生成器,如:
def count(n):
while n > 0:
yield n #生成值:n
n -= 1
另外一種說法:生成器就是一個返回迭代器的函數,與普通函數的區別是生成器包含yield語句,更簡單點理解生成器就是一個迭代器。
使用yield,可以讓函數生成一個序列,該函數返回的對象類型是"generator",通過該對象連續調用next()方法返回序列值。
c = count(5)
c.__next__() #python 3.4.3要使用c.__next__()不能使用c.next()
>>> 5
c.__next__()
>>>4
生成器函數只有在調用__next()__方法的時候才開始執行函數里面的語句,比如:
def count(n):
print ( "cunting" )
while n > 0:
yield n #生成值:n
n -= 1
在調用count函數時:c=count(5),并不會打印"counting"只有等到調用c.__next__()時才真正執行里面的語句。每次調用__next__()方法時,count函數會運行到語句yield n處為止,__next__()的返回值就是生成值n,再次調用__next__()方法時,函數繼續執行yield之后的語句(熟悉Java的朋友肯定知道Thread.yield()方法,作用是暫停當前線程的運行,讓其他線程執行),如:
def count(n):
print ("cunting" )
while n > 0:
print ('before yield')
yield n #生成值:n
n -= 1
print ('after yield' )
上述代碼在第一次調用__next__方法時,并不會打印"after yield"。如果一直調用__next__方法,當執行到沒有可迭代的值后,程序就會報錯:
Traceback (most recent call last): File "", line 1, in StopIteration
所以一般不會手動的調用__next__方法,而使用for循環:
for i in count(5):
print (i),
實例: 用yield生成器模擬Linux中命令:tail -f file | grep python 用于查找監控日志文件中出現有python字樣的行。
import time
def tail(f):
f.seek(0,2)#移動到文件EOF
while True:
line = f.readline() #讀取文件中新的文本行
if not line:
time.sleep(0.1)
continue
yield line
def grep(lines,searchtext):
for line in lines:
if searchtext in line:
yield line
flog = tail(open('warn.log'))
pylines = grep(flog,'python')
for line in pylines:
print ( line, )
#當此程序運行時,若warn.log文件中末尾有新增一行,且該一行包含python,該行就會被打印出來
#若打開warn.log時,末尾已經有了一行包含python,該行不會被打印,因為上面是f.seek(0,2)移動到了文件EOF處
#故,上面程序實現了tail -f warn.log | grep 'python'的功能,動態實時檢測warn.log中是否新增現了
#新的行,且該行包含python
用yield實現斐波那契數列:
def fibonacci():
a=b=1
yield a
yield b
while True:
a,b = b,a+b
yield b
調用:
for num in fibonacci():
if num > 100:
break
print (num),
yield中return的作用:
作為生成器,因為每次迭代就會返回一個值,所以不能顯示的在生成器函數中return 某個值,包括None值也不行,否則會拋出“SyntaxError”的異常,但是在函數中可以出現單獨的return,表示結束該語句。
通過固定長度的緩沖區不斷讀文件,防止一次性讀取出現內存溢出的例子:
def read_file(path):
size = 1024
with open(path,'r') as f:
while True:
block = f.read(SIZE)
if block:
yield block
else:
return
如果是在函數中return 具體某個值,就直接拋異常了
>>> def test_return():
... yield 4
... return 0
...
File "", line 3
SyntaxError: 'return' with argument inside generator
例子
下面來看幾段代碼示例:
例1:
>>> def mygenerator():
... print 'start...'
... yield 5
...
>>> mygenerator() //在此處調用,并沒有打印出start...說明存在yield的函數沒有被運行,即暫停
>>> mygenerator().next() //調用next()即可讓函數運行.
start...
5
>>>
如一個函數中出現多個yield則next()會停止在下一個yield前,見例2:
例2:
>>> def fun2():
... print 'first'
... yield 5
... print 'second'
... yield 23
... print 'end...'
...
>>> g1 = fun2()
>>> g1.next() //第一次運行,暫停在yield 5
first
5
>>> g1.next() //第二次運行,暫停在yield 23
second
23
>>> g1.next() //第三次運行,由于之后沒有yield,再次next()就會拋出錯誤
end...
Traceback (most recent call last):
File "", line 1, in
StopIteration
>>>
為什么yield 5會輸出5,yield 23會輸出23?
我們猜測可能是因為yield是表達式,存在返回值.
那么這是否可以認為yield 5的返回值一定是5嗎?實際上并不是這樣,這個與send函數存在一定的關系,這個函數實質上與next()是相似的,區別是send是傳遞yield表達式的值進去,而next不能傳遞特定的值,只能傳遞None進去,因此可以認為g.next()和g.send(None)是相同的。見例3:
例3:
>>> def fun():
... print 'start...'
... m = yield 5
... print m
... print 'middle...'
... d = yield 12
... print d
... print 'end...'
...
>>> m = fun() //創建一個對象
>>> m.next() //會使函數執行到下一個yield前
start...
5
>>> m.send('message') //利用send()傳遞值
message //send()傳遞進來的
middle...
12
>>> m.next()
None //可見next()返回值為空
end...
Traceback (most recent call last):
File "", line 1, in
StopIteration
本文標題: 詳解Python3中yield生成器的用法
本文地址: http://www.cppcns.com/jiaoben/python/129931.html
總結
以上是生活随笔為你收集整理的python3 yield 大文件_详解Python3中yield生成器的用法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 路由器设置提高网速(路由器这样设置,不仅
- 下一篇: latex subsection_利用L