关于EOF,转自新浪微博
? 本文轉(zhuǎn)自http://blog.sina.com.cn/s/blog_7714171f0101798y.html
?????
EOF 是 End Of File 的縮寫(xiě)。
在C語(yǔ)言中,它是在標(biāo)準(zhǔn)庫(kù)中定義的一個(gè)宏。
人們經(jīng)常誤認(rèn)為 EOF 是從文件中讀取的一個(gè)字符(牢記)。其實(shí),EOF 不是一個(gè)字符,它被定義為是 int 類(lèi)型的一個(gè)負(fù)數(shù)(比如 -1)。EOF 也不是文件中實(shí)際存在的內(nèi)容。EOF 也不是只表示讀文件到了結(jié)尾這一狀態(tài)(這種狀態(tài)可以用 feof() 來(lái)檢測(cè)),它還能表示 I/O 操作中的讀、寫(xiě)錯(cuò)誤(通常可以用 ferror() 來(lái)檢測(cè))以及其它一些關(guān)聯(lián)操作的錯(cuò)誤狀態(tài)。
一、getchar的兩點(diǎn)總結(jié):
1.getchar是以行為單位進(jìn)行存取的。
當(dāng)用getchar進(jìn)行輸入時(shí),如果輸入的第一個(gè)字符為有效字符(即輸入不是文件結(jié)束符EOF,Windows下為組合鍵 Ctrl+Z,Unix/Linux下為組合鍵Ctrl+D),那么只有當(dāng)最后一個(gè)輸入字符為換行符'/n'(也可以是文件結(jié)束符EOF,EOF將在后面 討論)時(shí),getchar才會(huì)停止執(zhí)行,整個(gè)程序?qū)?huì)往下執(zhí)行。譬如下面程序段:
?
| while((c =getchar())!=EOF){ |
?
執(zhí)行程序,輸入:abc,然后回車(chē)。則程序就會(huì)去執(zhí)行puchar(c),然后輸出abc,這個(gè)地方不要忘了,系統(tǒng)輸出的還有一個(gè)回車(chē)。然后可以繼續(xù)輸入,再次遇到換行符的時(shí)候,程序又會(huì)把那一行的輸入的字符輸出在終端上。
對(duì)于getchar,肯定很多初學(xué)的朋友會(huì)問(wèn),getchar不是以字符為單位讀取的嗎?那么,既然我輸入了第一個(gè)字符a,肯定滿(mǎn)足while循環(huán)(c = getchar()) != EOF的條件阿,那么應(yīng)該執(zhí)行putchar(c)在終端輸出一個(gè)字符a。不錯(cuò),我在用getchar的時(shí)候也是一直這么想的,但是程序就偏偏不著樣執(zhí) 行,而是必需讀到一個(gè)換行符或者文件結(jié)束符EOF才進(jìn)行一次輸出。對(duì)這個(gè)問(wèn)題的一個(gè)解釋是,在大師編寫(xiě)C的時(shí)候,當(dāng)時(shí)并沒(méi)有所謂終端輸入的概念,所有的輸 入實(shí)際上都是按照文件進(jìn)行讀取的,文件中一般都是以行為單位的。因此,只有遇到換行符,那么程序會(huì)認(rèn)為輸入結(jié)束,然后采取執(zhí)行程序的其他部分。同時(shí),輸入 是按照文件的方式存取的,那么要結(jié)束一個(gè)文件的輸入就需用到EOF(Enf Of File). 這也就是為什么getchar結(jié)束輸入退出時(shí)要用EOF的原因。
2.getchar()的返回值一般情況下是字符,但也可能是負(fù)值,即返回EOF。
這里要強(qiáng)調(diào)的一點(diǎn)就是,getchar函數(shù)通常返回終端所輸入的字符,這些字符系統(tǒng)中對(duì)應(yīng)的ASCII值都是非負(fù)的。因此,很多時(shí)候,我們會(huì)寫(xiě)這樣的兩行代碼:
?
| char c; |
?
這樣就很有可能出現(xiàn)問(wèn)題。因?yàn)間etchar函數(shù)除了返回終端輸入的字符外,在遇到Ctrl+D(Linux下)即文件結(jié)束符EOF 時(shí),getchar()的返回EOF,這個(gè)EOF在函數(shù)庫(kù)里一般定義為-1。因此,在這種情況下,getchar函數(shù)返回一個(gè)負(fù)值,把一個(gè)負(fù)值賦給一個(gè) char型的變量是不正確的。為了能夠讓所定義的變量能夠包含getchar函數(shù)返回的所有可能的值,正確的定義方法如下(K&R C中特別提到了這個(gè)問(wèn)題):
?
| int c; |
?
二、EOF的兩點(diǎn)總結(jié)(主要指普通終端中的EOF)
1.EOF作為文件結(jié)束符時(shí)的情況:
EOF雖然是文件結(jié)束符,但并不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠?qū)崿F(xiàn)文件結(jié)束的功能,只有在下列的條件下,才作為文件結(jié)束符。
(1)遇到getcahr函數(shù)執(zhí)行時(shí),要輸入第一個(gè)字符時(shí)就直接輸入Ctrl+D,就可以跳出getchar(),去執(zhí)行程序的其他部分;
(2)在前面輸入的字符為換行符時(shí),接著輸入Ctrl+D;
(3)在前面有字符輸入且不為換行符時(shí),要連著輸入兩次Ctrl+D,這時(shí)第二次輸入的Ctrl+D起到文件結(jié)束符的功能,至于第一次的Ctrl+D的作用將在下面介紹。
其實(shí),這三種情況都可以總結(jié)為只有在getchar()提示新的一次輸入時(shí),直接輸入Ctrl+D才相當(dāng)于文件結(jié)束符。
2.EOF作為行結(jié)束符時(shí)的情況,這時(shí)候輸入Ctrl+D并不能結(jié)束getchar(),而只能引發(fā)getchar()提示下一輪的輸入。
這種情況主要是在進(jìn)行g(shù)etchar()新的一行輸入時(shí),當(dāng)輸入了若干字符(不能包含換行符)之后,直接輸入Ctrl+D,此時(shí)的Ctrl+D并不是文件 結(jié)束符,而只是相當(dāng)于換行符的功能,即結(jié)束當(dāng)前的輸入。以上面的代碼段為例,如果執(zhí)行時(shí)輸入abc,然后Ctrl+D,程序輸出結(jié)果為:
abcabc
注意:第一組abc為從終端輸入的,然后輸入Ctrl+D,就輸出第二組abc,同時(shí)光標(biāo)停在第二組字符的c后面,然后可以進(jìn)行新一次的輸入。這時(shí)如果再次輸入Ctrl+D,則起到了文件結(jié)束符的作用,結(jié)束getchar()。
如果輸入abc之后,然后回車(chē),輸入換行符的話(huà),則終端顯示為:
abc? ?? ?? ?//第一行,帶回車(chē)
abc? ?? ?? ?//第二行
? ?? ?? ?? ?? ?//第三行
其中第一行為終端輸入,第二行為終端輸出,光標(biāo)停在了第三行處,等待新一次的終端輸入。
從這里也可以看出Ctrl+D和換行符分別作為行結(jié)束符時(shí),輸出的不同結(jié)果。
EOF的作用也可以總結(jié)為:當(dāng)終端有字符輸入時(shí),Ctrl+D產(chǎn)生的EOF相當(dāng)于結(jié)束本行的輸入,將引起getchar()新一輪的輸入;當(dāng)終端沒(méi)有字符 輸入或者可以說(shuō)當(dāng)getchar()讀取新的一次輸入時(shí),輸入Ctrl+D,此時(shí)產(chǎn)生的EOF相當(dāng)于文件結(jié)束符,程序?qū)⒔Y(jié)束getchar()的執(zhí)行。
?
【補(bǔ)充】本文第二部分中關(guān)于EOF的總結(jié)部分,適用于終端驅(qū)動(dòng)處于一次一行的模式下。也就是雖然getchar()和putchar()確實(shí)是按照每次一個(gè)字符 進(jìn)行的。但是終端驅(qū)動(dòng)處于一次一行的模式,它的輸入只有到“/n”或者EOF時(shí)才結(jié)束,因此,終端上得到的輸出也都是按行的。
如果要實(shí)現(xiàn)終端在讀一個(gè)字符就結(jié)束輸入的話(huà),下面的程序是一種實(shí)現(xiàn)的方法(參考《C專(zhuān)家編程》,略有改動(dòng))
|
|
編譯運(yùn)行該程序,則當(dāng)如入一個(gè)字符時(shí),直接出處一個(gè)字符,然后程序結(jié)束。
由此可見(jiàn),由于終端驅(qū)動(dòng)的模式不同,造成了getchar()輸入結(jié)束的條件不一樣。普通模式下需要回車(chē)或者EOF,而在一次一個(gè)字符的模式下,則輸入一個(gè)字符之后就結(jié)束了。
?
(1) 字節(jié)的讀取
在正常的情況下, getc 以 unsigned char 的方式讀取文件流, 擴(kuò)張為一個(gè)整數(shù),并返
回. 換言之, getc 從文件流中取一個(gè)字節(jié), 并加上24個(gè)零,成為一個(gè)小于256的整數(shù),
然后返回.
int c;
while ((c = fgetc (rfp))!= -1) // -1就是 EOF
fputc (c, wfp);
上面 fputc 中的 c 雖然是整數(shù), 但在 fputc 將其寫(xiě)入文件流之前, 又把整數(shù)的高24位
去掉了, 因此 fgetc, putc 配合能夠?qū)崿F(xiàn)文件復(fù)制. 到目前為止, 把 c 定義為
char仍然是可行的, 但下面我們將看到,把 c 定義為 int 是為正確判段文件是否結(jié)束.
(2) 判斷文件結(jié)束.
多數(shù)人認(rèn)為文件中有一個(gè)EOF,用于表示文件的結(jié)尾. 但這個(gè)觀(guān)點(diǎn)實(shí)際上是錯(cuò)誤的,在文
件所包含的數(shù)據(jù)中,并沒(méi)有什么文件結(jié)束符. 對(duì)getc 而言, 如果不能從文件中讀取,
則返回一個(gè)整數(shù) -1,這就是所謂的EOF. 返回 EOF 無(wú)非是出現(xiàn)了兩種情況,一是文件已
經(jīng)讀完; 二是文件讀取出錯(cuò),反正是讀不下去了.
請(qǐng)注意: 在正常讀取的情況下, 返回的整數(shù)均小于256, 即0x0~0xFF. 而讀不出返回的
是 0xFFFFFFFF. 但, 假如你用fputc把 0xFFFFFFFF 往文件里頭寫(xiě), 高24位被屏蔽,寫(xiě)入的將
是 0xFF. // lixforalpha 請(qǐng)注意這一點(diǎn)
(3) 0xFF 會(huì)使我們混淆嗎?
不會(huì), 前提是, 接收返回值的 c 要按原型定義為 int.
如果下一個(gè)讀取的字符將為 0xFF, 則
int c;
c = fgetc (rfp); // c = 0x000000FF;
if (c != -1)? ? // 當(dāng)然不等, -1 是 0xFFFFFFFF
fputc (wfp);? ?// 噢, OXFF 復(fù)制成功.
字符0xFF, 其本身并不是EOF.
(4) 將 c 定義 char
假定下一個(gè)讀取的字符為 0xFF 則
char c;
c = fgetc (rfp); // fgetc(rfp)的值為 0x000000FF, 暗中降為字節(jié), c = 0xFF
if (c != -1)? ? // 字符與整數(shù)比較? c 被帶符號(hào)(signed)擴(kuò)展為0xFFFFFFFF, 喔噢,
條件成立,文件復(fù)制提前退出.
while ((c=fgetc(rfp))!=EOF) 中的判別條件成立, 文件復(fù)制結(jié)束! 意外中止.
(5) 將 c 定義為 unsigned char;
當(dāng)讀到文件末尾, 返回 EOF 也就是 -1 時(shí),
unsigned char c;
c = fgetc (rfp); // fgetc (rfp)的值為EOF,即-1,即0xFFFFFFFF, 降格為字節(jié), c=0xFF
if ( c!= -1)??// c 被擴(kuò)展為 0x000000FF, 永遠(yuǎn)不回等于 0xFFFFFFFF
所以這次雖然能正確復(fù)制 0xFF, 但卻不能判斷文件結(jié)束. 事實(shí)上,在 c 為 uchar 時(shí),
c != -1 是永遠(yuǎn)成立的, 一個(gè)高質(zhì)量的編譯器, 比如 gcc會(huì)在編譯時(shí)指出這一點(diǎn).
(6) 為何需要feof?
FILE *fp;
fp 指向一個(gè)很復(fù)雜的數(shù)據(jù)結(jié)構(gòu), feof 是通過(guò)這個(gè)結(jié)構(gòu)中的標(biāo)志來(lái)判斷文件是否結(jié)束的.
如果文件用 fgetc 讀取, 剛好把最后一個(gè)字符讀出時(shí), fp 中的EOF標(biāo)志不會(huì)打開(kāi),這時(shí)
用feof判斷,將會(huì)得到文件尚未結(jié)束的結(jié)論.
fgetc 返回 -1 時(shí), 我們?nèi)詿o(wú)法確信文件已經(jīng)結(jié)束, 因?yàn)榭赡苁亲x取錯(cuò)誤! 這時(shí)我們
需要 feof 和 ferror.
?
?
總結(jié):EOF并不是存在于文件中的,而是一種狀態(tài),當(dāng)讀到文件末尾或者讀取出錯(cuò)時(shí)就會(huì)返回這個(gè)值來(lái)判斷文件結(jié)束。(即即使讀取錯(cuò)誤可能也被認(rèn)為文件結(jié)束,所以就需要用feof 和 ferror來(lái)判斷是不是真的文件結(jié)束了)
當(dāng)用getchar(c)時(shí),即使c定義成字符型,也可以結(jié)束,主要是c與-1比較時(shí),c也會(huì)從char轉(zhuǎn)換為整型值。
寫(xiě)個(gè)小程序驗(yàn)證了一下
?
[cpp] view plaincopyprint?
?
轉(zhuǎn)載于:https://www.cnblogs.com/jkred369/p/3603063.html
總結(jié)
以上是生活随笔為你收集整理的关于EOF,转自新浪微博的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: redis清空缓存
- 下一篇: select,epoll的比较