AntConc3.2.0的使用说明
來自:
[1]此說明書由華南師范大學外文學院2007研究生張杏娟編寫,導師何安平訂正和補充。
其中限定范圍的檢索方法由香港城市大學D.Lee博士提供,僅此致謝。
?
AntConc3.2.0的使用說明[1]
1.1設置檢索項
(1)單項檢索
檢索結果如圖1.1所示:
圖1.1單項檢索結果
?
(2)多項檢索
除了檢索單個詞項以外,AntConc還具有檢索多個詞項的功能,檢索方法為在檢索項間鍵入“|”符號。
例:要檢索動詞go的各種時態形式,可在“Search Term”中輸入go|went|gone|goes
?
為了限制語境共現的檢索,可以設定一個語境詞在檢索項周邊一定的語境范圍內出現。
例:如要研究 a … of 這一類詞組,可通過AntConc提取所有的詞項,檢索方法如下:
|
點擊“Search Term”旁的,進入“Advanced Search”界面,如圖1.2所示。點擊“Use context words and horizons”,然后在“Context Words”一欄鍵入of,點擊。如要重新設置語境詞,可先點擊清除原來語境詞,后重復以上操作。另外,還需設定語境詞距離檢索項的位置,如本研究中,of在a的右二位置,所以“Content Horizon”確定為,最后點擊;
?
在研究中,如需檢索多個詞項,除了使用“|”以外,也可使用以下方法,尤其適合檢索項數目較多的情況。
例:研究感官動詞watch, sound, feel, hear, smell
feel
feels
felt
,在保存以上新建的文本的盤符路徑點擊文本名,然后點擊;
?
(3)類別檢索
| 符號 | 意義 | 檢索項 | 檢索結果 |
| * | 零個或多個字符 | book* | 提取所有以book打頭的詞,如book、books、booking、bookshop等 |
| *book | 提取所有以book結尾的詞,如book、notebook等 | ||
| *book* | 可以同時提取包括以上兩類詞 | ||
| + | 零個或一個字符 | book+ | 提取所有以book打頭的詞,但之后有零個或一個字母,如book、books |
| ? | 任意一個字符 | ?ough | 提取所有以字母組合ough結尾的,但之前有一個字母的詞,如cough、rough等 |
| @ | 零個或一個詞 | think@of ? | 提取所有含有的詞組,如think of、think highly of等 |
| # | 任意一個詞 | look# | 提取所有與look的搭配,如look after、look at等 |
?
因研究需要,有些語料經過整理加工并附加上各種符號標記,稱為“附碼語料庫”。 如附有詞性標注的LOBTAG和附有錯誤類型標記的CLEC等。檢索時只需鍵入某個標記符號便可提取帶附有該標碼的所有詞。
例:提取LOBTAG語料庫中所有的名詞,只需鍵入*_NN(NN為名詞標碼,關于其他詞性的詳細標記,請參閱何安平,2004,《語料庫語言學與英語教學》一書的附錄113頁。
?
(4)在指定范圍內檢索
a) 在concordance的檢索界面上選擇"Regex" (regular expression),鍵入\[.*\] 為檢索項便可提取語料庫中所有在起止符號“[”和“]”之間的所有文字內容,其他符號照似類推。
b) 在concordance的檢索界面上選擇"Regex" (regular expression),鍵入\[.*write.*\] 為檢索項便可提取語料庫中所有在起止符號“[”和“]”之內的“write”的語境共現行,其他詞項照似類推。鍵入的檢索項計較大小寫,但是可以用通配符*。
?
1.2分析檢索結果
(1)觀察頻數、分布
?
(2)凸顯周邊語境詞
?
|
為了具體某個教學等目的,可通過凸顯檢索項周邊的某些詞匯。方法是選擇“Kwic Sort”, R1和L1分別代表檢索項右方和左方的第一個詞,一次可設置三列凸現詞,均按字母順序排列。檢索結果如圖1.3所示。如想使凸顯內容的顏色一致,可通過設置下拉菜單中的“Color Settings”改變顏色。另外,若要凸顯的部分不是一個詞,而是單詞中的字母,可選擇下拉菜單中的“Concordance”選項中的“Sort by characters instead of words”,如圖1.4所示。
?
圖1.3凸顯周邊語境詞檢索結果
?
(3)提取搭配詞表
通過點擊主界面中的,可獲得檢索項的搭配詞表,同時可以設置搭配詞的位置、出現的最少次數與詞表的排列方式。
例:觀察look右一的搭配詞
圖1.5 提取搭配詞表檢索結果
?
(4)提取搭配短語
另外,也可以使用這一工具來提取搭配詞塊,且可設置檢索項在詞塊中的位置。
例:檢索以ask開頭的搭配詞塊
|
點擊,開始檢索,檢索結果如圖1.6所示,所有的ask被列在詞塊的左邊。
?
(5)隱藏、分類和刪除
“隱藏”是指把檢索結果中的檢索項挖空,可用于教學或測試。具體操作方法如下:
檢索結果如下:
?you always do your own homework? Do you ******* for help when you think it necessary? Do you help
?
?
?
2. 提取詞頻表
2.1單字和N字語詞頻表
單字詞頻表是指目標語料庫的單詞表,且詞頻表的檢索結果是以每個詞的形式及其頻數排列。方法如下:
?
?
?
?
?
?
?
?
?
?
?
?
圖2.1 單字詞頻表檢索結果
N字語詞頻表是指目標語料庫的多字語頻數表。例如,檢索句子“This is a pen”的2字語詞頻表結果為:“this is”、“is a”、“a pen”。N字語詞頻表的提取方法如下:
圖2.2 N字語詞頻表檢索結果
?
2.2詞項重組---詞簇化(lemmatizing)
詞簇化是將同一詞性的某個詞的所有曲折變化形式作削尾處理,并歸為一個詞簇來計算頻數。其好處是可以簡約詞頻表并且引起對構詞法的關注。對詞頻表進行詞簇化的方法如下:
在界面生成詞頻表之后,拉下Tool Preference菜單,選擇Lemma list options, 點擊open 和load,上傳lemma1文檔(可在本網站下載)點擊Apply (如圖2. 3所示)。詞簇化的部分結果見圖2.4.
?
圖2. 3 設置詞簇化界面
圖2.4 詞頻表被詞簇化后的結果(部分)。
圖中1142例a和133例an被歸為同一個詞簇a共1275例。
?
?
3. 提取關鍵詞表
關鍵詞表是指兩個語料庫的詞頻表相比,其中一個明顯地高頻于另一個的那部分詞項表。前一個稱目標語料庫;后一個稱參照語語料庫,通常規模要大一些,以此來凸現目標語料庫的一些特別高頻詞以浮現該語料庫的主題或內容特色。
?
3.1凸顯目標語料庫中顯著性高頻于對照語料庫的詞項
具體操作方法如下:
|
點擊,選擇對照語料,最后點擊;
?
圖3.2 提取關鍵詞表檢索結果
?
?
[1] 此說明書由華南師范大學外文學院2007研究生張杏娟編寫,導師何安平訂正和補充。
其中限定范圍的檢索方法由香港城市大學D.Lee博士提供,僅此致謝。
總結
以上是生活随笔為你收集整理的AntConc3.2.0的使用说明的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是PHP,PHP能干什么,为什么使用
- 下一篇: 回源鉴权