计算机检索系统功能,文学多功能计算机自动检索系统研究
我國的網絡技術正在向世界先進國際的技術不斷靠近,新的信息技術已經推動了眾多領域的變革,利用計算機對文獻進行信息檢索是當今信息時代提高工作效率的重要方式。
尤其在文學文獻檢索的應用上, 更是體現出了獲取信息量大、檢索的速度快、準確性高、效率高的特點,這種檢索方式已經徹底顛覆了人工書本式檢索方式。 網絡的飛速發展,文學檢索的方式由此也變的十分簡單,因為互聯網資源融合整個世界的文學資源, 中外文學作品被收入到網絡這個能夠實現共享的空間, 只要通過網絡就能查找到自己想要得到的資源。 近年來,我國開始對計算機檢索功能進行開發和研究,在很多領域均取得了較好的效果,但是,對于文學藝術類的資源進行檢索功能的開發仍然處于一個初步發展的階段。 但是,我國深圳大學率先開展了這方面的工作,他們研制出來的多功能計算機自動檢索系統,經過實踐和應用,取得了非常好的成果。 筆者在此文中就以該系統對古典文學作品《紅樓夢》所獲得效果為參照,對文學文獻的檢索應用做一個探討。
一、自動檢索系統對文學文獻檢索的效果
我國合肥大學和深圳大學的中文系先后與上個世紀 90年代后期開始進行計算機自動檢索系統的研究工作,從事系統研制的科技人員在文學文獻的選擇上確立了較為復雜的古典文學作品,經過認真選擇,研究人員認為,在我國古典文學作品中,曹雪芹的《紅樓夢》,涉及的人物眾多,語言的應用具有豐富性,其中有醫學,教育。 詩歌音樂、繪畫等等的內容,以小說《紅樓夢》研究為藍本,對于體現計算機自動檢索系統的實際應用效果和穩定性具有一定的代表性,從而可以為進一步對語言、文學以及其它文化學科的研究提供重要的參考資料。 實驗表明,研究者使用文學文獻檢索系統對小說《紅樓夢》 進行檢索, 可以在五分鐘的時間內篩選到 150-180 個專題范圍內的相關內容。 就小說中的語言詞語的檢索, 這個系統可以篩查到小說作品中任何一個四字格成語、其中包括作品語言使用的介詞、量詞、副詞、助詞、連詞等出現在那個章節和回次、同時也可以準確到這些詞出現在那個頁碼和第幾行。 檢索系統還能夠顯現出這些成語和詞語在整部作品中出現的次數,同時還會檢索出詞語所處的語言環境。 這些檢索的信息呈現在人們的面前,顯然對人們就詞語或者成語在小說中表達的意義有一個認識,這種檢索方式便于研究者對作品進行深入分析。 對于小說中檢索出來的信息,以及使用特點的研究,會有利于對我國近現代語言的研究、有利于對作家語言的研究,在此基礎上,各類語文詞典的編纂工作也將變的得心應手。 研究者還就單字和分詞類進行了檢索研究,例如將小說《紅樓夢》中含有介詞的“將”和“把”兩個介詞搜索出來,對由這兩個字組成的句子找出來進行分析,系統總共在整部小說里搜到帶有“把”字的句子 1000 多個, 含有介詞“將”字的句式有 86 個。 在小說的前八十回的檢索里,兩種句式檢索結果基本是一致的。 《紅樓夢》 的后四十回中, 使用“將”字的句式遠遠落后于“把” 字句的使用頻率。 這就可以判定小說在寫作時間上有很大的差異, 通過語言檢索, 我們也能夠體會到小說語言風格不同, 對小說創作者的認識上存在疑慮,因此有的研究者會認為,小說的完成不僅僅是曹雪芹一個人。 通過前八十回“把”字句式的使用與后四十回出現的頻率非常少的實際,加上語言的風格分析,就足以說明,小說《紅樓夢》前八十回的語言特色要比后四十回豐富生動很多 .
在文學研究方面,通過檢索修辭手法的應用,發現在《紅樓夢》中常用的體例。 例如小說中的各種事物描寫、段落如何劃分,文學人物出現的時間,所有人物出現在那種場合,包括作家所做詩詞的體現在那個章節里,都有明確的指示。 像小說中人物的外貌描寫,可以區分為體態、面相、神情、習慣性動作等多個小類,對人物的心理描寫上可以區分為歡喜、哀傷、愁苦、憤怒、 討厭等多個小類型, 在檢索關于愛情描寫方面的對象是可以發現賈寶玉和林黛玉、柳湘蓮和尤三姐。 女仆紅玉和賈蕓、襲人與賈璉、司棋和潘又安等多個小類。 從這些劃分開來的小類型來進行檢索,不僅能夠有效區分小說當中的各類描寫,同時可以按照序列讓檢索這進行有效地歸類。 讓文學文獻檢索方法更有接近性,滿足教學和學習的需要。 更重要的是,通過這樣歸類型檢索,我們就能從文學角度對《紅樓夢》這部作品進行深入的分析和研究。
二、小說《紅樓夢》為文學文獻檢索提供了參照
在古典小說《紅樓夢》中,基本上涵蓋了中國古代的歷史文化、生活情狀。 在小說中,有關生活方面的描述無所不及,體現在園林方面的,通過檢索系統的檢索,就會檢索到亭臺樓閣、院落、房屋、花草樹木、門柱對聯的相關資料;關于小說作品里所有人物的穿戴和服裝,服飾方面的內容我們在書里可以查找到各種裙子、袍子、各種色彩的襖和坎肩,其中有人有褲、靴、帶、冠的資料;由于小說描述的是貴族大戶人家。 因此對飲食的敘述語言也很多,在小說里,可以檢索到與飲食有關的酒、菜、湯、粥、糕點等很多的詞語資料等等。 通過文字語言的檢索,不僅能夠使各種類型的語言檢索出來,而且通過計算機自動檢索、分類、整理,經過計算機屏幕的顯示, 將所有檢索到的資料自動打印出來,這就是計算機檢索的一個大概過程,也是人通過計算機對中國古典文學進行的綜合研究。 河南省濟南市科委和北京理工大學計算機學院進行聯合, 構建起了計算機《紅樓夢》數據庫系統,通過兩方人員的認真研究和實踐,實現了對古典名著《紅樓夢》的各個層次、各個類別的檢索; 其中的男性人物和女性人物檢索, 各種生活用品的檢索, 小說作品的事件檢索, 詩詞歌賦的檢索, 習慣用語的檢索等等,同時在數據庫中輸入了小說中的 525 位人物的全部檔案資料。 通過大量的工作,文學文獻的檢索工作不僅全部實現了對作品的歸類,而且在檢索中還發現小說當中存在的兩個為被人發現的兩個“謎局”.
第一個被檢索解開的就是人物的年齡“謎”. 許多研究紅雪的學者一致對林黛玉進入到賈府是多大年紀有爭議,究竟是 13 歲還是 11 歲、是 9 歲還是 8 歲一時間說不清楚,研究者通過將這些說法都輸入計算機,經過逐條篩選分析,最終確定林黛玉進入到京城的賈府時時 9 歲。 第二是揭開了“怡紅夜宴圖”的謎團。 實際上,在一百多年的時間里,這幅圖一直在困擾著紅學家,對于參加夜宴的究竟有多少人,每個桌子上坐著幾個人,還有就是在宴席上的人怎么排定座次。 河南省濟南市科委編制出一套完整的程序, 用計算機模擬出了小說《紅樓夢》中“怡紅夜宴圖”所描繪的所有類別,用檢索的辦法解開了參加夜宴人數和宴席座次排列的謎底。
三、文學文獻自動檢索系統的逐字檢索效果
由于文學作品的內容繁雜,因此,對文學作品進行檢索系統的研究,不僅可以提升檢索的實際應用效果,同時可以得到較為有效的數據參照,以利于多文學作品的研究。 中科院語言研究所在對檢索系統的研究中,將唐代無名作者的詩集《寒山子詩》列入到逐字檢索系統研究,分門別類對各類語言詞語進行數據化處理,同時,在總結成果的基礎上,對《寒山子詩》的全部作品進行了逐字索引編制,總結出來的結果是: 全書共收錄的詩歌是 365 首, 可以檢索確認的總字數為15591 個。 關于在《寒山子詩》的詩句的檢索方面,研究者將詩歌劃分出三言詩、 五言詩和七言詩這三個類型, 在進行漢字詞語檢索時, 我們可以按照每個字或者一個詞分別出現在三言詩、 五言詩和七言詩中的不同情況, 作出漢字使用特點的判斷,對研究古代詩歌有重要的參考作用。 尤其是對文學創作或者文學學術研究者來說,這種檢索的作用為他們的創作和研究提供了方便。
四、檢索系統對其他類型文學作品檢索的參照
對文學文獻的檢索已經逐漸得到了人們的認可,這種簡單、快捷的檢索方式,為人們的工作和學習提供了方便。 武漢大學的中文系與計算機系進行聯合研制計算機文學文獻檢索系統,目前已經進入到更高層次的研究,通過對《紅樓夢》等 3 部文學名著進行語言自動檢索處理,已經掌握了較為完善的技術,經過應用,現階段已經對曹禺的《雷雨》、老舍的《駱駝樣子》、矛盾的《子夜》和趙樹理的《三里灣》等 10 位中國著名作家的作品, 進行語言文字處理系統的構建, 經過研究者對這些小說作品的自動檢索功能研究,讓文學作品的檢索功能進一步得到了完善,凸顯了檢索系統的先進性:
第一個顯性的效果是,通過對作品的自動檢索,將存入數據庫中的作品總字數和標點符號總數給出準確的統計結果。 第二個是計算機自動檢索系統能夠對作品不同單字在作品個個章節中出現頻度作出統計。 第三是檢索系統在檢索完成后,會自動編輯全書的單字頻度表。 第四是按漢語拼音音序對不同單字音序作出自動編輯并作出索引。 第五是在檢索完成之后,通過利用自動編輯軟件,對最能中不同單字部首編輯出索引。 第六是在索引過程中對全書的不同單字進行逐字索引的自動編輯,主動標注出各單字在作品行文中出現在那個頁碼和行數。 第七個方面就是利用文學文獻檢索系統,對作品中的任意字、 詞組等全部句子進行檢索, 并且將檢索的結果再通過計算機以卡片形式輸出。
目前,我國的圖書出版領域和文學文獻編輯領域已經全面適應了檢索系統,尤其是文學研究部門,面對浩瀚豐富的文學作品海洋,如果應用檢索系統,就能夠針對文學作品的相關知識進行檢索,從中找出作品的語言應用、字詞搭配、詞語調配等的特點, 既能夠體現出文學作品的語言特色和風格,又能為小說的內容作出評價。 由此可見,中國的文學檢索與研究應用計算機技術,無疑是為研究工作奠定了堅實的基礎。
[參 考文獻]
[1] 姚 兆煒。在 微型計算機上對 《寒山子詩 》實現逐字索引。中 國語文,1989(12)。
[2] 宋志成。交叉研究解開《紅樓夢 》之謎。科學畫報,1999(6)。
[3] 鐘 嘉陵 .未 鳴學。古 典名著紅樓夢的分專題自動檢索 .深 圳大學學報,1986(3)。
總結
以上是生活随笔為你收集整理的计算机检索系统功能,文学多功能计算机自动检索系统研究的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ShowWindow
- 下一篇: [UE4]获得特定类型的所有Actor: