自然语言处理综述(一)
生活随笔
收集整理的這篇文章主要介紹了
自然语言处理综述(一)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 自然語言處理的基本內容
語言是思維的載體,是人類交流思想、表達情感最自然、最直接、最方便的工具。人類歷史上以語言文字形式記載和流傳的知識占知識總量的80%以上,中國互聯網上有87.8%的網頁內容是文本表示的。
- 問題的提出
- 自然語言處理的基本概念
- 自然語言處理的發展史
2 問題的提出
2.1 自然語言處理的作用
-
全世界網頁數量正以指數速率增長,中文網頁檢索的最高準確率不足40%。
-
隨著社會全球化時代的到來,機器翻譯市場潛力巨大,文化、商貿、旅游和體育等各個行業都需要使用自然語言處理的技術。
-
如何讓計算機能夠自動或半自動地理解自然語言文本,懂得人的意圖和心聲?
-
如何讓計算機實現海量語言文本的自動處理、挖掘和有效利用,滿足不同用戶的各種需求,實現個性化信息服務?
3 自然語言處理的基本概念
3.1 自然語言處理基本概念
-
自然語言處理是研究如何利用計算機技術對語言問題(句子、篇章和話語)進行處理和加工的一門學科,研究內容包括對詞法、句法、語義和語用等下的識別、分類、提取、轉換和生成等各種處理方法和實現技術。
中文信息處理 -
漢語:漢族的語言,是我國的主要語言。
-
中文:中國的語言文字,特指漢族的語言文字。
4 自然語言處理的發展史
4.1 自然語言處理的萌芽期
- 興起于1950年前后,在二次時間大戰中,破解納粹德國的恩尼格碼成為了盟軍對抗德國的重要戰場,密碼的破譯使得盟軍在西歐戰場提前勝利2年。
- 1948年香農把馬爾可夫過程模型(Markov Progrees)應用于建模自然語言,并提出把熱力學中“熵”的概念擴展到到對信息進行建模。熵可以幫助人們對信息進行度量。
4.2 符號主義vs連接主義
- 在自然語言處理發展初期階段,大量的自然語言研究工作都致力于從語言學的角度,分析自然語言的詞法、句法等結構信息,并通過總結這些結構之間的規則,達到處理和使用自然語言的目的,這一時期的代表人物是喬姆斯基和他提出的自然語言文法。
4.3 深度學習時代
- 從2006年深度神經網路反向傳播算法的提出開始,伴隨著互聯網的爆炸式和計算機算力的進一步提高,自然語言處理邁入了深度學習時代。
總結
以上是生活随笔為你收集整理的自然语言处理综述(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 人工智能之语音识别技术(三)
- 下一篇: 自然语言处理之词向量技术(二)