机器阅读理解(MRC)零基础入门级综述(一)
生活随笔
收集整理的這篇文章主要介紹了
机器阅读理解(MRC)零基础入门级综述(一)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
- 機器閱讀理解(MRC)零基礎入門級綜述(一)
- 一、機器閱讀理解(MRC)是什么?
- 1. 含義
- 2. 分類
- 3. 機器閱讀理解(Reading Comprehension) vs. 問答(Question Answering)
- 二、研究機器閱讀理解的動機
- 1. 評估計算機系統理解人類語言能力
- 2. 機器閱讀理解是問答系統和對話系統等應用的關鍵技術
- 參考文獻
機器閱讀理解(MRC)零基礎入門級綜述(一)
東南大學數學學院博士,跨專業選課機器學習專題,課程大作業,零基礎開始記筆記,整理了這篇綜述,故曰零基礎入門級綜述。
- 以下大部分內容翻譯自斯坦福陳丹琦博士論文,文末有原文鏈接。
一、機器閱讀理解(MRC)是什么?
1. 含義
機器閱讀理解旨在讓機器可以對文本進行閱讀、表示,并根據其回答用戶的問題
- 以上內容引用自[1]
2. 分類
一般來說,根據不同的答案類型,我們可以將現有的閱讀理解任務分為四類[2]:
- 完形填空:把一個詞填在文中空白處,和英語考試完形填空一模一樣;
- 選擇題:顧名思義;
- 抽取式:答案就是文中的某個詞或者某段話;
- 自由式:對答案沒有任何限制,可以是詞也可以是句子,長度也不限。
3. 機器閱讀理解(Reading Comprehension) vs. 問答(Question Answering)
- 閱讀理解可以看作是問答的一個特例,因為它本質上是通過一段文本來回答一個問題,它們兩者之間在問題的形式,處理方法以及評價體系上都有相通點。
- 閱讀理解和問答的終極目標不一樣:
- 問答系統的最終目標是建立一個可以自動回答人類問題的計算機系統;
- 閱讀理解更注重機器對文本理解,而回答問題是為了衡量機器對文本的理解程度。
二、研究機器閱讀理解的動機
1. 評估計算機系統理解人類語言能力
NLP對人類語言的理解有以下多個層次
那么有沒有一個綜合的評估可以測試所有這些方面?——有的,閱讀理解。
因為就算是人類本身,也是需要采用閱讀理解測試來衡量自身理解一段文字的能力。
再一次想到了被語文閱讀理解支配的恐懼
舉一個栗子:
- 回答第一個問題,需要聯系上下文,知道“She’s now in Miami”中的“she”指的是上文的“Alyssa”,這就體現了機器的“Discourse Process”能力。
- 第三個問題更加具有挑戰性,機器需要結合全文進行推理,還需要計數才能得出,有“3”個朋友的答案。
2. 機器閱讀理解是問答系統和對話系統等應用的關鍵技術
- 讓搜索引擎越來越智能
在谷歌上搜索一個問題,谷歌不僅返回一個搜索文檔列表,還試圖讀取這些Web文檔,最后置頂顯示最合理的答案。
果然,百度這方面還得加加油。
2. 蘋果Siri,微軟小娜,天貓精靈,小米小度等等,借助MRC也提高它們對話的能力——結合上下文的多輪次對話,從而更加智能。
未完待續
參考文獻
[1] 【AI TIME PhD】復雜場景下的機器閱讀理解 | 清華大學林衍凱博士
[2] 《Neural Reading Comprehension and Beyond》,斯坦福陳丹琦博士論文
總結
以上是生活随笔為你收集整理的机器阅读理解(MRC)零基础入门级综述(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三维点云分割综述
- 下一篇: Python可以调用Gpu吗_加快Pyt