论文浅尝 | TEQUILA: 一种面向时间信息的知识问答方法
來源:CIKM’18
鏈接:http://delivery.acm.org/10.1145/3270000/3269247/p1807-jia.pdf?ip=223.3.116.39&id=3269247&acc=ACTIVE%20SERVICE&key=BF85BBA5741FDC6E%2EEEBE655830483280%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35&__acm__=1547881906_e38f5a0b3bce785723b910b5c87affd7
?
本文是發(fā)表在CIKM’18的短文,關(guān)注有時(shí)間信息的復(fù)雜知識(shí)庫問答工作。文章提出使用TimeML(一種時(shí)間相關(guān)的標(biāo)注語言)對(duì)問題進(jìn)行標(biāo)注,在識(shí)別時(shí)間相關(guān)問題后,根據(jù)時(shí)間特征將復(fù)雜問題改寫為多個(gè)時(shí)序相關(guān)的子問題,通過與現(xiàn)有的知識(shí)問答系統(tǒng)相關(guān)聯(lián),實(shí)現(xiàn)帶有時(shí)間信息的復(fù)雜問答。
動(dòng)機(jī)
與簡單問題的處理方式不同,復(fù)雜問答一般會(huì)將原問題劃分為多個(gè)子問題,而后合并問題答案。作者發(fā)現(xiàn),復(fù)雜問題中一個(gè)需要解決的重要問題是時(shí)間信息的獲取。以下面三個(gè)問題為例:
Q1: “Which teams did Neymar play for before joiningPSG?”
Q2: “Under which coaches did Neymar play inBarcelona?”
Q3: “After whom did Neymar’s sister choose her lastname?”
?
在Q1中,沒有明確的日期或者時(shí)間被提到,我們可以識(shí)別“joining PSG”代表了一個(gè)事件,然后通過它轉(zhuǎn)換為一個(gè)標(biāo)準(zhǔn)的時(shí)間信息。而句子中的“before”則提供了另一個(gè)時(shí)間相關(guān)的線索,但是類似于“before, after”這樣的詞并不總是在句子中承擔(dān)這樣的角色,比如Q3中的“after”。
在Q2中,我們看不到類似Q1的時(shí)間依賴表達(dá),但是“Neymar play in Barcelona”中依然包含了時(shí)間信息。
?
因此可以發(fā)現(xiàn),處理帶有時(shí)序信息的復(fù)雜問題面對(duì)的第一個(gè)挑戰(zhàn)就是:如何從問句中識(shí)別時(shí)間信息;
隨之產(chǎn)生的第二個(gè)挑戰(zhàn)則是:如何根據(jù)時(shí)間信息將問題分解為時(shí)序相關(guān)的子問題;
方法
本文方法的關(guān)鍵過程是:1.分解問題;2.重寫子問題
大體的目標(biāo)如下:
還是以前面的問句為例
Q1: “Which teams did Neymar play for before joiningPSG”
改寫得到子問題Q2.1, Q2.2
Q1.1: “Which teams did Neymar play for?”
Q1.2: “When did Neymar join PSG?”
而后在問答過程中,通過Q2.1,從知識(shí)庫中得到答案及時(shí)間范圍,再與Q2.2得到的時(shí)間相匹配,從而找到Q2的答案。
?
為了達(dá)到上述目的,本文提出一種基于規(guī)則的四步框架:
識(shí)別包含時(shí)間信息的問題
分解問題并重寫子問題
獲取子問題答案
根據(jù)時(shí)間證據(jù)自合子問題答案
規(guī)則設(shè)計(jì):
本文構(gòu)建的規(guī)則以TimeML(一種標(biāo)注語言)為理論基礎(chǔ),用于識(shí)別句子及文本中的時(shí)間信息。
標(biāo)簽提供了以下信息:
TIMEX3 tag,反映四類時(shí)間表達(dá):
SIGNAL tag,反映時(shí)間表達(dá)標(biāo)簽之間的關(guān)系(用于切分子問題)
?
規(guī)則定義:
包含時(shí)間信息的問題:即出現(xiàn)了時(shí)間信息表達(dá)或時(shí)間信息關(guān)系的問句(標(biāo)簽?zāi)茉趩柧渲袠?biāo)出內(nèi)容)
時(shí)間關(guān)系:Allen(J. F.Allen. 1990. Maintaining knowledge about temporal intervals. In Readings inqualitative reasoning about physical systems. Elsevier)定義了13種時(shí)間關(guān)系,EQUAL, BEFORE,MEETS, OVERLAPS, DURING, STARTS, FINISHES。
?
表1列舉了子問題重寫規(guī)則。回答子問題時(shí),對(duì)于包含時(shí)間信息的子問題需要檢索可能的時(shí)間范圍
實(shí)驗(yàn)
本文實(shí)驗(yàn)評(píng)估基于 TempQuestions benchmark,其中包含1271個(gè)時(shí)間相關(guān)問題,并使用三個(gè)目前最好的KBQA系統(tǒng)作為baseline:AQQU [6], QUINT [2] (code from authors for both), and Bao et al. [4]。在實(shí)驗(yàn)中,作者將框架與問答系統(tǒng)整合到一起,構(gòu)成對(duì)比模型。
實(shí)驗(yàn)結(jié)果反映出添加框架的問答系統(tǒng)的提升主要表現(xiàn)為F1與準(zhǔn)確率的上升。
總結(jié)
本文提出了一種基于時(shí)間信息標(biāo)注的規(guī)則型時(shí)序復(fù)雜問答框架,主要以時(shí)間信息的規(guī)則標(biāo)注概念為基礎(chǔ),將復(fù)雜問題的切分過程轉(zhuǎn)換為序列標(biāo)注問題,并對(duì)已有人工規(guī)則加以利用,構(gòu)建時(shí)序信息間的關(guān)系。框架整體比較簡明,從規(guī)則角度看,還需要做部分深入閱讀方能較好理解該方法是否具有較好的泛化性。
?
論文筆記整理:譚亦鳴,東南大學(xué)博士生,研究興趣:知識(shí)問答,自然語言處理,機(jī)器翻譯
OpenKG.CN
中文開放知識(shí)圖譜(簡稱OpenKG.CN)旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開放與互聯(lián),促進(jìn)知識(shí)圖譜和語義技術(shù)的普及和廣泛應(yīng)用。
點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的论文浅尝 | TEQUILA: 一种面向时间信息的知识问答方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 史上最全memcached面试26题和答
- 下一篇: 论文浅尝 | 知识图谱中的链接预测:一种