巧用词语角色:基于目标自适应图的跨目标立场检测
?
?PaperWeekly 原創 ·?作者|梁斌、傅勇昊
學校|哈爾濱工業大學(深圳)
研究方向|情感分析、立場識別
摘要
跨目標立場檢測(cross-target stance detection)的最大挑戰在于我們需要從有限的已知目標(target)樣本中挖掘有用的語義信息來對未知的目標進行立場檢測。我們發現,由于待預測樣本的目標是未知的,所以很難通過知識遷移或特征共享的方法將已知目標的訓練特征遷移至未知目標的立場學習當中。并且,不同的詞語在針對不同目標表達立場時的作用是不一樣的。
基于這一發現,我們探索了一種新的從立場語言表達出發構建目標自適應的依賴關系圖方法,該方法可以從已有語料中自動地為不同目標構建立場信息表達關系圖,稱為目標自適應語用依賴圖(target-adaptive pragmatics dependency graph, TPDG)。
與以往基于特征共享和知識遷移的方法不同,TPDG 同時考慮了目標自身特有的立場表達信息和不同目標之間的立場表達聯系。通過對目標特有立場表達信息的建模和學習,可以將這些特有信息用于協助有關聯的未知目標立場特征學習;此外,通過對目標間立場表達聯系的建模和學習,可以有效挖掘出源目標和未知目標的立場表達依賴關系。
最終通過一個多層的交互式圖卷積塊(interactive GCN blocks)對上下文表示和目標自適應圖進行建模和特征學習,得到未知目標的立場檢測結果。
論文標題:
Target-adaptive Graph for Cross-target Stance Detection
論文鏈接:
http://www.hitsz-hlt.com/paper/TPDG-WWW2021.pdf
方法
2.1 任務定義
給定源目標的立場標注數據集 以及未知目標的數據 ,其中 表示源目標數據中的目標, 表示關于該目標的文本描述, 是對應的立場標簽。
跨目標立場檢測任務是在源目標數據集 上訓練模型來預測未知目標數據集 的立場標簽。針對這一任務,我們提出的 TPDG(target-adaptive pragmatics graph)模型框架如圖 1 所示:
▲ 圖1:目標自適應圖網絡模型框架
2.2 目標自適應語用依賴圖
目標自適應語用依賴圖的構建主要分為語用權重計算和目標自適應語用依賴圖構建兩個步驟。
語用權重計算:為了更好建模立場表達的上下文,我們從目標自身出發,挖掘詞語針對不同目標的語用權重,即詞語相對于不同目標的立場表達角色。對于每一個詞語 要么針對特定目標表達出特有的立場信息(in-target perspective),要么針對不同目標表達出相近的立場信息(cross-target perspective)。
本文從這兩個角度出發來計算詞語的語用權重,即目標內(in-target)語用權重 和目標間(cross-target)語用權重 。詞語 的目標內語用權重表達的是該詞語和某個目標的關聯程度,因此同一個詞語對于不同的目標可能會充當不同的角色,即有不一樣的語用權重。
另一方面,詞語的目標間語用權描繪的是詞語在所有目標中的通用分布特征,即目標間語用權重越大說明該詞語對不同目標的影響程度是相似的,相反如果目標間語用權重越小說明該詞語只伴隨特定目標才表現出立場信息。
a)?目標內語用權重計算
基于詞語在數據集中出現的頻率先驗統計信息,詞語 目標內語用權重 的計算方式如下公式所示:
其中 和 分別為詞語 在特定目標和其他目標中出現的次數。 和 分別表示詞語 在已知樣例的不同類別(假設有 favor 和 against 兩個類別)中出現的次數。
b) 目標間語用權重計算
其中 為數據集中目標的個數, 和 分別為詞語 出現最多的數據集次數和最少次數。
經過上面的計算后我們詞表中的任意一個詞語 對于特定目標都有兩個語用權重 和 。接下來本文將使用這兩種權重來構建目標自適應語用依賴圖。
目標自適應語用依賴圖構建:對于每一個輸入文本我們需要構建目標自適應語用依賴圖。即根據目標特有語用權重和目標間語用權重來構造目標內關系圖(in-target graph) 和目標間關系圖(cross-target graph):
其中 D 為給定文本的依存關系矩陣,即:
其中 表示詞語 和 在依存關系樹中存在依存關系。
2.3 交互式卷積神經網絡
對于給定的輸入文本向量矩陣 ,本文通過一個雙向 LSTM(Bi-LSTM)網絡可以得到文本的隱藏表示:
基于文本的隱藏表示和 in-target graph、cross-target graph,本文使用一個多層交互式圖卷積塊來交互學習文本的目標內和跨目標立場特征信息,其中,第 l 層圖卷積塊計算如下:
其中 為上層圖卷積的隱藏輸出, 為關系圖的規范化表示, 為關系圖的度。對于第一層圖網絡有:。
實驗
我們在 2 個公開的跨目標立場檢測數據集(SEM16 和 WT-WT)中的 12 個跨目標立場檢測任務中進行實驗。實驗結果顯示我們提出的 TPDG 方法在各個跨目標立場檢測任務中的性能都達到了最優。
▲ 表1:SEM16數據集的實驗結果
?
▲ 表2:WT-WT數據集的實驗結果
結論
本文針對跨目標立場檢測提出一種自動學習詞語在立場表達中的角色來構建目標自適應圖(TPDG)的方法。該方法通過學習詞語的目標內和目標之間的語用權重來為上下文構建目標內關系圖(in-target graph)和目標間關系圖(cross-target graph)。
基于此,本文進一步提出一種多層的交互式圖卷積塊(interactive GCN blocks)網絡來對上下文、目標內關系圖、以及目標間關系圖進行建模,從而為未知目標自動學習上下文的立場表達信息,得到未知目標的立場檢測結果。
實驗結果表明,本文提出的目標自適應圖方法在不同數據集的跨目標立場檢測任務中都取得了最優性能。
?
關于作者
梁斌,哈爾濱工業大學(深圳)計算機學院博士研究生,主要研究方向包括情感分析、立場檢測、文本挖掘。E-mail: bin.liang@stu.hit.edu.cn
傅勇昊,哈爾濱工業大學(深圳)計算機學院碩士研究生,主要研究方向為立場識別。E-mail: yonghaofu@stu.hit.edu.cn
更多閱讀
#投 稿?通 道#
?讓你的論文被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學習心得或技術干貨。我們的目的只有一個,讓知識真正流動起來。
?????來稿標準:
? 稿件確系個人原創作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向)?
? 如果文章并非首發,請在投稿時提醒并附上所有已發布鏈接?
? PaperWeekly 默認每篇文章都是首發,均會添加“原創”標志
?????投稿郵箱:
? 投稿郵箱:hr@paperweekly.site?
? 所有文章配圖,請單獨在附件中發送?
? 請留下即時聯系方式(微信或手機),以便我們在編輯發布時和作者溝通
????
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的巧用词语角色:基于目标自适应图的跨目标立场检测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微软PRO 系统怎么安装 微软PRO系统
- 下一篇: 怎么给u盘设置密码 U盘密码设置方法