腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | PhD Talk #22
機器翻譯是自然語言處理的經典任務之一,涉及到自然語言處理的兩個基本問題:語言理解和語言生成。這兩個問題的建模直接對應譯文的兩個評價指標:忠實度(是否表達原文的完整意思)和流利度(譯文是否流暢)。
近幾年來,神經網絡機器翻譯取得了巨大進展,成為了主流模型。神經網絡由于能緩解數據稀疏性及捕獲詞語之間的關聯,生成的譯文流利度高,這是過去二十余年上一代統計機器翻譯一直以來的難點。但由于神經網絡目前來說仍然是個黑盒子,無法保證原文的語義完整傳遞到目標端,導致經常出現漏翻、錯翻等忠實度問題。
本次報告主要講述過去一年我們在提高神經網絡翻譯忠實度方向上的系列研究工作,從利用句法結構、擴大翻譯粒度、引入篇章信息、忠實度學習方面加強模型對原文的理解。
嘉賓介紹
涂兆鵬
騰訊 AI Lab 高級研究員
涂兆鵬是騰訊 AI Lab 的高級研究員,研究主要集中在機器翻譯和深度學習方面,目前已經在自然語言處理和人工智能領域發表二十余篇頂級會議和期刊論文,包括 ACL, EMNLP, TACL, NAACL, AAAI 等。
在加入騰訊之前,他分別在 2008 年和 2013 年于北航和中科院計算所獲得計算機科學學士和博士學位,于 2014 年于美國加州大學戴維斯分校完成博士后研究。2014 年到 2017 年他在華為香港諾亞方舟實驗室任研究員。
? ? ? ? ??
PhD Talk
?
如何提升神經網絡翻譯的忠實度
騰訊 AI Lab 高級研究員涂兆鵬
內容分享√在線Q&A√
活動形式:PPT直播
?
?活動時間?
1 月 4 日(周四)20:00-21:00
45 min 分享 + 15 min Q&A
長按識別二維碼,進入直播間
*或使用斗魚App搜索「1743775」
往期回顧
?
基于生成模型的事件流研究 + NIPS 2017 論文解讀
亞馬遜高級應用科學家熊元駿:人類行為理解研究進展
清華大學馮珺:基于強化學習的關系抽取和文本分類
基于雙語主題模型的跨語言層次分類體系匹配
東南大學高桓:知識圖譜表示學習
帶多分類判別器的GAN模型
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | PhD Talk #22的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Github 本周最有趣的 10 款「机
- 下一篇: 今晚直播 | 腾讯AI Lab涂兆鹏:如