报名 | 全国知识图谱与语义计算大会(CCKS 2019)评测任务发布
? ? ? ??
? ? ?全國知識圖譜與語義計算大會是由中國中文信息學會語言與知識計算專委會定期舉辦的全國年度學術會議。CCKS 2018吸引了來自學術界和工業界的超800人參加。2019 年全國知識圖譜和語義計算大會(www.ccks2019.cn) 將于2019年8月24日至8月27日在杭州召開,CCKS 2019的主題是“知識智能”。
CCKS系列評測旨在為研究人員提供測試知識圖譜與語義計算技術、算法、及系統的平臺和資源,促進國內知識圖譜領域的技術發展,以及學術成果與產業需求的融合和對接。經過前期的評測任務征集和評測組委會篩選,CCKS 2019共設立6個相關主題評測任務,分別是:面向中文電子病歷的命名實體識別、面向中文短文本的實體鏈指任務、人物關系抽取、面向金融領域的事件主體抽取、公眾公司公告信息抽取以及開放領域的中文問答。專委會為每個任務前三名設立獎金并頒發證書(第一名5000元,第二名3000元,第三名2000元),同時組委會將針對不同任務特別評選“創新技術獎”(每一任務至多一項,獎金:5000元),專門用于鼓勵創新性技術的使用。
一、任務簡介
任務一:面向中文電子病歷的命名實體識別
本任務是CCKS圍繞中文電子病歷語義化開展的系列評測的一個延續,在CCKS 2017,2018醫療命名實體識別評測任務的基礎上進行了延伸和拓展。
本任務包括兩個子任務:1)醫療命名實體識別:由于國內沒有公開可獲得的面向中文電子病歷醫療實體識別數據集,本年度保留了醫療命名實體識別任務,對2017年度數據集做了修訂,并隨任務一同發布。2)醫療實體及屬性抽取(跨院遷移):在醫療實體識別的基礎上,對預定義實體屬性進行抽取。本任務為遷移學習任務,即在只提供目標場景少量標注數據的情況下,通過其他場景的標注數據及非標注數據進行目標場景的識別任務。
任務組織者:
張江濤(清華大學知識工程實驗室)
陳陽(醫渡云(北京)技術有限公司)
湯步洲(哈爾濱工業大學(深圳))
任務聯系人:
張江濤:zhang-jt13@tsinghua.org.cn
陳 ?陽:yang.chen@yiducloud.cn-
任務二:面向中文短文本的實體鏈指任務
本評測任務為面向中文短文本的實體識別與鏈指,簡稱ERL(Entity Recognition and Linking)。即對于給定的一個中文短文本(如搜索Query、微博、用戶對話內容、文章標題等),ERL系統會識別其中的實體,并與給定知識庫中的對應實體進行關聯。ERL任務過程中需要進行實體識別等子任務,這些子任務的訓練可以使用額外的資源。 ?
傳統的實體鏈指任務主要是針對長文檔,長文檔擁有在寫的上下文信息能輔助實體的歧義消解并完成鏈指。相比之下,針對中文短文本的實體鏈指存在很大的挑戰,主要原因如下:(1)口語化嚴重,導致實體歧義消解困難;(2)短文本上下文語境不豐富,須對上下文語境進行精準理解;(3)相比英文,中文由于語言自身的特點,在短文本的鏈指問題上更有挑戰。
任務組織者:
汪琦(百度) wangqi31@baidu.com
馮知凡(百度)fengzhifan@baidu.com
張揚(百度) zhangyang08@baidu.com
任務聯系人:
汪琦:wangqi31@baidu.com?
任務三:人物關系抽取
關系抽取(Relation Extraction)是信息抽取的一個重要子任務,其任務是從文本內容中找出給定實體對之間的語義關系,是智能問答、信息檢索等智能應用的重要基礎,和知識圖譜的構建有著密切的聯系。
在本次任務中,我們重點關注人物之間的關系抽取研究,簡稱IPRE(Inter-Personal Relationship Extraction)。給定一組人物實體對和包含該實體對的句子,找出給定實體對在已知關系表中的關系。
任務組織者:
陳文亮(蘇州大學)
邵? 浩 (狗尾草智能科技)
任務聯系人:
王海濤:wanghaitao.mail@foxmail.com
任務四:面向金融領域的事件主體抽取
“事件識別”是輿情監控領域和金融領域的重要任務之一,“事件”在金融領域是投資分析,資產管理的重要決策參考。“事件識別”的復雜性在于事件類型和事件主體的判斷,比如“公司A產品出現添加劑,其下屬子公司B和公司C遭到了調查”,對于“產品出現問題”事件類型,該句中事件主體是“公司A”,而不是“公司B”或“公司C”。我們稱發生特定事件類型的主體成為事件主體,本任務中事件主體范圍限定為:公司、任務、機構。事件類型范圍確定為:產品出現問題、高管減持、違法違規…
本次評測任務的主要目標是從真實的新聞語料中,抽取特定事件類型的主體。即給定一段文本T,和文本所屬的事件類型S,從文本T中抽取指定事件類型S的事件主體。
任務負責人:
王太峰(螞蟻金服)
陳玉博(中科院自動化所)
黃敬(螞蟻金服)
任務聯系人:
王太峰:taifeng.wang@alibaba-inc.com
陳玉博:yubo.chen@nlpr.ia.ac.cn
任務五:公眾公司公告信息抽取
隨著金融科技的發展和全球資本市場的不斷擴大,在金融領域,每一天都有海量的數據產生,而與之形成強烈對比的是有限的人力以及人腦所能處理信息的極限能力。因此,依靠傳統的人工方式已經無法應對投研分析、風險控制、金融監管和事件關聯等需求,而亟需引入新的技術來提高信息處理效率,包括大數據分析、自然語言處理、知識圖譜等技術,都已經開始被積極用于金融分析和金融監管領域。在監管方面,每一家公眾公司都具有相關信息披露義務,由此也產生了大量的公告閱讀和信息抽取需求。據不完全統計,以滬深股市為例,2017年共披露公告44萬余篇,2018年共27萬余篇,并且隨著上市公司數量的增加這一數字也在逐年增加。每年3月底、4月底、8月底、10月底為定期報告披露高峰期,最多的一天所發布公告達 10297 篇。
本次評測的主要目標是針對公告文件(均以PDF或掃描件的方式發布)中的信息抽取。作為知識圖譜構建的基礎,結構化數據是必不可少的。由此,如何通過自動化的技術來從各類公告中抽取信息,將非結構化數據轉化為結構化數據是知識圖譜領域所面臨的一大挑戰。此次評測將包括兩個任務:公眾公司定期報告表格中的信息點提取和文本段落中的信息點提取。
任務組織者:
漆桂林(東南大學認知智能研究所)
王?? 萌(東南大學認知智能研究所)
任務聯系人:
漆桂林:gqi@seu.edu.cn
王?? 萌:meng.wang@seu.edu.cn
任務六:開放領域的中文問答
本評測任務為基于開放領域知識庫的中文問答,簡稱COQA (Chinese Open-domain Question Answering)。即對于給定的一句中文問題,問答系統從給定知識庫中選擇若干實體或屬性值作為該問題的答案。問題均為客觀事實型,不包含主觀因素。理解并回答問題的過程中可能需要進行實體識別、關系抽取等子任務。這些子任務的訓練可以使用額外的資源,但是最終的答案必須來自給定的知識庫。?
任務組織者:
鄒磊(北京大學計算機技術研究所)
胡森(北京大學計算機技術研究所)
林金曙(恒生電子股份有限公司)
陳華華(恒生電子股份有限公司)
任務聯系人:
胡森:husen@pku.edu.cn?
二、報名方式
本次評測采用郵件報名的方式,郵件標題為:“CCKS2019-任務名稱-參賽單位”,例如:“CCKS2019-面向中文電子病歷的命名實體識別-清華大學”;郵件內容為:“參賽隊名,參賽隊長信息(姓名,郵箱,聯系電話),參賽單位名稱”。請參加評測的隊伍發送報名郵件至相應郵箱:
任務一、面向中文電子病歷的命名實體識別(參賽隊可同時選擇兩個子任務參賽,也可選擇任意一個子任務單獨參賽,請報名時注明參加哪一個子任務):?
zhang-jt13@tsinghua.org.cn;
yang.chen@yiducloud.cn-
任務二、面向中文短文本的實體鏈指:
wangqi31@baidu.com
任務三、人物關系抽取:
wanghaitao.mail@foxmail.com
任務四、面向金融領域的事件主體抽取:
taifeng.wang@alibaba-inc.com;
yubo.chen@nlpr.ia.ac.cn
任務五、公眾公司公告信息抽取:
gqi@seu.edu.cn
meng.wang@seu.edu.cn
任務六、開放領域的中文問答:
husen@pku.edu.cn
三、重要日期
評測任務發布:3月20日
報名時間:3月20日—7月10日
訓練及驗證數據發布:4月1日-4月20日
測試數據發布:7月20日
提交測試結果:7月30日
評測論文提交:8月15日
會議日期:8月24日—27日
四、評測主席
韓先培,中國科學院軟件研究所(hanxianpei@126.com)
王志春,北京師范大學(zcwang@bnu.edu.cn)
更多信息,請點擊閱讀原文,進入會議官網評測頁面。
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的报名 | 全国知识图谱与语义计算大会(CCKS 2019)评测任务发布的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 - ISWC2020 | Kn
- 下一篇: 学术联赛 | 运用知识图谱技术,赋能多领