百度ERNIE新突破,登顶中文医疗信息处理权威榜单CBLUE冠军
醫療領域存在大量的專業知識和醫學術語,人類經過長時間的學習才能成為一名優秀的醫生。那機器如何才能“讀懂”醫療文獻呢?尤其是面對電子病歷、生物醫療文獻中存在的大量非結構化、非標準化文本,計算機是無法直接使用、處理的。這就需要自然語言處理和知識圖譜技術大展身手了。
近日,百度 AI 技術再次取得關鍵突破,依托百度知識增強語義理解框架 ERNIE 研發的醫療預訓練語言模型 ERNIE-Health,以超越人類醫學專家水平的成績登頂中文醫療信息處理權威榜單 CBLUE 冠軍,驗證了 ERNIE 在醫療行業應用的重要價值。AI 醫療邁向新的里程碑。
▲ 中文醫療信息處理 CBLUE 榜單排名
CBLUE: 檢驗中文醫療信息處理能力的“金標準”
醫療文本的處理與理解是醫療信息化的重要基礎,具有非常高的應用價值。為構建統一共識的醫療信息系統性能評估平臺,中國中文信息學會醫療健康與生物信息處理專業委員會在合法開放共享的理念下發起設立了中文醫療信息處理挑戰榜 CBLUE (Chinese Biomedical Language Understanding Evaluation)。
CBLUE 是國內首個面向中文醫療文本處理的多任務榜單,涵蓋了醫學信息抽取、醫學術語歸一化、醫學文本分類、醫學句子關系判定和醫學問答共5大類任務、8個子任務;其數據來源分布廣泛,包括醫學教材、電子病歷、臨床試驗公示以及互聯網用戶真實查詢等。該榜單一經推出便受到了學界和業界的廣泛關注,自2021年4月正式上線以來,共吸引近300支隊伍參與打榜,已逐漸發展成為檢驗 AI 系統中文醫療信息處理能力的“金標準”。
百度醫療預訓練語言模型 ERNIE-Health
近日,隨著百度醫療語言模型預訓練技術取得關鍵突破,百度團隊在 CBLUE 榜單上登頂榜首,以8個任務均分77.808的佳績超越人類醫學專家均分77.1的水平[1],標志著 AI 醫療正式邁向新的里程碑。
作為新紀錄誕生背后的關鍵技術,百度醫療預訓練語言模型 ERNIE-Health 功不可沒。ERNIE-Health 依托百度文心 ERNIE 先進的知識增強預訓練語言模型打造,通過醫療知識增強技術進一步學習海量的醫療數據,精準地掌握了專業的醫學知識。ERNIE-Health 利用醫療實體掩碼策略對專業術語等實體級知識學習,學會了海量的醫療實體知識。同時,通過醫療問答匹配任務學習病患病狀描述與醫生專業治療方案的對應關系,獲得了醫療實體知識之間的內在聯系。
ERNIE-Health 共學習了60多萬的醫療專業術語和4000多萬的醫療專業問答數據,大幅提升了對醫療專業知識的理解和建模能力。此外,ERNIE-Health 還探索了多級語義判別預訓練任務,提升了模型對醫療知識的學習效率。ERNIE-Health 模型也將在隨后正式對外界公開發布,希望借此進一步推動 AI 醫療技術的發展和創新。
▲ ERNIE-Health
百度 AI 推動解決基層醫療難題 助力健康中國
醫療資源不均、醫生供需缺口大、臨床工作壓力持續增加已經成為當前我國醫療衛生事業面臨的突出問題,利用 AI 技術實現臨床輔助具有重要的現實意義。
百度以循證 AI 為理念,推出 AI 醫療品牌——靈醫智惠。靈醫智惠依托百度自然語言處理與知識圖譜技術的深厚積累,構建了涵蓋醫學自然語言理解、醫學知識體系、醫學認知計算三大核心技術在內的循證醫學認知引擎,并在此基礎上構建醫療 AI 中臺、醫療知識中臺和醫療數據中臺,面向醫療場景提供臨床輔助決策、眼底篩查、智慧病案、智能審方、慢病管理、醫療大數據服務等 AI 醫療解決方案。
目前,靈醫智惠在 AI 醫療領域的產品和解決方案已觸達29個省市自治區、400多家醫院、1600多家基層醫療機構,服務數萬名醫生,惠及千萬患者。未來,百度還將持續推動自然語言處理及知識圖譜等技術在生物醫學領域的技術創新,用科技的力量提升基層醫療水平,為更多人提供更高效、更優質的醫療服務。
[1] Ningyu Zhang, Mosha Chen, Zhen Bi, and others. CBLUE: A Chinese biomedical language understanding evaluation benchmark. arXiv preprint arXiv:2106.08087.
點擊進入獲得更多技術信息~~
總結
以上是生活随笔為你收集整理的百度ERNIE新突破,登顶中文医疗信息处理权威榜单CBLUE冠军的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Paddle.js PaddleCla
- 下一篇: 秒过,度目智慧通行让常态化防疫更高效