拯救乳房:乳腺癌AI诊断系统
?
背景:7月28日,騰訊云在北京舉辦云+社區沙龍,邀請來自騰訊與四川云檢科技的五位AI技術專家,分享他們在專業領域的AI開發經驗,幫助開發者在具體行業場景中實踐AI技術。本文根據江鋮在【7.28日騰訊云+社區技術沙龍-AI技術全面場景化落地實踐】現場演講內容整理而成。
講師介紹
江鋮,武漢大學博士,法國傅里葉大學博士后,騰訊AI醫療中心高級工程師。研究方向主要為乳腺癌鉬靶和病理AI學習系統構建。
本次分享大綱:
1.AI乳腺癌診斷的研究背景
2.乳腺鉬靶AI診斷系統
3.乳腺病理、核磁共振和超聲研究
4.總結
?
AI乳腺癌診斷的研究背景
隨著時代的進步和經濟發展,人們的健康意識日益提高,同時伴隨著AI技術的發展,AI醫療理所應當地成為了互聯網行業內的風口,值此之際,騰訊推出了騰訊覓影,目前已經涵蓋了食管癌、肺癌、乳腺癌、結腸癌、宮頸癌和糖尿病性視網膜病變。
為什么研究乳腺癌?
開展乳腺癌方向的研究簡單來說主要基于兩方面的原因,一是對于女性來說乳腺癌是所有惡性腫瘤當中發病率最高的一種,在國內約占全部惡性腫瘤的17%左右,正嚴重危害著女性的健康;二是乳腺癌雖然發病率很高,但如果在較早期發現,治愈的可能性非常高。相對美國來說,我國的五年生存率還較低,這主要是因為中國人口基數過多,有經驗的影像科醫生較為缺乏,使得大范圍早篩困難重重,騰訊覓影發布的AI乳腺癌診斷系統能夠有效緩解這一矛盾,最大限度地幫助患者和醫生。?
AI乳腺癌一體化診療系統
現在對乳腺癌的診斷主要依賴超聲、鉬靶、核磁共振、病理和基因等,對于一般的三甲醫院,通常先使用鉬靶進行篩查,如果無法定性,會要求病人進一步進行超聲和核磁共振檢查,如果出現疑似惡性的情況,將進行病理穿刺檢查,并對是否癌變,惡性程度以及分子分型做出判斷。
我們的目標是能夠把這些數據模態有機地結合起來,形成一個完整的體系,從而提高乳腺癌的診療技術。由于其中最主流和有效的篩查診斷方式是鉬靶,因此我們在這方面的研究開展最早,目前騰訊的AI鉬靶乳腺癌診斷系統已經對外發布,并已經在30多家三甲醫院落地試用。
?
乳腺鉬靶AI診斷系統
1.目標功能
乳腺鉬靶診斷系統主要包含三方面的目標功能。第一是實現了疑似病灶的定位;第二是給出了乳房的良惡性判定;第三是能夠自動生成影像報告。這些功能的目標是實現和醫生的相互配合,減少誤診率和漏診率,并且隨著模型的不斷優化可以逐步地降低醫生的勞動強度。
2. 技術框架
這三方面的目標功能是如何實現的呢?這主要基于一個包含三個維度的技術框架。其中架構前端是鉬靶影像的前處理層;中間層是AI學習模型;最后是通過醫生反饋對前兩部分進行的動態更新層。
?
在前處理層,主要是對不同廠商(例如西門子、Hologic、GE)設備進行窗寬窗位的歸一化適配,使得輸入后續算法的數據具有盡可能類似的風格。另外,會結合醫生的看片經驗,對于可能的異常區域進行ROI提取,以盡可能地減少不相關信息的干擾。
在中間層,我們為了乳腺癌鉬靶檢查而重新設計了全新的神經網絡模型TMuNet,該網絡包含四個方面的特點。第一是傳統的網絡輸入通常都是單圖輸入,而現在的方案可實現對左右乳CC位和MLO位進行對比的四張圖同時輸入;第二是采用多尺度網絡,使得圖片輸入網絡前不需要進行縮放;第三是漸進式的網絡構建,這種方式類似大腦學習過程,它把疑難問題分解后逐層解決,在構建網絡時由局部到整體,由單幅圖像到多幅圖像;第四是自步學習的訓練方式,類似于大腦由易到難的學習方式,先將訓練的樣本按難易程度進行分類,在訓練過程當中由易到難地逐步把樣本加進去,對模型進行多輪訓練,這可以讓模型達到最好的效果。
3.當前精度
在三層技術框架下,通過對各項技術合理的組織和運用,系統達到了業內領先的水平。在我們的工作經驗中,我們發現疑難病例的數量和種類能在很大程度上決定AI系統的上限。因此,我們非常注重數據集的運營,對于部分難例,我們會請專家進行標注或者利用病理和其他模態數據進行交叉確認。
?
乳腺病理、核磁共振和超聲研究1.乳腺病理
目前乳腺癌病理研究主要解決兩方面問題,第一是組織學分級,即定義腫瘤惡性的程度,它主要依據核分裂計數、核多形性打分、腺管形成程度三項內容;第二是免疫組化,使用不同染色片進行分子分型研究。目前研究團隊已經完成了有絲分裂技術方面的研究,并已經開展對于KI-67和HER2染色片的研究工作。對于已經完成的有絲分裂檢測部分,在學術界TUPAC專業比賽上,之前的冠軍F1 score分值為0.73,而我們的系統可以達到0.82,有很大程度的提升。精度的提升主要歸功于三方面的技術。第一點是使用了難例挖掘方式,采用多輪迭代方式然后在每一輪次對樣本進行整理,由專家確認較難的標注,再放入樣本集中強化訓練;第二點是圖像的歸一化,通過使用對抗網絡將圖像做歸一化,達到提升;第三點是在速度上改進,拋棄原始計算機視覺中將一整幅圖切分的方式,采用共享計算和模型壓縮的效果,讓一幅病理片可以達到0.5秒以內的處理速度,基本上接近于實時。
2.核磁共振和超聲
對于乳腺MRI,有多種3D數據模態,而對于病灶的標注依然是所有研究工作的基礎。目前研究團隊推出了一種半自動標注工具,通過構造一個半自動的神經網絡模型,將醫生手工信息融入神經網絡,輔助分割病灶,此標注工具可以大大加速病灶的標注,由純人工的幾十分鐘提升到1分鐘的水平。在乳腺超聲方面,我們正在開展數據收集工作,并與此同時進行相應的調研工作。
?
總結
通過乳腺癌AI診斷系統的研發,項目團隊對于樣本的選擇和標記,網絡結構的設計,訓練方法和技巧等都有了較深的積淀。乳腺樣本庫也在不斷的豐富和擴展中,大量的疑難病例被逐步加入,一步步地構建著產品的護城河。在各模態數據研究逐漸成熟之后,我們的最終目標是將多個模態數據進行融合,實現高精度診斷和個性化的服務,這將極大地造?;颊吆歪t生。
在公眾號后臺回復“乳腺癌AI”可獲得本次沙龍上分享的PPT。
總結
以上是生活随笔為你收集整理的拯救乳房:乳腺癌AI诊断系统的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: IXDC 2018 | 打动人心的互联网
- 下一篇: 我不是码神!Serverless真的可以