临床研究和医疗保健行业实现数据湖架构的机会和挑战
ERT首席數據官Prakriteswar Santikary博士上個月在2018年數據架構峰會上做了演講,在演講中他談到了他的團隊在其臨床研究組織開發的數據湖架構。他討論了部署在云中的數據平臺,使用無服務器計算和數據服務等概念來簡化數據收集、聚合、臨床報告和分析。
桑迪卡里談到了臨床試驗行業的市場動態和挑戰。臨床研究的風險比以往任何時候都高,臨床開發市場的競爭也變得更加激烈,監管標準更加嚴格,對試驗監督和患者安全的重視程度也更高。
與此同時,一種新藥商業化所需的成本和時間正在不斷增加——超過8年,超過20億美元。這些數字如此驚人的一個重要因素是臨床試驗越來越復雜了,因為很大程度上研究設計需要更多的端點來證明產品價值。
臨床試驗的贊助商也正在從多個不同來源整合數據,包括基因組測序、醫學成像、實驗室、衣物和其他移動健康(mHealth)設備,并整合運營、金融和真實世界帶有端點數據的佐證數據,以最有地應用他們的研發投資,給市場帶來拯救生命的藥物和治療方法。
目前影響臨床研究的其他趨勢包括:
- 精密醫學
- 虛擬試驗
- 患者中心性
InfoQ采訪了Santikary,以了解更多關于主數據管理(MDM)、他們開發的數據湖解決方案,以及數據架構和技術在臨床和醫療行業的新興趨勢。在早些時候,InfoQ曾經發表過一篇題為《數據湖只是個嘩眾取寵的偽概念嗎?》的文章,想要知道答案,可以點開文章看一看。
InfoQ:您能談談臨床試驗行業的一些數據架構挑戰嗎?
Santikary:鑒于市場動態和數據集成的挑戰,臨床研究中的數據架構挑戰是很重大的。在ERT,我們的現代數據平臺的架構是為了迎接以下挑戰:
數據安全、隱私和大規模保護、大規模數據集成、大規模實時報告和分析以及大規模數據治理和主數據管理。
InfoQ:在醫療系統中實現數據湖架構的挑戰是什么?
Santikary:在醫療保健中實現數據湖架構的主要挑戰是確保數據平臺是從數據安全、隱私和防護方面考慮的整體架構,同時支持實時數據傳輸、收集、攝取和大規模集成。更不用說,不能低估在處理數據湖中的非結構化和二進制數據時所面臨的挑戰。從數據湖體系結構的角度來看,支持批處理和近時數據集成以及業務智能是一個真正的實際挑戰。以自助服務的方式向所有委托人提供綜合數據是另一個大挑戰。
InfoQ:您的團隊是如何在新的數據平臺上構建主數據管理的?
Santikary:主數據管理(MDM)是我們整個現代數據架構基礎的一個關鍵架構組件。我們的企業數據湖是MDM平臺的使用者,MDM平臺從所有操作系統和事務系統收集所有控制實體,并使用復雜的匹配和合并算法、元數據管理和語義匹配實時控制它們。我們也有數據管理員,他們監督手工合并和數據質量,并從企業所有權和責任的角度擁有數據。我們已經創建了一個本質上跨職能的數據治理委員會——這個委員會從整個組織中吸收數據專家,而不僅僅是研發。MDM是我們公司內部的戰略計劃,我們的企業數據湖也是如此。這個數據湖平臺服務于整個公司所有業務領域的所有商業智能報告、分析和人工智能,使我們能夠創建智能數據產品,并為公司開辟新的營收渠道。
InfoQ:在臨床和醫療行業中,數據架構和數據技術的新趨勢是什么?
Santikary: 臨床研究和衛生保健技術的變化速度是前所未有的,因為新的創新和發現正在以驚人的速度推動進步。以下技術在臨床研究中發揮了巨大的作用:
人工智能,機器學習和深度學習:我們看到人工智能的使用繼續擴大,特別是在以下幾個類別:使臨床試驗智能化,優化患者招募/保留,并為更明智的決策獲得更大的洞察力。
區塊鏈:區塊鏈技術允許從業者共享他們的數據,而不必擔心會損害數據安全,因為區塊鏈數據是不可變的,對數據的任何更改都可以跟蹤。
云計算和大數據:數據分析和可視化的進步使臨床研究人員能夠探索和與大規模的、通常是聚集在一起的數據體交互。對于臨床試驗中的患者來說,在研究過程中,可以快速拍攝每頓飯的照片來獲取關于他們情緒或日常飲食攝入的數據,這幾乎是無限的數據潛力,將改變臨床試驗數據分析的格局。
查看英文原文:Data Lake and Modern Data Architecture in Clinical Research and Healthcare
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的临床研究和医疗保健行业实现数据湖架构的机会和挑战的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Kotlin的解析(中)
- 下一篇: 自定义简单版本python线程池