AlphaFold 和 AI 蛋白质折叠革命的下一步是什么
來源:ScienceAI
編輯:蘿卜皮
十多年來,分子生物學家 Martin Beck 團隊一直在努力拼湊世界上最難的拼圖游戲之一:人類細胞中最大分子機器的詳細模型。
這種被稱為核孔復合體的龐然大物控制著分子進出細胞核的流動,也就是基因組所在的地方。每個細胞中都存在數(shù)百個這樣的復合物。每個都由超過 1,000 種蛋白質(zhì)組成,這些蛋白質(zhì)在穿過核膜的孔周圍形成環(huán)。
這 1,000 塊拼圖由 30 多種蛋白質(zhì)構(gòu)建塊組成,這些蛋白質(zhì)構(gòu)建塊以多種方式交織在一起。使難題變得更加困難的是,這些構(gòu)建塊的實驗確定的 3D 形狀是從許多物種中收集的結(jié)構(gòu)的雜燴,所以不要總是很好地融合在一起。拼圖盒子上的圖片——核孔復合體的低分辨率 3D 視圖——缺乏足夠的細節(jié)來知道有多少部分精確地組合在一起。
2016 年,由位于德國法蘭克福馬克斯普朗克生物物理研究所(MPIB)的 Beck 領導的一個團隊報告了一個模型,該模型涵蓋了大約 30% 的核孔復合體和大約 30 個構(gòu)建單元中的一半,稱為核蛋白。
然后,2021 年 7 月,總部位于倫敦的 DeepMind 公司(谷歌母公司 Alphabet 的一部分)公開了一款名為 AlphaFold 的人工智能(AI)工具。該軟件可以從蛋白質(zhì)的基因序列中預測蛋白質(zhì)的 3D 形狀,并且在很大程度上具有精確性。這改變了 Beck 的任務,以及成千上萬其他生物學家的研究。
「AlphaFold 改變了游戲規(guī)則。」Beck 說,「這就像一場地震。你可以在任何地方看到它。」以色列耶路撒冷希伯來大學的計算結(jié)構(gòu)生物學家 Ora Schueler-Furman 說,他正在使用 AlphaFold 來模擬蛋白質(zhì)相互作用,「七月之前和之后都有。」
使用 AlphaFold、Beck 和 MPIB 的其他人——分子生物學家 Agnieszka Obarska-Kosinska 和由生物化學家 Gerhard Hummer 領導的小組——以及由結(jié)構(gòu)建模師 Jan Kosinski 領導的團隊,在德國漢堡的歐洲分子生物學實驗室(EMBL),可以更準確地預測人類版本的 Nup 蛋白的形狀。
通過利用幫助 AlphaFold 模擬蛋白質(zhì)相互作用的調(diào)整,他們在去年 10 月成功發(fā)布了一個模型,涵蓋了 60% 的復合體。它揭示了復合體如何穩(wěn)定原子核中的孔,并暗示復合體如何控制進出的東西。
在過去的半年里,AlphaFold 狂熱席卷了生命科學領域。「我參加的每次會議,人們都在說『為什么不使用 AlphaFold?』」倫敦大學學院的計算生物學家 Christine Orengo 說。
在某些情況下,人工智能為科學家節(jié)省了時間;在其他情況下,它使以前難以想象或非常不切實際的研究成為可能。它有局限性,一些科學家發(fā)現(xiàn)它的預測對于他們的工作來說太不可靠了。但實驗的步伐是狂熱的。
即使是開發(fā)該軟件的人也在努力跟上它在從藥物發(fā)現(xiàn)和蛋白質(zhì)設計到復雜生命起源等領域的使用。「我醒來并在 Twitter 上輸入 AlphaFold。」領導 DeepMind AlphaFold 團隊的 John Jumper 說,「看到一切都是一種體驗。」
驚人的成功
AlphaFold 在 2020 年 12 月引起了轟動,當時它主導了一場名為「蛋白質(zhì)結(jié)構(gòu)預測關鍵評估」(CASP)的比賽。該競賽每兩年舉行一次,旨在衡量生物學最大挑戰(zhàn)之一的進展:僅從氨基酸序列中確定蛋白質(zhì)的 3D 形狀。
計算機軟件條目是根據(jù)使用X射線結(jié)晶學或低溫電子顯微鏡(cryo EM)等實驗方法確定的相同蛋白質(zhì)的結(jié)構(gòu)來判斷的,這些方法向蛋白質(zhì)發(fā)射X射線或電子束,以建立其形狀的圖像。
AlphaFold 的 2020 版是該軟件的第二版。Jumper 說,它還贏得了 2018 年的 CASP,但其早期的努力大多不足以代替實驗確定的結(jié)構(gòu)。然而,AlphaFold2 的預測平均而言與經(jīng)驗結(jié)構(gòu)相當。
目前尚不清楚 DeepMind 何時會廣泛使用該軟件或其預測,因此研究人員利用 Jumper 公開演講中的信息以及他們自己的見解,開發(fā)了自己的人工智能工具,稱為 RoseTTAFold。
然后在 2021 年 7 月 15 日,出現(xiàn)了描述 RoseTTAFold 和 AlphaFold2 的論文,以及免費提供的開源代碼和專家運行他們自己的工具版本所需的其他信息。
一周后,DeepMind 宣布它已經(jīng)使用 AlphaFold 預測了人類制造的幾乎每一種蛋白質(zhì)的結(jié)構(gòu),以及其他 20 種被廣泛研究的生物體的整個「蛋白質(zhì)組」,例如老鼠和大腸桿菌——超過 365,000 種共結(jié)構(gòu)。
DeepMind 還將這些信息公開發(fā)布到由位于英國欣克斯頓的 EMBL 歐洲生物信息學研究所(EMBL-EBI)維護的數(shù)據(jù)庫中。此后,該數(shù)據(jù)庫已膨脹到近一百萬個結(jié)構(gòu)。
今年,DeepMind 計劃發(fā)布總計超過 1 億個結(jié)構(gòu)預測。這幾乎是所有已知蛋白質(zhì)的一半,是蛋白質(zhì)數(shù)據(jù)庫(PDB)結(jié)構(gòu)庫中實驗確定的蛋白質(zhì)數(shù)量的數(shù)百倍。
AlphaFold 部署了深度學習神經(jīng)網(wǎng)絡:受大腦神經(jīng)線路啟發(fā)的計算架構(gòu),可識別數(shù)據(jù)中的模式。它已經(jīng)接受了 PDB 和其他數(shù)據(jù)庫中數(shù)十萬個實驗確定的蛋白質(zhì)結(jié)構(gòu)和序列的訓練。
面對一個新序列,它首先在數(shù)據(jù)庫中尋找相關序列,這些序列可以識別出傾向于一起進化的氨基酸,表明它們在 3D 空間中很接近。現(xiàn)有相關蛋白質(zhì)的結(jié)構(gòu)提供了另一種估計新序列中氨基酸對之間距離的方法。
AlphaFold 在嘗試對氨基酸的 3D 位置進行建模時來回迭代來自這些平行軌跡的線索,并不斷更新其估計值。
專家表示,該軟件在機器學習研究中的新思想應用似乎是 AlphaFold 如此出色的原因——特別是,它使用一種稱為「注意力」的人工智能機制來確定哪些氨基酸連接在任何時候?qū)ζ淙蝿兆钪匾?.
該網(wǎng)絡對相關蛋白質(zhì)序列信息的依賴意味著 AlphaFold 存在一些局限性。它并非旨在預測突變(例如導致疾病的突變)對蛋白質(zhì)形狀的影響。它也沒有被訓練來確定在其他相互作用的蛋白質(zhì)或藥物等分子存在的情況下蛋白質(zhì)如何改變形狀。
但它的模型附帶的分數(shù)可以衡量網(wǎng)絡對其預測蛋白質(zhì)每個氨基酸單元的信心——研究人員正在調(diào)整 AlphaFold 的代碼以擴展其功能。
據(jù) DeepMind 稱,到目前為止,已有超過 40 萬人使用了 EMBL-EBI 的 AlphaFold 數(shù)據(jù)庫。還有 AlphaFold 的「超級用戶」:研究人員在自己的服務器上安裝了軟件,或者轉(zhuǎn)向基于云的 AlphaFold 版本來預測不在 EMBL-EBI 數(shù)據(jù)庫中的結(jié)構(gòu),或者為該工具設想新用途。
求解結(jié)構(gòu)
AlphaFold 解析結(jié)構(gòu)的能力已經(jīng)給生物學家留下了深刻的印象。「根據(jù)我目前所見,我非常信任 AlphaFold。」丹麥奧胡斯大學的結(jié)構(gòu)生物學家 Thomas Boesen 說。
該軟件已成功預測了 Boesen 中心已確定但尚未發(fā)表的蛋白質(zhì)形狀。「這對我來說是一個很大的驗證。」他說。
他和奧胡斯微生物生態(tài)學家 Tina?antl-Temkiv 正在使用 AlphaFold 來模擬促進冰形成的細菌蛋白質(zhì)的結(jié)構(gòu)——這可能有助于云中冰的冷卻效果——因為生物學家還無法通過實驗完全確定這些結(jié)構(gòu)。
斯德哥爾摩大學的蛋白質(zhì)生物信息學家 Arne Elofsson 表示,只要一種蛋白質(zhì)卷曲成一個明確定義的 3D 形狀——而且并非全部如此——AlphaFold 的預測就很難被擊敗。「這是一種一鍵式解決方案,可能是您將獲得的最佳模型。」
Elofsson 說,在 AlphaFold 不太自信的地方,「它非常擅長告訴你什么時候它不起作用」。在這種情況下,預測的結(jié)構(gòu)可能類似于浮動的意大利面條。
這通常對應于缺乏確定形狀的蛋白質(zhì)區(qū)域,至少在隔離時是這樣。這種本質(zhì)上無序的區(qū)域——約占人類蛋白質(zhì)組的三分之一——可能只有在存在另一種分子(如信號伙伴)時才能得到明確定義。
倫敦癌癥研究所的計算生物學家 Norman Davey 表示,AlphaFold 識別疾病的能力已經(jīng)改變了他研究這些區(qū)域特性的工作。他說:「我們的預測質(zhì)量立即有了巨大的提高,而我們沒有付出任何努力。」
AlphaFold 將蛋白質(zhì)結(jié)構(gòu)轉(zhuǎn)儲到 EMBL-EBI 數(shù)據(jù)庫中的數(shù)據(jù)也立即投入使用。Orengo 的團隊正在搜索它以識別新的蛋白質(zhì)種類(沒有通過實驗驗證它們),并且已經(jīng)發(fā)現(xiàn)了數(shù)百甚至數(shù)千個潛在的新蛋白質(zhì)家族,擴大了科學家對蛋白質(zhì)外觀和功能的了解。
在另一項研究中,該團隊正在搜索從海洋和廢水中采集的 DNA 序列數(shù)據(jù)庫,以嘗試識別新的食用塑料酶。使用 AlphaFold 快速近似數(shù)千種蛋白質(zhì)的結(jié)構(gòu),研究人員希望更好地了解酶如何進化以分解塑料,并有可能改進它們。
馬薩諸塞州劍橋市哈佛大學的進化生物學家 Sergey Ovchinnikov 說,將任何蛋白質(zhì)編碼基因序列轉(zhuǎn)化為可靠結(jié)構(gòu)的能力對于進化研究來說應該是特別強大的。
研究人員比較基因序列以確定生物及其基因在物種間的相關性。對于遠緣相關的基因,比較可能無法找到進化親屬,因為序列發(fā)生了很大變化。但通過比較蛋白質(zhì)結(jié)構(gòu)——其變化往往不如基因序列快——研究人員或許能夠發(fā)現(xiàn)被忽視的古老關系。
蘇黎世瑞士聯(lián)邦理工學院的計算生物學家 Pedro Beltrao 說:「這為研究蛋白質(zhì)進化和生命起源提供了一個絕佳的機會。」
為了驗證這一觀點,首爾國立大學計算生物學家 Martin Steinegger 團隊使用他們開發(fā)的名為 Foldseek 的工具,在 EMBL-EBI 的 AlphaFold 數(shù)據(jù)庫中尋找 SARS-CoV-2 RNA 復制酶的親屬。
這項研究發(fā)現(xiàn)了以前未知的可能的遠古親屬:真核生物中的蛋白質(zhì)——包括粘液霉菌——在其 3D 結(jié)構(gòu)中類似于被稱為逆轉(zhuǎn)錄酶的酶,艾滋病毒等病毒利用逆轉(zhuǎn)錄酶將 RNA 復制到 DNA 中,盡管在基因序列水平上幾乎沒有相似性。
實驗助理
對于想要確定特定蛋白質(zhì)的詳細結(jié)構(gòu)的科學家來說,AlphaFold 預測不一定是立竿見影的解決方案。相反,它提供了一個可以通過實驗驗證或改進的初始近似值——它本身有助于理解實驗數(shù)據(jù)。例如,來自 X 射線晶體學的原始數(shù)據(jù)顯示為衍射 X 射線的圖案。通常,科學家需要對蛋白質(zhì)結(jié)構(gòu)進行初步猜測才能解釋這些模式。
英國劍橋大學的結(jié)構(gòu)生物學家 Randy Read 說,以前,他們經(jīng)常將來自 PDB 中相關蛋白質(zhì)的信息拼湊起來,或者使用實驗方法,他的實驗室專門研究其中一些方法。
現(xiàn)在,AlphaFold 的預測使得大多數(shù) X 射線模式不需要這種方法,Read 說,他的實驗室正在努力在實驗模型中更好地利用 AlphaFold。「我們完全重新調(diào)整了研究重點。」
他和其他研究人員已經(jīng)使用 AlphaFold 從 X 射線數(shù)據(jù)中確定晶體結(jié)構(gòu),這些數(shù)據(jù)在沒有足夠的起始模型的情況下是無法解釋的。「人們正在解決多年來一直沒有解決的結(jié)構(gòu)。」Claudia Millán Nebot 說,他是 Read 實驗室的前博士后,現(xiàn)在在劍橋的分析公司 SciBite 工作。她預計會看到大量新的蛋白質(zhì)結(jié)構(gòu)提交給 PDB,這在很大程度上是 AlphaFold 的結(jié)果。
專門從事冷凍電鏡研究的實驗室也是如此,它可以捕捉快速冷凍蛋白質(zhì)的照片。在某些情況下,AlpHouple的模型已經(jīng)準確地預測了稱為G-蛋白偶聯(lián)受體(GPCRs)的蛋白質(zhì)的獨特特征,這些蛋白是重要的藥物靶標-其他的計算工具出錯了,北卡羅來納大學教堂山分校的結(jié)構(gòu)生物學家和藥理學家Bryan Roth說:「它似乎非常適合生成第一個模型,然后我們用一些實驗數(shù)據(jù)對其進行改進。這為我們節(jié)省了一些時間。」
但 Roth 補充說,AlphaFold 并不總是那么準確。他說,在他的實驗室已經(jīng)解決但尚未發(fā)表的幾十個 GPCR 結(jié)構(gòu)中,「大約有一半的時間,AlphaFold 結(jié)構(gòu)相當好,而有一半的時間它們或多或少對我們的目的毫無用處」。
他說,在某些情況下,AlphaFold 以高置信度標記預測,但實驗結(jié)構(gòu)表明它是錯誤的。即使軟件做對了,它也無法模擬蛋白質(zhì)與藥物或其他小分子(配體)結(jié)合時的外觀,這會大大改變結(jié)構(gòu)。這些警告讓 Roth 想知道 AlphaFold 對藥物發(fā)現(xiàn)有多大用處。
在藥物發(fā)現(xiàn)工作中,使用計算對接軟件越來越普遍,該軟件可以篩選數(shù)十億個小分子,以找到一些可能與蛋白質(zhì)結(jié)合的分子——這表明它們可以制造有用的藥物。
Roth 現(xiàn)在正與加州大學舊金山分校的藥物化學家 Brian Shoichet 合作,以了解 AlphaFold 的預測如何與本練習中通過實驗確定的結(jié)構(gòu)進行比較。
Shoichet 說,他們將工作限制在 AlphaFold 的預測與實驗結(jié)構(gòu)相吻合的蛋白質(zhì)上。但即使在這些情況下,對接軟件也會為實驗結(jié)構(gòu)和 AlphaFold 提供不同的藥物命中率,這表明微小的差異可能很重要。「這并不意味著我們不會找到新的配體,我們只會找到不同的配體,」Shoichet 說。他的團隊現(xiàn)在正在合成使用 AlphaFold 結(jié)構(gòu)識別的潛在藥物,并在實驗室中測試它們的活性。
批判性樂觀
Shoichet 說,制藥公司和生物技術公司的研究人員對 AlphaFold 幫助藥物發(fā)現(xiàn)的潛力感到興奮。「批判性的樂觀是我描述它的方式。」 2021 年 11 月,DeepMind 推出了自己的衍生產(chǎn)品 IsoMorphic Labs,旨在將 AlphaFold 和其他 AI 工具應用于藥物發(fā)現(xiàn)。但該公司對其計劃只字未提。
Karen Akinsanya 領導著 Schr?dinger 的治療開發(fā),Schr?dinger 是一家總部位于紐約市的藥物發(fā)現(xiàn)公司,也發(fā)布了化學模擬軟件,她說她們團隊已經(jīng)在虛擬屏幕、 GPCR、候選藥物的化合物設計中使用 AlphaFold 結(jié)構(gòu)取得了一些成功 。
她發(fā)現(xiàn),就像實驗結(jié)構(gòu)一樣,需要額外的軟件來獲取氨基酸側(cè)鏈或單個氫原子可能所在位置的詳細信息。一旦完成,AlphaFold 結(jié)構(gòu)已被證明足以指導藥物發(fā)現(xiàn)——在某些情況下。
「很難說『這是靈丹妙藥』;因為你可以為一個結(jié)構(gòu)做得很好——令人驚訝和令人興奮的——它非常適用于所有結(jié)構(gòu)。顯然不是!」Akinsanya 說,她的團隊發(fā)現(xiàn),AlphaFold 的準確性預測并不能顯示一個結(jié)構(gòu)是否對以后的藥物篩選有用。她表示,AlphaFold 結(jié)構(gòu)永遠不會完全取代藥物發(fā)現(xiàn)中的實驗性結(jié)構(gòu)。但他們可能會通過補充實驗方法來加速這一過程。
對 AlphaFold 感到好奇的藥物開發(fā)人員在 1 月份收到了好消息,當時 DeepMind 取消了對其用于商業(yè)應用的關鍵限制。當該公司在 2021 年 7 月發(fā)布了 AlpHouple 的代碼時,它規(guī)定了運行 AlphaFold 神經(jīng)網(wǎng)絡所需的參數(shù)或權(quán)值,這是對成千上萬個蛋白質(zhì)結(jié)構(gòu)和序列進行網(wǎng)絡訓練的最終結(jié)果,僅用于非商業(yè)用途。Akinsanya 說,這對行業(yè)中的一些人來說是一個瓶頸,當 DeepMind 改變策略時出現(xiàn)了一股「興奮的浪潮」。(RoseTTAFold 也有類似的限制,其開發(fā)人員之一 Ovchinnikov 說,但下一個版本將完全開源。)
人工智能工具不僅改變了科學家確定蛋白質(zhì)外觀的方式。一些研究人員正在使用它們來制造全新的蛋白質(zhì)。「深度學習正在徹底改變我小組中蛋白質(zhì)設計的方式。」西雅圖華盛頓大學的生物化學家、蛋白質(zhì)設計和預測其結(jié)構(gòu)領域的領導者 David Baker 說。他的團隊與計算化學家 Minkyung Baek 一起領導了開發(fā) RoseTTAFold 的工作。
Baker 的團隊讓 AlphaFold 和 RoseTTAFold 能夠「產(chǎn)生幻覺」新的蛋白質(zhì)。研究人員已經(jīng)改變了人工智能代碼,因此,給定氨基酸的隨機序列,軟件將對其進行優(yōu)化,直到它們類似于神經(jīng)網(wǎng)絡識別為蛋白質(zhì)的東西。
2021 年 12 月,Baker 團隊報告說,在細菌中表達了 129 種這些幻覺蛋白,并發(fā)現(xiàn)其中約五分之一折疊成類似于其預測形狀的東西。「這確實是第一次證明你可以使用這些網(wǎng)絡設計蛋白質(zhì)。」Baker 說。他的團隊現(xiàn)在正在使用這種方法來設計做有用事情的蛋白質(zhì),例如催化特定的化學反應,方法是指定負責所需功能的氨基酸,并讓 AI 幻想生成其余部分。
破解 AlphaFold
當 DeepMind 發(fā)布其 AlphaFold 代碼時,Ovchinnikov 想要更好地了解該工具的工作原理。幾天之內(nèi),他和包括 Steinegger 在內(nèi)的計算生物學同事建立了一個名為 ColabFold 的網(wǎng)站,允許任何人向 AlphaFold 或 RoseTTAFold 提交蛋白質(zhì)序列并獲得結(jié)構(gòu)預測。
Ovchinnikov 設想他和其他科學家會使用 ColabFold 來嘗試「破壞」AlphaFold,例如,通過提供有關目標蛋白質(zhì)序列進化親屬的虛假信息。通過這樣做,Ovchinnikov 希望他能夠確定網(wǎng)絡是如何學會如此出色地預測結(jié)構(gòu)的。
事實證明,大多數(shù)使用 ColabFold 的研究人員只是想獲得蛋白質(zhì)結(jié)構(gòu)。但其他人將其用作修改 AlphaFold 的輸入以處理新應用程序的平臺。「我沒想到會出現(xiàn)各種類型的黑客攻擊,」Jumper 說。
到目前為止,最流行的黑客攻擊是在蛋白質(zhì)復合物上使用該工具,該復合物由多個相互作用的——通常是相互交織的——肽鏈組成。就像核孔復合物一樣,細胞中的許多蛋白質(zhì)在與多個蛋白質(zhì)亞基形成復合物時發(fā)揮作用。
AlphaFold 旨在預測單個肽鏈的形狀,其訓練完全由此類蛋白質(zhì)組成。但該網(wǎng)絡似乎已經(jīng)了解了一些關于復合物如何折疊在一起的知識。在 AlphaFold 的代碼發(fā)布幾天后,東京大學的蛋白質(zhì)生物信息學家 Yoshitaka Moriwaki 在推特上表示,如果將兩個蛋白質(zhì)序列與一個長的接頭序列縫合在一起,它可以準確地預測它們之間的相互作用。Baek 很快分享了另一個從開發(fā) RoseTTAFold 中收集到的預測復合物的技巧。
ColabFold 后來加入了預測復合物的能力。并且在 2021 年 10 月,DeepMind 發(fā)布了一個名為 AlphaFold-Multimer 的更新,該更新專門針對蛋白質(zhì)復合物進行訓練,與其前身不同。Jumper 的團隊將其應用于 PDB 中的數(shù)千個復合物,發(fā)現(xiàn)它預測了大約 70% 的已知蛋白質(zhì)-蛋白質(zhì)相互作用。
這些工具已經(jīng)在幫助研究人員發(fā)現(xiàn)潛在的新蛋白質(zhì)伙伴。Elofsson 的團隊使用 AlphaFold 預測了 65,000 個人類蛋白質(zhì)對的結(jié)構(gòu),這些蛋白質(zhì)對根據(jù)實驗數(shù)據(jù)被懷疑相互作用。Baker 領導的一個團隊使用 AlphaFold 和 RoseTTAFold 來模擬酵母編碼的幾乎每一對蛋白質(zhì)之間的相互作用,識別出 100 多種以前未知的復合物。
Elofsson 說,這樣的屏幕只是起點。他們在預測某些蛋白質(zhì)配對方面做得很好,尤其是那些穩(wěn)定但難以識別更多瞬時相互作用的蛋白質(zhì)配對。「因為它看起來不錯并不意味著它是正確的。」Elofsson 說,「你需要一些實驗數(shù)據(jù)來證明你是對的。」
Kosinski 說,核孔復合體工作是預測和實驗數(shù)據(jù)如何協(xié)同工作的一個很好的例子。「這并不是說我們將所有 30 種蛋白質(zhì)都放入 AlphaFold 中并取出結(jié)構(gòu)。」為了將預測的蛋白質(zhì)結(jié)構(gòu)組合在一起,該團隊使用了核孔復合物的 3D 圖像,這些圖像是使用一種稱為低溫電子斷層掃描的低溫電子顯微鏡拍攝的。在一個例子中,可以確定蛋白質(zhì)接近度的實驗在復合物的兩個成分之間產(chǎn)生了令人驚訝的相互作用,AlphaFold 的模型隨后證實了這一點。
Kosinski 將團隊當前的核孔復合體地圖視為實驗和模擬的起點,這些實驗和模擬檢查了孔復合體的功能,以及它如何在疾病中出現(xiàn)故障。
AlphaFold 的限制
對于 AlphaFold 取得的所有進展,科學家們表示,重要的是要清楚它的局限性——特別是因為不專門預測蛋白質(zhì)結(jié)構(gòu)的研究人員會使用它。
嘗試將 AlphaFold 應用于破壞蛋白質(zhì)自然結(jié)構(gòu)的各種突變,包括與早期乳腺癌相關的突變,已證實該軟件無法預測蛋白質(zhì)新突變的后果,因為沒有進化相關的序列可供檢查。
AlphaFold 團隊現(xiàn)在正在考慮如何設計神經(jīng)網(wǎng)絡來處理新的突變。Jumper 預計這將需要網(wǎng)絡更好地預測蛋白質(zhì)如何從展開狀態(tài)變?yōu)檎郫B狀態(tài)。
紐約市哥倫比亞大學的計算生物學家 Mohammed AlQuraishi 說,這可能需要僅依靠它所學到的蛋白質(zhì)物理學知識來預測結(jié)構(gòu)的軟件。「我們感興趣的一件事是在不使用進化信息的情況下從單個序列進行預測。」他說,「這是一個尚未解決的關鍵問題。」
AlphaFold 也被設計用來預測一個單一的結(jié)構(gòu),盡管它已經(jīng)被黑客破解了不止一個。但是許多蛋白質(zhì)具有多種構(gòu)象,這對其功能可能很重要。「AlphaFold 不能真正處理可以采用不同構(gòu)象的不同結(jié)構(gòu)的蛋白質(zhì),」Schueler-Furman 說。并且預測是針對孤立結(jié)構(gòu)的,而許多蛋白質(zhì)與配體(如 DNA 和 RNA)、脂肪分子和礦物質(zhì)(如鐵)一起發(fā)揮作用。「我們?nèi)匀蝗鄙倥潴w,我們?nèi)鄙訇P于蛋白質(zhì)的其他一切。」Elofsson 說。
AlQuraishi 說,開發(fā)這些下一代神經(jīng)網(wǎng)絡將是一個巨大的挑戰(zhàn)。AlphaFold 依賴于數(shù)十年的研究,這些研究產(chǎn)生了網(wǎng)絡可以學習的蛋白質(zhì)實驗結(jié)構(gòu)。目前無法獲得如此大量的數(shù)據(jù)來捕捉蛋白質(zhì)動力學,或者蛋白質(zhì)可以與之相互作用的數(shù)萬億個小分子的形狀。Jumper 補充說,PDB 包括蛋白質(zhì)與其他分子相互作用時的結(jié)構(gòu),但這僅捕獲了一小部分化學多樣性。
研究人員認為,他們需要時間來確定如何最好地使用 AlphaFold 和相關的人工智能工具。AlQuraishi 看到了電視早期的相似之處,當時一些節(jié)目由廣播電臺組成,只是閱讀新聞。「我認為我們將找到我們尚未想到的結(jié)構(gòu)的新應用。」
AlphaFold 革命的終點在哪里,誰也說不準。「事情變化太快了。」Baker 說,「即使在明年,我們也將看到使用這些工具取得的重大突破。」
EMBL-EBI 的計算生物學家 Janet Thornton 認為,AlphaFold 的最大影響之一可能只是說服生物學家對計算和理論方法的見解更加開放。「對我來說,革命就是思維方式的改變。」她說。
AlphaFold 革命激發(fā)了 Kosinski 的遠大夢想。他認為受 AlphaFold 啟發(fā)的工具不僅可用于對單個蛋白質(zhì)和復合物進行建模,還可以對整個細胞器甚至細胞進行建模,直至單個蛋白質(zhì)分子的水平。「這是我們未來幾十年的夢想。」
相關報道:https://www.nature.com/articles/d41586-022-00997-5
未來智能實驗室的主要工作包括:建立AI智能系統(tǒng)智商評測體系,開展世界人工智能智商評測;開展互聯(lián)網(wǎng)(城市)大腦研究計劃,構(gòu)建互聯(lián)網(wǎng)(城市)大腦技術和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務。每日推薦范圍未來科技發(fā)展趨勢的學習型文章。目前線上平臺已收藏上千篇精華前沿科技文章和報告。
??如果您對實驗室的研究感興趣,歡迎加入未來智能實驗室線上平臺。掃描以下二維碼或點擊本文左下角“閱讀原文”
總結(jié)
以上是生活随笔為你收集整理的AlphaFold 和 AI 蛋白质折叠革命的下一步是什么的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文学习10-Joint entity
- 下一篇: finetune与Bert