AlphaFold(阿爾法折疊)是由DeepMind開發(fā)的一款蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)程序。借助AlphaFold,人類預(yù)測(cè)了幾乎所有2億種已知蛋白質(zhì)的結(jié)構(gòu),并可以設(shè)計(jì)出人類自己的蛋白質(zhì)。
AlphaFold采用深度學(xué)習(xí)技術(shù),有AlphaFold 1(2018)、AlphaFold 2(2020)、AlphaFold 3(2024)3個(gè)主要版本。可以預(yù)測(cè)蛋白質(zhì)或蛋白質(zhì)-蛋白質(zhì)配位化合物的結(jié)構(gòu),而是能夠破解蛋白質(zhì)與各種生物分子所形成的復(fù)合體結(jié)構(gòu)及其相互作用。主研團(tuán)隊(duì)DeepMind匯集了來自結(jié)構(gòu)生物學(xué),物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的專家,以應(yīng)用技術(shù)根據(jù)其基因序列預(yù)測(cè)蛋白質(zhì)的3D結(jié)構(gòu)。2018年,AlphaFold 1推出并在的CASP(蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的關(guān)鍵評(píng)估)競(jìng)賽中排名第一,并成功預(yù)測(cè)了被評(píng)為最困難目標(biāo)的蛋白質(zhì)結(jié)構(gòu)。在“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)奧運(yùn)會(huì)”CASP比賽中,力壓其他97個(gè)參賽者。《衛(wèi)報(bào)》報(bào)道稱,AlphaFold預(yù)測(cè)出了43種蛋白質(zhì)中25種蛋白質(zhì)的最精確結(jié)構(gòu)。在同一類別中排名第二的隊(duì)伍,只預(yù)測(cè)出了3種。在2020年的CASP競(jìng)賽中,AlphaFold 2中位分?jǐn)?shù)為92.4(滿分100)。其準(zhǔn)確度遠(yuǎn)高于其他任何程序。2024年5月8日,AlphaFold3發(fā)布,將技術(shù)擴(kuò)展到蛋白質(zhì)折疊之外,能準(zhǔn)確預(yù)測(cè)蛋白質(zhì)、脫氧核糖核酸、核糖核酸、配體等生命分子的結(jié)構(gòu)及相互作用。
AlphaFold被美國(guó)《科學(xué)》雜志評(píng)為2020年十大科學(xué)突破之一;入圍2021年中國(guó)工程院發(fā)布全球十大工程成就。
研究背景
蛋白質(zhì)通常由20種不同的氨基酸組成,可以被描述為生命的基石。蛋白質(zhì)是維持人們生命所必需的龐大而復(fù)雜的物質(zhì)。人們身體的幾乎所有功能,例如收縮肌肉、感知光線或?qū)⑹澄镛D(zhuǎn)化成能量等,都需要一種或多種蛋白質(zhì)來完成。而蛋白質(zhì)具體能做什么就要取決于它獨(dú)特的3D結(jié)構(gòu)了。純粹基于其基因序列推測(cè)蛋白質(zhì)的3D結(jié)構(gòu)是一項(xiàng)非常具有挑戰(zhàn)性的復(fù)雜任務(wù)。這是因?yàn)槿藗兊?a href="/hebeideji/7222994910638391311.html">脫氧核糖核酸通常只包含蛋白質(zhì)中氨基酸殘基的序列信息,而這些氨基酸殘基形成的長(zhǎng)鏈將會(huì)折疊成錯(cuò)綜復(fù)雜的3D結(jié)構(gòu),加上蛋白質(zhì)越大,需要考慮的氨基酸之間的相互作用就越多,對(duì)其結(jié)構(gòu)的建模過程就會(huì)更加復(fù)雜和困難。
起源發(fā)展
探索期
19世紀(jì)以來,科學(xué)家們知道蛋白質(zhì)對(duì)生命過程非常重要,直到1950年代,化學(xué)工具才精確到足以讓研究人員開始詳細(xì)地探索蛋白質(zhì)。劍橋大學(xué)的研究人員約翰·肯德魯和佩魯茨,M.F.,成功地使用了一種稱為X射線晶體學(xué)的方法,提出了第一個(gè)蛋白質(zhì)的三維模型,并于1962年獲得諾貝爾化學(xué)獎(jiǎng)。
1994年,科學(xué)家們啟動(dòng)了一個(gè)名為“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估(CASP)”的項(xiàng)目,并發(fā)展成為一個(gè)競(jìng)賽。但直到2018年,才出現(xiàn)了突破。國(guó)際象棋大師、神經(jīng)科學(xué)專家、人工智能先驅(qū)戴密斯·哈薩比斯與人共同創(chuàng)立DeepMind(深思)公司。2014年,該公司被出售給谷歌,兩年后DeepMind擊敗了圍棋世界冠軍,一戰(zhàn)成名。
發(fā)展期
科學(xué)家們已經(jīng)能夠利用冷凍電子顯微鏡、核磁共振或X射線晶體學(xué)等技術(shù)在實(shí)驗(yàn)室中確定蛋白質(zhì)的形狀,但這些方法都需要通過大量的試錯(cuò)才能獲得最終的結(jié)果,這可能需要花上好幾年時(shí)間以及大量的資金。得益于基因測(cè)序成本的快速降低,基因組學(xué)領(lǐng)域的數(shù)據(jù)變得豐富了起來。一些科學(xué)家們開始利用AI技術(shù)開發(fā)深度學(xué)習(xí)算法,在基因組學(xué)數(shù)據(jù)的基礎(chǔ)上對(duì)蛋白質(zhì)結(jié)構(gòu)進(jìn)行預(yù)測(cè)。在此基礎(chǔ)上,AlphaFold誕生了。
2018年12月,DeepMind宣布推出AlphaFold,能夠預(yù)測(cè)并生成蛋白質(zhì)的3D結(jié)構(gòu)。將過去預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)最多達(dá)到40%的準(zhǔn)確性,一下提高到了近60%。
2020年,戴密斯·哈薩比斯和約翰·M·詹伯發(fā)布AlphaFold2,在神經(jīng)網(wǎng)絡(luò)中引入了在自然語(yǔ)言處理中常用的注意力機(jī)制,用來考量蛋白質(zhì)序列中關(guān)鍵殘基的效應(yīng),這極大程度提高了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的精確性;系統(tǒng)能夠生成出極其精確的蛋白質(zhì)三維結(jié)構(gòu)模型,在該模型的幫助下,研究人員已經(jīng)能夠預(yù)測(cè)并鑒定出2億種幾乎所有蛋白質(zhì)的結(jié)構(gòu)。同年11月30日,美國(guó)《科學(xué)》雜志網(wǎng)站稱,alphafold攻克了生物學(xué)領(lǐng)域一項(xiàng)重大難題:預(yù)測(cè)蛋白質(zhì)如何從線性氨基酸鏈卷曲成3D形狀以執(zhí)行任務(wù),將加快新藥研發(fā)進(jìn)程。2020年12月,DeepMind發(fā)布消息稱,其人工智能系統(tǒng)“AlphaFold”人工智能系統(tǒng)參加了由結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估組織(CASP)的一項(xiàng)如何計(jì)算蛋白質(zhì)分子3D結(jié)構(gòu)的競(jìng)賽,并且預(yù)測(cè)準(zhǔn)確性達(dá)到前所未有的水平。將為解決人類50年來的巨大挑戰(zhàn)鋪平道路。
2021年,Deep Mind與歐洲生物信息學(xué)研究所合作,公開了阿爾法折疊DB,這是一個(gè)包含數(shù)以萬計(jì)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的數(shù)據(jù)庫(kù)。這些數(shù)據(jù)的公開讓全球的科研人員都能夠免費(fèi)訪問這些蛋白質(zhì)結(jié)構(gòu)信息。
2024年5月8日,Google DeepMind與Isomorphic Labs聯(lián)合開發(fā)并通過《自然》期刊首次發(fā)布AlphaFold3,標(biāo)志著一項(xiàng)重大進(jìn)步,將技術(shù)擴(kuò)展到蛋白質(zhì)折疊之外,能以前所未有的精度準(zhǔn)確預(yù)測(cè)蛋白質(zhì)、脫氧核糖核酸、核糖核酸、小分子等幾乎所有生物分子的結(jié)構(gòu)及相互作用。2024年5月14日,Google DeepMind的研發(fā)人員宣布計(jì)劃于2024年11月發(fā)布AlphaFold3模型(包括權(quán)重),以供學(xué)術(shù)界使用。同時(shí),網(wǎng)頁(yè)版本的AlphaFold server使用限制也將從每人每天的10次提升到20次。2024年11月11日(當(dāng)?shù)貢r(shí)間),AlphaFold3開源。
工作原理
DeepMind團(tuán)隊(duì)使用的方法都以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),從基因序列中預(yù)測(cè)蛋白質(zhì)的兩種物理性質(zhì):氨基酸對(duì)之間的距離及連接這些氨基酸的化學(xué)鍵之間的角度。首先,研究小組訓(xùn)練了一個(gè)深度神經(jīng)網(wǎng)絡(luò),來預(yù)測(cè)蛋白質(zhì)中每對(duì)氨基酸殘基之間距離的分布情況。然后,研究人員將這些數(shù)值轉(zhuǎn)化為評(píng)分,來對(duì)蛋白質(zhì)結(jié)構(gòu)的精確程度進(jìn)行評(píng)估。同時(shí),研究人員還另外訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò),利用這些距離數(shù)值來評(píng)估預(yù)測(cè)結(jié)構(gòu)與真實(shí)結(jié)構(gòu)的接近程度。
DeepMind的研究人員在這些評(píng)分函數(shù)的基礎(chǔ)上使用了一個(gè)生成神經(jīng)網(wǎng)絡(luò),不斷生成新的蛋白質(zhì)片段來反復(fù)替換一段舊的蛋白質(zhì)結(jié)構(gòu),這樣一來,蛋白質(zhì)結(jié)構(gòu)的評(píng)分就被不斷提高了。另外,研究人員還使用了一種名為梯度下降的方式來讓AlphaFold預(yù)測(cè)的結(jié)構(gòu)變得高度精確。
蛋白質(zhì)三維結(jié)構(gòu)由主鏈和側(cè)鏈搭建而成,“阿爾法折疊3”在主鏈的預(yù)測(cè)上能夠提供足夠的有效信息,讓人們看到主鏈的走勢(shì)和蛋白質(zhì)的整體結(jié)構(gòu),同時(shí)它也有效提高了對(duì)側(cè)鏈預(yù)測(cè)的精度和速度,但并不能從根本上解決對(duì)于側(cè)鏈的精細(xì)擺放問題。
關(guān)鍵技術(shù)
AlphaFold通過將機(jī)器學(xué)習(xí)作為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)網(wǎng)絡(luò)的核心組成部分,讓AlphaFold從數(shù)據(jù)中自行發(fā)現(xiàn)模式規(guī)律。
技術(shù)不足處
DeepMind團(tuán)隊(duì)坦陳了該模型的諸多不足,模型輸出有時(shí)會(huì)違反手性規(guī)則,盡管輸入是正確手性的參考結(jié)構(gòu),模型偶爾會(huì)產(chǎn)生重疊的原子等。
主研團(tuán)隊(duì)
價(jià)值意義
社會(huì)效益
DeepMind 已經(jīng)發(fā)布了該系統(tǒng)的詳細(xì)工作原理,并發(fā)布了源代碼。AlphaFold 開源之后,影響力逐漸擴(kuò)大。該公司還與歐洲生物信息學(xué)研究所(European Bioinformatics Institute)建立了一個(gè)公共數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)正在填充 AI 預(yù)測(cè)的新的蛋白質(zhì)結(jié)構(gòu),條目幾乎是科學(xué)已知的所有蛋白質(zhì)。
抗體藥物
在抗體藥物方面,“阿爾法折疊3”具備極大優(yōu)勢(shì),而在預(yù)測(cè)類似藥物相互作用,包括蛋白質(zhì)與配體的結(jié)合以及抗體與靶蛋白的結(jié)合方面,阿爾法折疊3達(dá)到了前所未有的準(zhǔn)確性。
示范效應(yīng)
AlphaFold 的出現(xiàn)讓科學(xué)智能(Ai for Science)的概念開始深入人心。
所獲榮譽(yù)
團(tuán)體榮譽(yù)
個(gè)體榮譽(yù)
2024年10月9日,2024年諾貝爾化學(xué)獎(jiǎng)的一半授予大衛(wèi)·貝克,以表彰他在“計(jì)算蛋白質(zhì)設(shè)計(jì)”方面的貢獻(xiàn),另一半授予戴密斯·哈薩比斯和約翰·詹伯,以表彰他們?cè)凇暗鞍踪|(zhì)結(jié)構(gòu)預(yù)測(cè)”方面的貢獻(xiàn)。
參考資料:
綜合評(píng)價(jià)
Alphafold在加快研究速度方面具有變革性,。研究人員無需花費(fèi)數(shù)年時(shí)間在實(shí)驗(yàn)室研究蛋白質(zhì),可以通過Alphafold在幾分鐘內(nèi)得到結(jié)果。(倫敦國(guó)王學(xué)院的生物學(xué)家朱利安·伯杰龍 評(píng))
盡管AlphaFold預(yù)測(cè)并非全部準(zhǔn)確,但其提供了可信的假說,可以用作提示機(jī)制。所有這些能力很可能只是人工智能方法在結(jié)構(gòu)生物學(xué)中日益廣泛應(yīng)用的開端。(《自然》雜志 評(píng))
Alphafold3是諾貝爾獎(jiǎng)級(jí)的成果,Alphafold3不是以往技術(shù)上的修修補(bǔ)補(bǔ),直接改變了上一代版本的核心架構(gòu),用“擴(kuò)散模塊”取代了上一代中非常重要的“結(jié)構(gòu)模塊”,采用了生成擴(kuò)散模型來預(yù)測(cè)生物大分子結(jié)構(gòu)。(復(fù)旦大學(xué)復(fù)雜體系多尺度研究院院長(zhǎng)馬劍鵬 評(píng))
人體每一種蛋白質(zhì)都包含幾十到幾百種氨基酸,氨基酸的順序決定了它們之間的作用,賦予蛋白質(zhì)復(fù)雜的三維形狀,進(jìn)而決定了蛋白質(zhì)的功能。幾十年來,科學(xué)家利用X射線晶體學(xué)或低溫電子顯微鏡等實(shí)驗(yàn)技術(shù)來破譯蛋白質(zhì)的三維結(jié)構(gòu),但這種方法可能需要數(shù)月甚至數(shù)年,且未必見效。“阿爾法折疊”的出現(xiàn)被認(rèn)為改變了游戲規(guī)則,取得了根本性突破,同時(shí),我們欣喜地看到這一AI還在不斷升級(jí)、擴(kuò)展,以更高的準(zhǔn)確率覆蓋到了更多的復(fù)合物。(《科技日?qǐng)?bào)》評(píng))
參考資料 >
革命性進(jìn)展?諾獎(jiǎng)級(jí)發(fā)現(xiàn)?“阿爾法折疊3”是重磅創(chuàng)新還是版本升級(jí).文匯網(wǎng).2024-10-09
諾貝爾化學(xué)獎(jiǎng)也花落AI領(lǐng)域!剛剛,AlphaFold開發(fā)者等人獲獎(jiǎng) | 深度解讀.今日頭條.2024-10-09
AI贏麻了?2024年諾貝爾化學(xué)獎(jiǎng)授予蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)|科技觀察.封面新聞.2024-10-09
「AlphaFold 3」要來了?DeepMind推出新一代蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具,已用于藥物設(shè)計(jì).百家號(hào).2024-03-12
諾貝爾化學(xué)獎(jiǎng)也頒給了AI!曾經(jīng)是“太陽(yáng)底下最難的科學(xué)問題之一”.上觀新聞”.2024-10-09
AlphaGo后再出神作!DeepMind打造AlphaFold擊敗人類,精度碾壓人類專家!.百家號(hào).2024-03-12
DeepMind劃時(shí)代杰作!AlphaFold蛋白結(jié)構(gòu)預(yù)測(cè)擊敗人類奪冠.百家號(hào).2024-03-13
谷歌最新人工智能AlphaFold,成功預(yù)測(cè)生命基本分子.澎湃新聞.2024-03-07
DeepMind推出二代AlphaFold,破解蛋白質(zhì)分子折疊,生物學(xué)或遇“未有之變局”.雪球.2024-03-07
AlphaFold2“火了”后,新一屆CASP大賽結(jié)果出爐 !多個(gè)中國(guó)團(tuán)隊(duì)斬獲第一,蛋白結(jié)構(gòu)預(yù)測(cè)難度升級(jí).網(wǎng)易手機(jī)網(wǎng).2024-03-07
中國(guó)工程院發(fā)布全球十大工程成就:中國(guó)天眼、雜交水稻等入選.澎湃新聞.2021-12-14
“阿爾法折疊”精準(zhǔn)預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu).新華網(wǎng).2021-01-15
DeepMind稱AI能精確預(yù)測(cè)蛋白折疊 將加速藥物設(shè)計(jì).搜狐新聞.2021-01-15
重大突破!谷歌AI模型登《自然》期刊.證券時(shí)報(bào).2024-10-09
AI protein-prediction tool AlphaFold3 is now more open.nature.2025-07-13
人工智能讓結(jié)構(gòu)生物學(xué)家“失業(yè)”?復(fù)旦教授釋疑.上觀新聞.2024-10-09
準(zhǔn)確率比現(xiàn)有方法高50%!谷歌DeepMind全新深度學(xué)習(xí)模型AlphaFold 3重磅論文登上《自然》,系首個(gè)在生物分子結(jié)構(gòu)預(yù)測(cè)方面超越基于物理工具方法的AI系統(tǒng).每日經(jīng)濟(jì)新聞.2024-10-09
新一代“阿爾法折疊”登場(chǎng).河北省科學(xué)技術(shù)廳.2024-10-09