2021年7月16日,谷歌旗下的DeepMind團(tuán)隊(duì)在 Nature 發(fā)表論文,發(fā)布了開源了基于人工智能(AI)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具——AlphaFold2,AlphaFold2僅通過氨基酸序列就能以前所未有的準(zhǔn)確度預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)。 近期,巴塞爾大學(xué)和SIB瑞士生物信息學(xué)研究所的一個(gè)研究小組發(fā)現(xiàn)了一個(gè)未知蛋白質(zhì)的寶庫(kù)。利用這種AI,他們發(fā)現(xiàn)了數(shù)百個(gè)新的蛋白質(zhì)家族,甚至是一個(gè)新的預(yù)測(cè)蛋白質(zhì)折疊。這項(xiàng)研究現(xiàn)已發(fā)表在Nature.
在過去的幾年里,AlphaFold已經(jīng)徹底改變了蛋白質(zhì)科學(xué)。這種人工智能(AI)工具經(jīng)過了50多年來(lái)生命科學(xué)家收集的蛋白質(zhì)數(shù)據(jù)的訓(xùn)練,能夠高精度地預(yù)測(cè)蛋白質(zhì)的3D形狀。去年,它的成功促成了驚人的2.15億個(gè)蛋白質(zhì)的建模,提供了對(duì)幾乎任何蛋白質(zhì)形狀的深入了解。這對(duì)于沒有經(jīng)過實(shí)驗(yàn)研究的蛋白質(zhì)來(lái)說(shuō)尤其有趣,這是一個(gè)復(fù)雜而耗時(shí)的過程。
“現(xiàn)在有許多蛋白質(zhì)信息來(lái)源,包含了蛋白質(zhì)如何進(jìn)化和工作的寶貴見解,”該研究的負(fù)責(zé)人Joana Pereira說(shuō)。然而,長(zhǎng)期以來(lái),研究一直面臨著data jungle的問題。由巴塞爾大學(xué)生物中心和瑞士生物信息學(xué)研究所(SIB)組長(zhǎng)Torsten Schwede教授領(lǐng)導(dǎo)的研究小組現(xiàn)在成功地解密了一些隱藏的信息。
新的蛋白質(zhì)家族和折疊
研究人員構(gòu)建了一個(gè)由5300萬(wàn)個(gè)具有高質(zhì)量AlphaFold結(jié)構(gòu)的蛋白質(zhì)組成的互動(dòng)網(wǎng)絡(luò)。第一作者Janani Durairaj博士強(qiáng)調(diào)說(shuō):“這個(gè)網(wǎng)絡(luò)是理論上預(yù)測(cè)未知蛋白質(zhì)家族及其大規(guī)模功能的寶貴來(lái)源。”該團(tuán)隊(duì)能夠識(shí)別290個(gè)新的蛋白質(zhì)家族和一個(gè)類似花朵形狀的新蛋白質(zhì)折疊。
基于Schwede集團(tuán)在開發(fā)和維護(hù)領(lǐng)先軟件SWISS-MODEL方面的專業(yè)知識(shí),他們將該網(wǎng)絡(luò)作為交互式網(wǎng)絡(luò)資源提供,稱為“Protein Universe Atlas”。
人工智能在研究中是一個(gè)有價(jià)值的工具
該團(tuán)隊(duì)使用基于深度學(xué)習(xí)的工具在這個(gè)網(wǎng)絡(luò)中尋找新奇之處,為生命科學(xué)的創(chuàng)新鋪平了道路,從基礎(chǔ)研究到應(yīng)用研究。Pereira說(shuō):“了解蛋白質(zhì)的結(jié)構(gòu)和功能通常是開發(fā)新藥或通過蛋白質(zhì)工程修改其功能的第一步。”這項(xiàng)工作得到了SIB的“kickstarter”資助,鼓勵(lì)在生命科學(xué)資源中采用人工智能。它強(qiáng)調(diào)了深度學(xué)習(xí)和智能算法在研究中的變革潛力。
有了蛋白質(zhì)宇宙圖譜,科學(xué)家們現(xiàn)在可以了解更多與他們的研究相關(guān)的蛋白質(zhì)。Janani Durairaj說(shuō):“我們希望這個(gè)資源不僅可以幫助研究人員和生物管理員,還可以為學(xué)生和教師提供一個(gè)學(xué)習(xí)蛋白質(zhì)多樣性的新平臺(tái),從結(jié)構(gòu)、功能到進(jìn)化。”
蛋白質(zhì)宇宙圖譜:https://uniprot3d.org/atlas/AFDB90v4
(文章來(lái)源:www.ebiotrade.com/newsf/2023-9) |