一個國際科研團隊在9月13日出版的《自然》雜志上刊發(fā)論文稱,他們開發(fā)出一種新算法,來比較“阿爾法折疊”數(shù)據(jù)庫中所有已預(yù)測蛋白質(zhì)的結(jié)構(gòu),揭示了不同物種蛋白質(zhì)之間的相似性。最新研究結(jié)果有助科學(xué)家理解蛋白質(zhì)的進(jìn)化歷程,并為人類免疫蛋白質(zhì)的起源提供了新見解。
蘇黎世聯(lián)邦理工學(xué)院科學(xué)家開發(fā)了名為“折疊搜索聚類”的新算法,可同時分析大量蛋白質(zhì)結(jié)構(gòu)。研究團隊將該算法應(yīng)用于“阿爾法折疊”數(shù)據(jù)庫中2億個已被預(yù)測的蛋白質(zhì)結(jié)構(gòu),識別出了200多萬個獨特的結(jié)構(gòu)聚類——一組在三維形狀上彼此相似的蛋白質(zhì)結(jié)構(gòu),其中1/3的聚類以前沒有被描述或分類。
研究團隊指出,了解蛋白質(zhì)結(jié)構(gòu)對于研究其功能和進(jìn)化至關(guān)重要,盡管科學(xué)家在基于序列的蛋白質(zhì)結(jié)構(gòu)預(yù)測方面取得了重大進(jìn)展,但計算限制使大規(guī)模研究這些結(jié)構(gòu)變得困難。折疊搜索聚類算法能以前所未有的規(guī)模對結(jié)構(gòu)和集群進(jìn)行比較,將完成此類任務(wù)的時間減少了幾個數(shù)量級:使用現(xiàn)有方法對所有結(jié)構(gòu)進(jìn)行聚類需要10年,而使用折疊搜索聚類只需5天時間。
研究還深入探討了這些聚類在進(jìn)化上的意義。雖然大多數(shù)聚類都很古老,但約4%的聚類似乎屬于特定物種,為進(jìn)化現(xiàn)象提供了新見解,如新基因如何從基因組的非編碼區(qū)域產(chǎn)生。研究人員指出,這項工作不僅是為了更有效地進(jìn)行比較,而且能更好地了解蛋白質(zhì)的進(jìn)化史。
這項研究中最有趣的發(fā)現(xiàn)之一是:人類免疫系統(tǒng)蛋白質(zhì)與細(xì)菌中發(fā)現(xiàn)的蛋白質(zhì)之間的結(jié)構(gòu)具有相似性。這表明,人類參與免疫系統(tǒng)的蛋白質(zhì)可能與細(xì)菌物種有共同的古老的進(jìn)化起源,這可能重塑人們對免疫系統(tǒng)的理解,也為未來研究蛋白質(zhì)功能和進(jìn)化的奧秘制定了路線圖。
(文章來源:www.cas.cn/kj/202309/) |