近日,上海交通大學(xué)生命科學(xué)技術(shù)學(xué)院陳海峰教授課題組與馮雁教授課題組合作在中科院Top期刊《Briefings in Bioinformatics》在線發(fā)表題為Graphormer Supervised De Novo Protein Design Method and Function Validation的研究成果,該研究開發(fā)了一種原創(chuàng)而高效的全新蛋白序列設(shè)計(jì)方法GPD,該方法與當(dāng)前的SOTA方法proteinMPNN相比,序列多樣性顯著更高,生成速度快2.2倍,能夠顯著提升工業(yè)酶及蛋白質(zhì)藥物的從頭設(shè)計(jì)能力。生命科學(xué)技術(shù)學(xué)院本科生穆俊羲為第一作者,博士生李政新、本科生張博、博士生張琦為共同第一作者,生命科學(xué)技術(shù)學(xué)院陳海峰教授、馮雁教授以及魏婷助理研究員為共同通訊作者。
蛋白質(zhì)設(shè)計(jì)是幾乎所有蛋白質(zhì)工程問題的核心,因?yàn)樗梢詫?shí)現(xiàn)具有全新生物學(xué)功能的蛋白質(zhì)的創(chuàng)造,并能夠提高酶的催化效率等。蛋白質(zhì)設(shè)計(jì)的一個(gè)關(guān)鍵問題是固定骨架的蛋白質(zhì)序列設(shè)計(jì),它旨在設(shè)計(jì)新的序列以符合預(yù)定的蛋白質(zhì)骨架結(jié)構(gòu)。然而,現(xiàn)有的序列設(shè)計(jì)方法存在多種局限性,如序列多樣性低和設(shè)計(jì)的功能性蛋白質(zhì)的實(shí)驗(yàn)驗(yàn)證不足,嚴(yán)重阻礙了功能性蛋白質(zhì)設(shè)計(jì)。

圖1. GPD的模型架構(gòu)和輸入特征
為了改進(jìn)這些限制,陳海峰組開發(fā)了基于Graphormer的蛋白質(zhì)設(shè)計(jì)(GPD)模型。該模型利用Transformer進(jìn)行基于圖的3D蛋白質(zhì)結(jié)構(gòu)表示,結(jié)合高斯噪聲和序列隨機(jī)掩碼融入節(jié)點(diǎn)特征,從而增強(qiáng)了序列設(shè)計(jì)質(zhì)量。陳海峰組利用GPD設(shè)計(jì)了CalB水解酶,并生成了九條人工設(shè)計(jì)的CalB蛋白。結(jié)果顯示,與野生型CalB相比,設(shè)計(jì)序列的催化活性提高了1.7倍,并且在不同碳鏈長(zhǎng)度(C2-C16)的p-硝基苯酚醋酸酯上表現(xiàn)出強(qiáng)烈的底物選擇性。

圖2. GPD的序列設(shè)計(jì)質(zhì)量評(píng)估
陳海峰課題組首先評(píng)估了GPD的序列設(shè)計(jì)質(zhì)量,發(fā)現(xiàn)其能夠設(shè)計(jì)生成更合理的蛋白序列,并且保有較高的序列多樣性,同時(shí)多數(shù)設(shè)計(jì)的序列都能夠在結(jié)構(gòu)預(yù)測(cè)模型中折疊為所需的結(jié)構(gòu)。圖2中展示了GPD在序列可折疊性、序列同源性,以及序列多樣性方面總體優(yōu)于現(xiàn)有模型。

圖4. GPD在CALB設(shè)計(jì)上的應(yīng)用及驗(yàn)證
然后陳海峰組與馮雁組合作,將GPD應(yīng)用到南極假絲酵母酯水解酶(CALB)的重設(shè)計(jì)上,圖3展示了設(shè)計(jì)的結(jié)果:設(shè)計(jì)并篩選了9條序列,其中便有一條酶活達(dá)到原來的1.7倍。實(shí)驗(yàn)的結(jié)果說明GPD的設(shè)計(jì)具有合理性,同時(shí)效率高于之前的理性設(shè)計(jì)或定向進(jìn)化方法。
此外,對(duì)于多個(gè)底物的酶活測(cè)試發(fā)現(xiàn)GPD設(shè)計(jì)的序列均具有很高的底物特異性,這對(duì)于CALB酶的工業(yè)應(yīng)用也具有一定的意義。因此,GPD方法可用于工業(yè)酶和蛋白質(zhì)藥物的人工智能全新設(shè)計(jì),為新質(zhì)生產(chǎn)力的快速發(fā)展奠定方法學(xué)基礎(chǔ)。
該研究獲得國(guó)家重點(diǎn)研發(fā)計(jì)劃(2020YFA0907700與2023YFF1205102)、中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(YG2023LC03)以及國(guó)家自然科學(xué)基金面上項(xiàng)目(21977068與32171242)的資助。同時(shí)感謝上海交通大學(xué)超算中心提供的計(jì)算平臺(tái)支持。
論文鏈接:https://doi.org/10.1093/bib/bbae135
|