根據(jù)密歇根大學(xué)研究人員的一項(xiàng)新研究,一種使用簡(jiǎn)單、成本效益高的實(shí)驗(yàn)和機(jī)器學(xué)習(xí)模型的蛋白質(zhì)工程方法可以預(yù)測(cè)哪些蛋白質(zhì)對(duì)特定目的有效。
該方法在組裝蛋白質(zhì)和多肽方面具有深遠(yuǎn)的潛力,可用于從工業(yè)工具到治療方法的應(yīng)用。例如,這項(xiàng)技術(shù)可以幫助加速穩(wěn)定肽的開(kāi)發(fā),以目前的藥物無(wú)法做到的方式治療疾病,包括改善免疫治療中抗體與靶標(biāo)的排他性結(jié)合。
“控制蛋白質(zhì)如何工作的規(guī)則,從序列到結(jié)構(gòu)再到功能,是如此復(fù)雜。為蛋白質(zhì)工程的可解釋性做出貢獻(xiàn)尤其令人興奮,”這項(xiàng)研究的第一作者馬歇爾·凱斯說(shuō)。
目前,大多數(shù)蛋白質(zhì)工程實(shí)驗(yàn)使用復(fù)雜的、勞動(dòng)密集型的方法和昂貴的儀器來(lái)獲得非常精確的數(shù)據(jù)。漫長(zhǎng)的過(guò)程限制了可以獲得的數(shù)據(jù)量,而復(fù)雜的方法對(duì)學(xué)習(xí)和執(zhí)行來(lái)說(shuō)是具有挑戰(zhàn)性的——這是精度的權(quán)衡。
“我們的方法表明,在許多應(yīng)用中,你可以避免這些復(fù)雜的方法,”凱斯說(shuō)。
更新的方法首先將細(xì)胞分為兩組,稱(chēng)為二元分選,基于它們是否表達(dá)所需的特征-如與熒光分子的結(jié)合-或不。然后,對(duì)細(xì)胞進(jìn)行測(cè)序,以獲得感興趣的蛋白質(zhì)的潛在DNA代碼。然后,機(jī)器學(xué)習(xí)算法會(huì)減少測(cè)序數(shù)據(jù)中的噪音,從而識(shí)別出最好的蛋白質(zhì)。
密歇根大學(xué)化學(xué)工程副教授、論文通訊作者格雷格·瑟伯(Greg Thurber)說(shuō):“與其從圖書(shū)館中選擇‘最好的書(shū)’,不如讀很多書(shū),然后把不同故事的不同頁(yè)面拼湊在一起,盡可能找到最好的書(shū),即使它不在你原來(lái)的圖書(shū)館里。”“我很驚訝地看到,使用簡(jiǎn)單的二進(jìn)制排序數(shù)據(jù),這種技術(shù)的穩(wěn)健性。”
該方法使用線性機(jī)器學(xué)習(xí)模型進(jìn)一步增強(qiáng)了其可訪問(wèn)性,與具有數(shù)十個(gè)參數(shù)的模型相比,線性機(jī)器學(xué)習(xí)模型更容易解釋。
凱斯說(shuō):“因?yàn)槲覀兛梢粤私獾鞍踪|(zhì)實(shí)際工作的物理規(guī)則,我們可以使用線性方程來(lái)模擬非線性蛋白質(zhì)行為,從而制造出更好的藥物。”
這項(xiàng)研究是在高級(jí)基因組學(xué)核心、結(jié)構(gòu)生物學(xué)中心、生物質(zhì)譜設(shè)備和蛋白質(zhì)組學(xué)與肽合成核心進(jìn)行的。
(文章來(lái)源:www.ebiotrade.com/newsf/2024-3) |