表觀基因組關(guān)聯(lián)研究(Epigenome-wide association studies,EWAS)將表觀遺傳信息如DNA甲基化與復(fù)雜疾病進(jìn)行關(guān)聯(lián),揭示非遺傳信息變異在復(fù)雜疾病的致病病因等方面的潛在作用,彌補(bǔ)了全基因組關(guān)聯(lián)分析的不足。目前,針對(duì)復(fù)雜疾病的EWAS研究大體上可以分為兩類,一類是患病分析(prevalence analyses),另一類是發(fā)病分析(incidence analyses)。前者是對(duì)整體人群的橫向分析,后者是在未發(fā)病人群中進(jìn)行縱向分析評(píng)估觀察發(fā)病情況。
然而,目前EWAS所選取的樣本較小,通常少于1,000個(gè)樣本,這限制了表觀遺傳與復(fù)雜疾病關(guān)聯(lián)的發(fā)現(xiàn)。薈萃分析(Meta-analyses)雖然可以彌補(bǔ)樣本量上的不足,但卻忽視了不同研究之間的異質(zhì)性。因此需要大隊(duì)列的針對(duì)單一人群的EWAS研究以揭示多種復(fù)雜疾病的患病和發(fā)病狀況。這種研究也會(huì)有助于開發(fā)常見疾病的血液甲基化分子標(biāo)記。此外,也需要進(jìn)行結(jié)構(gòu)性的文獻(xiàn)回顧以評(píng)估EWAS所發(fā)現(xiàn)的位點(diǎn)與疾病之間的相關(guān)性和一致性,從而進(jìn)一步證明EWAS在揭示常見復(fù)雜疾病潛在分子機(jī)制中的實(shí)用性。
近日,英國(guó)愛丁堡大學(xué)Riccardo E. Marioni 團(tuán)隊(duì)在PLOS Medicine上發(fā)表了文章Blood-based epigenome-wide analyses of 19 common disease states: A longitudinal, population-based linked cohort study of 18,413 Scottish individuals,通過對(duì)單個(gè)族裔大樣本隊(duì)列——18,413個(gè)蘇格蘭志愿者全血樣本的752,722個(gè)CpG甲基化位點(diǎn)進(jìn)行分析,評(píng)估了19疾病與DNA甲基化的關(guān)聯(lián)性。
首先,研究人員選擇了Generation Scotland: the Scottish Family Health Study(GS)隊(duì)列作為研究對(duì)象。GS由愛丁堡皇家學(xué)會(huì)于2001年提出,該計(jì)劃以家庭結(jié)構(gòu)為基礎(chǔ)。參與者必須在35歲-65歲之間(后放寬到18-65歲),必須擁有一位直系親屬或兄弟姐妹。
截止2023年5月,該計(jì)劃已經(jīng)招募了約7,000個(gè)家庭(有5,573個(gè)家庭,平均家庭成員數(shù)為4人,還有1,400名沒有親屬參與的個(gè)體)共計(jì)24,000名志愿者(包括6,665名患者、16,007名家庭成員和1,288名未經(jīng)邀請(qǐng)主動(dòng)自愿參加的個(gè)體),這些志愿者均填寫了相關(guān)調(diào)查如病史,個(gè)人健康數(shù)據(jù),并被采集了血液、尿液等樣本。
研究人員選擇了2006-2011年招募的18,413名志愿者,平均年齡47.5歲,女性占比58.8%,并將分析分成了兩部分:
1)患病分析(prevalence analyses),該組志愿者招募時(shí)已自述疾病狀態(tài)并提供了血液樣本;
2)發(fā)病分析(incidence analyses),該組志愿者在14年隨訪中出現(xiàn)新發(fā)疾病。
前一部分包括14種疾?。喊柎暮DY、乳腺癌、慢性腎病、慢性頸背疼痛、慢阻肺、結(jié)直腸癌、2型糖尿病、缺血性心臟病、肺癌骨關(guān)節(jié)炎、帕金森病、前列腺癌、風(fēng)濕性關(guān)節(jié)炎和中風(fēng)。后一部分疾病包括19種:在前一部分的14種疾病的基礎(chǔ)上加上新冠嚴(yán)重性、炎癥性腸病、肝硬化、持久性新冠和卵巢癌。
接下來,研究人員利用Illumina Infinium™ MethylationEPIC Array芯片對(duì)18,413例志愿者的全血樣本進(jìn)行了DNA甲基化檢測(cè)。通過年齡、性別、血細(xì)胞計(jì)數(shù)校正后發(fā)現(xiàn)了10種疾病里的1,340個(gè)顯著相關(guān)(association),其中90%的相關(guān)是2型糖尿病、慢阻肺和慢性疼痛。當(dāng)進(jìn)一步納入生活方式與人群結(jié)構(gòu)校正后,發(fā)現(xiàn)7種疾病的78個(gè)相關(guān)。交叉對(duì)比發(fā)現(xiàn)有4種疾病的69個(gè)相關(guān),其中2型糖尿?。?2個(gè)CpG)、乳腺癌(10個(gè)CpG)、缺血性心臟?。?個(gè)CpG)、慢性腎?。?個(gè)CpG),具體相關(guān)基因信息可見下圖。
研究人員在分析了DNA甲基化與14種不同疾病的患病分析后,進(jìn)一步分析了上述19種疾病的發(fā)病分析,通過年齡、性別、血細(xì)胞計(jì)數(shù)校正后發(fā)現(xiàn)了11種疾病里的14,237個(gè)顯著相關(guān)(association),其中分別有11,305和2,657個(gè)與慢阻肺和2型糖尿病相關(guān)。當(dāng)進(jìn)一步納入生活方式與人群結(jié)構(gòu)校正后,發(fā)現(xiàn)5種疾病的79個(gè)相關(guān)。交叉對(duì)比發(fā)現(xiàn)有2種疾病的64個(gè)相關(guān),其中2型糖尿?。?8個(gè)CpG)、慢阻肺(6個(gè)CpG),具體相關(guān)基因信息可見下圖。
最后,研究人員對(duì)分析得到的Top CpGs進(jìn)行了通路富集分析,發(fā)現(xiàn)僅有2型糖尿病以及缺血性心臟病得到了顯著的通路富集,其代表性通路有膽固醇代謝以及酒精代謝。另外,通過多種計(jì)算模型分析,如柯克距離分析(Cook’s distance)、Harrell’s C-statistic等進(jìn)一步確認(rèn)了CpG關(guān)聯(lián)的魯棒性(Robust)。進(jìn)一步,研究人員系統(tǒng)性查閱了已發(fā)表文獻(xiàn),發(fā)現(xiàn)患病分析中的69個(gè)關(guān)聯(lián)中的11個(gè),發(fā)病分析中64個(gè)關(guān)聯(lián)中的8個(gè)已經(jīng)被報(bào)道。
總之,該項(xiàng)研究通過對(duì)單一人種的大規(guī)模隊(duì)列進(jìn)行表觀基因組關(guān)聯(lián)分析,發(fā)現(xiàn)了超過100多個(gè)CpG與疾病之間的關(guān)聯(lián),證明了血液DNA甲基化可以作為常見疾病的標(biāo)志物,也提出在人類生物資源庫(kù)擴(kuò)充的背景下,對(duì)于疾病的關(guān)聯(lián)分析應(yīng)該在協(xié)變量策略、表型定義、報(bào)告指南等方面達(dá)成一致。
此外,文章中使用了Illumina Infinium™ MethylationEPIC Array對(duì)樣本進(jìn)行了全基因組甲基化檢測(cè)。2022年12月,因美納發(fā)布了甲基化芯片產(chǎn)品的升級(jí)版本Infinium™ MethylationEPIC v2.0 BeadChip。全新上市的Infinium™ MethylationEPIC v2.0 BeadChip 以Infinium™ MethylationEPIC v1.0 BeadChip全基因組骨架為基礎(chǔ),超過935K CpG,覆蓋增強(qiáng)子、CTCF結(jié)合位點(diǎn)和常見癌癥驅(qū)動(dòng)突變,并為甲基化分類方法用戶優(yōu)化了拷貝數(shù)變異(CNV)檢出。
Infinium™ MethylationEPIC v2.0 BeadChip可以相對(duì)低廉的單樣本成本產(chǎn)出高度精準(zhǔn)的DNA甲基化數(shù)據(jù),并兼容從FFPE組織樣本提取的DNA。相比于WGBS、RRBS和靶向甲基化測(cè)序相比,用EPIC v2.0獲取全基因組DNA甲基化數(shù)據(jù)的成本顯著降低,更適合大型隊(duì)列研究中對(duì)大規(guī)模樣本行進(jìn)表觀遺傳標(biāo)志物篩查。在表觀基因組關(guān)聯(lián)研究(EWAS)方面,目前大多數(shù)已發(fā)表的EWAS文章都是利用因美納MethylationEPIC或其前代產(chǎn)品HumanMethylation450完成的,作為升級(jí)版的EPIC v2.0將會(huì)在未來進(jìn)一步助力各種復(fù)雜疾病的EWAS分析。
原文鏈接:
https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1004247#sec008 |