亚洲精品国产无码成人av_国产大学生酒店激情视频_99reAV国产精品无码_亚洲一级av无码毛片精品色欲_国产成人精品三上悠亚

設(shè)為首頁(yè) | 添加收藏
關(guān)于我們
廣州市皓博儀器儀表有限公司
地址:廣州市番禺區(qū)洛浦街上漖村迎賓路99號(hào)卓維商務(wù)樓201A
TEL:020-34702588      020-34703386
FAX:020-34702518
技術(shù)支持 您的當(dāng)前位置:首頁(yè) > 技術(shù)支持
研究前沿|里程碑式研究:UK Biobank全基因組測(cè)序項(xiàng)目揭示人類遺傳多樣性
[ 發(fā)布日期:2024-1-22 16:57:32    閱讀次數(shù):443 ]


該研究對(duì)約50萬(wàn)人,包括了5個(gè)人種的參與者進(jìn)行了全基因組測(cè)序,堪稱人類基因探索的又一里程碑式研究。雖然此研究尚未正式通過(guò)同行評(píng)審正式發(fā)表,但我們也可以通過(guò)該預(yù)印本先睹為快。

圖片

 

研究背景


隨著基因測(cè)序技術(shù)的不斷發(fā)展,我們對(duì)于基因了解也越來(lái)越多。但了解越多,未知的領(lǐng)域也更多展現(xiàn)在人們眼前。為此,UK Biobank在之前的基因分型和全外顯子組測(cè)序 (WES) 研究工作的基礎(chǔ)上進(jìn)行了一個(gè)涵蓋近50萬(wàn)人的超大規(guī)模全基因組測(cè)序(WGS)工程,也是迄今為止最大規(guī)模的涵蓋了5個(gè)人種的全基因組測(cè)序。

下圖為研究框架圖:
圖片

研究人員首先通過(guò)英國(guó)生物樣本庫(kù)收集患者樣本,然后進(jìn)行WGS。對(duì)測(cè)序結(jié)果使用 GraphTyper 和 DRAGEN 數(shù)據(jù)集進(jìn)行質(zhì)量控制,然后對(duì) SNP、in/dels 和結(jié)構(gòu)變體 (SV) 進(jìn)行變體調(diào)用。此后,研究人員定義了與 SV、SNP 和基因水平相關(guān)的表型(二元和定量)(罕見變異分析),并得出結(jié)論。然后將五個(gè)人種——NFE(非芬蘭歐洲人)、SAS(南亞人)、AFR(非洲人)、ASJ(阿什肯納茲猶太人)和EAS(東亞人),和集體關(guān)聯(lián)效應(yīng)定義為跨祖先薈萃分析。

 

樣本來(lái)源及方法

研究使用了Illumina因美納NovaSeq™ 6000測(cè)序平臺(tái),對(duì)490,640名UK Biobank的參與者進(jìn)行WGS。WGS的平均測(cè)序覆蓋深度為32.5倍,并采用了重復(fù)樣品作為質(zhì)量控制。


之后,Illumina因美納 的DRAGEN Bio-IT平臺(tái)又成功調(diào)用了大量的SNP和indel變異(均處于高準(zhǔn)確性范圍),其中,SNP檢測(cè)到的靈敏度是99.77%,精度為99.91%;indel靈敏度為99.70%,精度為99.83% 。

最后,對(duì)WSG測(cè)序結(jié)果、GraphTyper和DRAGEN系統(tǒng)的變異調(diào)用結(jié)果執(zhí)行單變異測(cè)試、多祖源meta分析、罕見變異聚合分析和結(jié)構(gòu)變異分析等。

 

結(jié)果

圖1變異類型和頻率的描述

圖片

Figure 1由多個(gè)子圖組成,涉及到基因組變異的不同類型和頻率分布:

 

a) 不同群體中各類型變異的密度/數(shù)目:這個(gè)子圖展示了在五個(gè)不同祖先背景的群體中,每個(gè)個(gè)體識(shí)別出的變異數(shù)目。具體來(lái)說(shuō),變異類型包括了SNP(單核苷酸多態(tài)性)、indels(插入或缺失變異)、singleton SNPs/indels(僅出現(xiàn)一次的SNP/indels)、結(jié)構(gòu)變異中的插入和重復(fù)(insertions/duplications)以及刪除(deletions)。
b) 結(jié)構(gòu)變異(SV)的長(zhǎng)度分布:此子圖中關(guān)注SVs的大小分布,并通過(guò)顏色代碼區(qū)分不同頻率的變異,其中紅色區(qū)域代表變異大小的第25至75百分位數(shù)值,直線代表中位數(shù),頂部橫線表示95%置信區(qū)間。長(zhǎng)度分布顯示了結(jié)果趨向于更短的SVs。
c) 不同類型SVs數(shù)量:這里顯示了按照變異類別(復(fù)制、插入、刪除)分類的SV數(shù)量。
d) 插入和刪除的大小分布:此子圖指明了插入(insertions)和刪除(deletions)的尺寸范圍,從50bp到1,000bp、10,000bp甚至100,000bp的變異大小進(jìn)行了分類說(shuō)明。

圖2樣本量的變異增加分析
圖片

Figure 2描述了如何通過(guò)不同樣本量(從1000到490,541)揭示不同等位基因頻率范圍內(nèi)的變異數(shù)。具體地,橫軸表示隨機(jī)下采樣分析中的樣本數(shù)量,縱軸表示識(shí)別出的變異量。

從Figure 2可以看出:對(duì)于常見變異(如,>1%頻率),即使樣本數(shù)量增大,我們也只觀察到了變異數(shù)量較小的增加。對(duì)于稀有變異(如,<=0.001%頻率),隨著樣本量的增加,變異數(shù)量顯著增長(zhǎng),并且在樣本量最大時(shí)仍未看到增長(zhǎng)平穩(wěn),這表明繼續(xù)進(jìn)行大規(guī)模測(cè)序工作對(duì)于發(fā)現(xiàn)新的和高影響力的稀有變異具有重要價(jià)值。

圖3跨祖先的 GWS(全基因組顯著性)關(guān)聯(lián)的擾亂圖
圖片

Figure 3是一個(gè)UpSet交互圖,常用來(lái)展示多個(gè)集合之間交集和獨(dú)特元素的分布。這里顯示了全基因組顯著性(GWS)關(guān)聯(lián)的分布情況,包括跨不同祖先(種族群體)的meta-analysis以及特定祖先內(nèi)的關(guān)聯(lián)。橫軸標(biāo)簽按照GWS關(guān)聯(lián)數(shù)量進(jìn)行排序:meta-analysis、NFE(非芬蘭歐洲人)、SAS(南亞人)、AFR(非洲人)、ASJ(阿什肯納茲猶太人)和EAS(東亞人)。

根據(jù)Figure 3顯示,最多的GWS關(guān)聯(lián)發(fā)現(xiàn)在非芬蘭歐洲人群體中,緊隨其后的是meta-analysis,這表明某些基因與性狀的關(guān)聯(lián)橫跨多個(gè)種族群體。非歐洲人群中的相對(duì)少量GWS發(fā)現(xiàn)亦表明研究仍有進(jìn)一步挖掘這些群體特異性遺傳關(guān)聯(lián)的空間。

圖4HBB-HBE1基因座與貧血相關(guān)疾病的關(guān)聯(lián)
圖片

Figure 4的左半邊展示了HBB-HBE1與溶血性貧血(D55-59)在非芬蘭歐洲人(NFE)、非洲人(AFR)、南亞人(SAS)中的關(guān)聯(lián),右半邊展示了HBB-HBE1與地中海貧血(Thalassaemia, D56)在NFE、AFR、SAS種族中的關(guān)聯(lián)。

Figure 4顯示了針對(duì)特定性狀——貧血的關(guān)聯(lián)信號(hào)在不同人群中的分布。圖中突出了某些單核苷酸變異(SNPs),如rs334。該變異是SCD(鐮狀細(xì)胞?。┑囊粋€(gè)常見原因,并與HBB基因的一個(gè)錯(cuò)義突變有關(guān)。這些關(guān)聯(lián)揭示了基因變異與疾病表型之間的聯(lián)系,以及這些關(guān)聯(lián)如何因不同種族而具有不同的流行病學(xué)特征。rs334在非洲人群中較為常見,但在非芬蘭歐洲人和南亞人中較為稀少。研究結(jié)果依據(jù)不同群體種系特有的基因頻率揭示了天然選擇的痕跡,例如特定基因座的變異對(duì)抗瘧疾的保護(hù)作用可能導(dǎo)致在某群體中變異頻率較高。rs334還與其他生化指標(biāo)(如肌酐、尿素)有關(guān)聯(lián),與鐮狀細(xì)胞病的臨床表象一致。同樣,地中海貧血相關(guān)性狀的關(guān)聯(lián)研究提供了進(jìn)一步針對(duì)基因影響疾病表型的證據(jù)。

圖5攜帶有害pLoF/P/LP變異基因的人數(shù)
圖片

Figure 5描述了在全基因組測(cè)序(WGS)和全外顯子測(cè)序(WES)數(shù)據(jù)集中發(fā)現(xiàn)攜帶有害變異的基因的數(shù)量。pLoF是預(yù)測(cè)的失功能變異(putative Loss-of-Function variants),P/LP是臨床上認(rèn)定的致病/可能致病變異(Pathogenic/Likely Pathogenic variants)。橫坐標(biāo)X軸顯示了參與者的數(shù)量,縱坐標(biāo)Y軸表示具有至少一個(gè)特定數(shù)量(1,25,50,100)攜帶者的自體染色體基因的數(shù)量。

Figure 5顯示,WGS檢測(cè)到的具有至少100個(gè)攜帶有害變異的基因數(shù)量超過(guò)了WES數(shù)據(jù)集中的基因數(shù)量。Figure 5突出了WGS與WES數(shù)據(jù)集在揭示有害變異方面的比較,證明了WGS對(duì)于發(fā)現(xiàn)并理解構(gòu)成特定遺傳疾病風(fēng)險(xiǎn)的罕見和可能有害的遺傳變異的重要性。通過(guò)WGS,我們能夠在更廣泛的基因組區(qū)域內(nèi)發(fā)現(xiàn)之前可能在WES中未被檢測(cè)到的有害變異,這在病因?qū)W研究及潛在的靶向治療中極為重要。

圖6 UTR基因型與表型的關(guān)聯(lián)
圖片

Figure 6是一個(gè)塌陷分析圖,展示了通過(guò)合并分析罕見UTR變異與表型關(guān)聯(lián)的情況。圖片的上半部分展示了二進(jìn)制性狀(binary phenotypes)的關(guān)聯(lián)分析結(jié)果,下半部分展示了定量性狀(quantitative traits)的關(guān)聯(lián)分析結(jié)果。不同的顏色代表不同的UTR模型(5’ UTR、3’ UTR和兩者結(jié)合),且圖中對(duì)P值 < 1e-30的顯著關(guān)聯(lián)信號(hào)進(jìn)行了標(biāo)注。

Figure 6說(shuō)明了稀有的UTR變異對(duì)于一些生物學(xué)性狀和疾病表型確實(shí)具有重要的關(guān)聯(lián)性,在某些情況下,純UTR變異與特定表型的聯(lián)合分析可導(dǎo)致新的統(tǒng)計(jì)學(xué)上顯著關(guān)聯(lián)。說(shuō)明UTR變異在轉(zhuǎn)錄后調(diào)控以及相關(guān)疾病過(guò)程中可能存在重要作用,這些關(guān)聯(lián)和作用在以前基于WES技術(shù)進(jìn)行的研究中可能被忽視了。對(duì)于那些僅在蛋白質(zhì)編碼區(qū)有信號(hào)而UTR變異未被考慮的性狀,這一發(fā)現(xiàn)意味著應(yīng)擴(kuò)大對(duì)罕見變異和非編碼區(qū)域的探索,以更好地理解疾病機(jī)制。

 

總結(jié)

 

在這個(gè)研究中,WGS檢測(cè)到約1.5億個(gè)變異,包括單核苷酸多態(tài)性(SNP)、插入缺失變異(indels)和結(jié)構(gòu)變異(SV),這在觀察到的人類變異中較基因芯片插補(bǔ)和WES增加了18.8倍和40倍以上。相比僅通過(guò)WES能發(fā)現(xiàn)的變異,WGS能覆蓋更多的蛋白編碼區(qū)以及5’ 和3’ 未翻譯區(qū)(UTR)序列的變異。大規(guī)模的WGS數(shù)據(jù)帶來(lái)了對(duì)稀有非編碼變異在健康和疾病中作用的擴(kuò)展理解潛力,例如:

WGS數(shù)據(jù)顯示,在所有注釋類別中捕獲的變異數(shù)量都超過(guò)了WES。結(jié)構(gòu)變異(SV)發(fā)現(xiàn),雖然數(shù)量少于SNP和indels,但平均影響的堿基對(duì)數(shù)與SNP和indels相當(dāng)。通過(guò)多祖源meta分析,發(fā)現(xiàn)細(xì)胞色素C反應(yīng)蛋白降低與APOE基因突變r(jià)s429358-C有關(guān),而通常認(rèn)為這種突變會(huì)增加老年癡呆癥的風(fēng)險(xiǎn)。發(fā)現(xiàn)結(jié)構(gòu)變異的檢測(cè)能夠揭示基因與性狀之間的新關(guān)聯(lián),例如,PCSK9基因中的SV與非高密度脂蛋白膽固醇水平顯著相關(guān)。

這項(xiàng)研究提升了我們對(duì)人類遺傳變異及其疾病發(fā)生影響的認(rèn)識(shí),并將為新的診斷方法、更有效和更安全的療法的發(fā)現(xiàn),以及為可能改善全球健康的精準(zhǔn)醫(yī)學(xué)策略開發(fā)打下基礎(chǔ)。此外,這項(xiàng)研究也為探尋“選擇作用”在致病變異和保護(hù)性變異塑造人類遺傳多樣性的過(guò)程中,扮演了何種角色奠定了研究基礎(chǔ)。

UK Biobank這一項(xiàng)目所開展的全基因組測(cè)序(WGS)采用了因美納NovaSeq™ 6000測(cè)序平臺(tái),測(cè)序地點(diǎn)包括冰島deCODE Genetics和英國(guó)維康桑格研究所。對(duì)此 英國(guó)生物樣本庫(kù)副首席執(zhí)行官M(fèi)ark Effingham博士也曾表示:“如此大規(guī)模的全基因組測(cè)序?qū)夹g(shù)的精確度和靈敏度都有著極高的要求。”因美納成為英國(guó)生物樣本庫(kù)當(dāng)時(shí)首選的技術(shù)合作伙伴。此外,同時(shí)值得關(guān)注的是,該項(xiàng)目的分析亦采用了以高效和準(zhǔn)確著稱的因美納DRAGEN Germline分析流程。這一分析流程與其他大規(guī)模群體基因組學(xué)計(jì)劃所采用的分析流程相一致,以便今后對(duì)數(shù)據(jù)進(jìn)行交叉分析。其他大型群體基因組學(xué)計(jì)劃包括新加坡國(guó)家精準(zhǔn)醫(yī)學(xué)項(xiàng)目PRECISE、英國(guó)Genomics England十萬(wàn)人基因組計(jì)劃、由美國(guó)國(guó)立衛(wèi)生研究院支持的百萬(wàn)自然人群隊(duì)列研究項(xiàng)目All of Us,以及由Nashville Biosciences牽頭的基因組發(fā)現(xiàn)聯(lián)盟(Alliance for Genomic Discovery)。

本論文的原文鏈接:
www.medrxiv.org/content/10.1101/2023.12.06.23299426v1

本文轉(zhuǎn)自解螺旋公眾號(hào)
[返回]
代理品牌:
Copyright © 2003-2022 gzhopeco.com, All Rights Reserved 粵ICP備12085960號(hào)-2 版權(quán)所有 廣州市皓博儀器儀表有限公司
地址:廣州市番禺區(qū)洛浦街上漖村迎賓路99號(hào)南座201A  TEL:020-34702588 FAX:020-34702518

  技術(shù)支持:互信網(wǎng)絡(luò)