職位推薦
- 珍格醫(yī)療-臨床銷售 15001-20000
- 地奧制藥-醫(yī)藥代表 6001-8000
- 普利德醫(yī)療-醫(yī)療設(shè)備銷售經(jīng)理 面議
- 大唐-兼職招商經(jīng)理 面議
- 景德中藥-直營經(jīng)理 6001-8000
- 安邦醫(yī)藥-省區(qū)招商經(jīng)理 8001-10000
- 恒瑞醫(yī)藥-醫(yī)藥信息溝通專員 6001-8000
- 黃河中藥-學(xué)術(shù)講師 8001-10000
發(fā)布日期:2022-04-01 瀏覽次數(shù):235
人類的基因組常被比作是一本書寫生命的“天書”,只有A、T、C、G四種“字母”——代表構(gòu)成DNA的四種堿基,但字?jǐn)?shù)多達(dá)60億個(gè),分布在23對染色體中,無窮的組合蘊(yùn)含著人類進(jìn)化、生老病死的無數(shù)奧秘。
21世紀(jì)之初,人類基因組序列的第一版草圖問世,盡管并不完整,卻已經(jīng)在生物醫(yī)學(xué)領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響,為臨床研究、藥物開發(fā)和醫(yī)療實(shí)踐的發(fā)展提供指引。
時(shí)隔二十一年,人類基因組測序領(lǐng)域迎來了新的里程碑:一份更完整的、無間隙的人類參考基因組。
本周,《科學(xué)》雜志同時(shí)上線的6篇論文中,一個(gè)名為“端粒到端粒”聯(lián)盟(T2T)的國際科研團(tuán)隊(duì)宣布完成了最新的人類參考基因組(被命名為T2T-CHM13),包括所有22條常染色體和X染色體的無縫組裝。其序列包含30.55億對堿基,不僅在過去的基礎(chǔ)上增加了近 2億堿基的遺傳信息——相當(dāng)于一條人類染色體包含的信息,還糾正了過往基因組序列上的許多錯(cuò)誤,并解鎖了人類基因組中結(jié)構(gòu)最為復(fù)雜的一些區(qū)域。
▲《科學(xué)》雜志以封面報(bào)道和專題的形式介紹了人類基因組測序新成果(圖片來源:《科學(xué)》雜志官網(wǎng))
填補(bǔ)最后8%的空白
由于當(dāng)時(shí)的測序技術(shù)所限,第一版人類基因組測序草圖中留有許多空白。2013年完成的新版本并經(jīng)過2019年的更新后,人類基因組測序結(jié)果中仍有數(shù)百萬個(gè)堿基由字母“N”表示,代表著該位置的實(shí)際堿基未知。更重要的是,占人類基因組大約8%的生物學(xué)重要區(qū)域處于未探明的狀態(tài)。
為了填補(bǔ)最后的空白,來自幾十個(gè)研究機(jī)構(gòu)的近100名科學(xué)家組成了大型團(tuán)隊(duì)“T2T聯(lián)盟”,也就是對每條染色體從一端的端粒到另一端的端粒進(jìn)行測序。
▲相比先前的人類參考基因組(GRCh38),此次的新版本T2T-CHM13填補(bǔ)了所有原先的空白,在過去未解決的基因組區(qū)域內(nèi),每個(gè)樣本中發(fā)現(xiàn)了數(shù)十萬個(gè)變異,為理解進(jìn)化和生物醫(yī)學(xué)新發(fā)現(xiàn)提供機(jī)會(huì)(圖片來源:參考資料[2])
讀取基因組時(shí),科學(xué)家首先將所有DNA切成數(shù)百到數(shù)千個(gè)字母長的片段,由測序機(jī)器讀取每個(gè)片段中的字母,然后科學(xué)家們試圖以正確的順序組裝片段,就像玩一個(gè)超級(jí)復(fù)雜的拼圖。
這個(gè)過程中的一大挑戰(zhàn)是,基因組中的某些區(qū)域由大段重復(fù)字母組成,就像拼圖中有些板塊由看起來一樣的碎片組成,而這些區(qū)域往往具有重要的生物學(xué)特征,某些情況下還與人類疾病有關(guān)。另一個(gè)難點(diǎn)是,絕大多數(shù)細(xì)胞內(nèi)包含兩套基因組,分別來自父親和母親。當(dāng)研究人員試圖組裝DNA片段時(shí),兩套基因組的序列混合在一起,就掩蓋了兩者本身具有的差異。
研究團(tuán)隊(duì)找到了一種只含單個(gè)基因組的細(xì)胞系來消除上述等位基因多樣性的問題。這種特殊的細(xì)胞系來自所謂的葡萄胎,是一種異常胚胎,受精后僅保留一個(gè)親本的基因組副本。
攻克難關(guān)的關(guān)鍵進(jìn)展還離不開測序技術(shù)的重大飛躍。基于具有革命性突破的長讀長測序技術(shù),研究者可以解碼更長的序列,甚至一次準(zhǔn)確讀取多達(dá)百萬級(jí)的堿基對也不成問題。
解鎖最復(fù)雜的區(qū)域
此次解鎖的新序列大約90%來自染色體的著絲粒。在形成精子或卵子的減數(shù)分裂過程中,著絲粒是成對染色體分離時(shí)附著的地方。這個(gè)區(qū)域結(jié)構(gòu)獨(dú)特,包含長段重復(fù)序列,而且DNA和蛋白質(zhì)似乎在這一區(qū)域纏繞得格外緊湊。
在T2T提供完整序列后,人類第一次有機(jī)會(huì)對著絲粒及其周圍序列的作用一探究竟。
根據(jù)他們的分析,著絲粒以及附近區(qū)域有各種序列堆疊現(xiàn)象,通常是一段新序列覆蓋在舊序列上。這一過程可以保證著絲粒與關(guān)鍵的動(dòng)粒結(jié)構(gòu)緊緊結(jié)合。動(dòng)粒是著絲粒兩側(cè)的特化結(jié)構(gòu),參與染色體的移動(dòng)過程。
▲著絲粒是一個(gè)包含高度重復(fù) DNA 序列的區(qū)域,比較這些序列揭示了突變在數(shù)百萬年中積累的位置,反映了每個(gè)重復(fù)序列的相對年齡(圖片來源:參考資料[4];Credit:Nicolas Altemose, UC Berkeley)
舊序列會(huì)存在一些隨機(jī)突變和缺失,說明這一段區(qū)域已經(jīng)被棄用;新序列中突變和甲基化都更少,說明正在被使用。而著絲粒中含有大量重復(fù)長度的DNA序列,大約為171個(gè)堿基,這些重復(fù)單元會(huì)共同形成更大的重復(fù)結(jié)構(gòu)并串聯(lián)多次,構(gòu)成了著絲粒中的重復(fù)序列區(qū)域。
著絲粒的重復(fù)序列在不同人之間同樣會(huì)存在差異。其中一篇論文比較了全世界1600人的著絲粒序列后發(fā)現(xiàn),非洲大陸以外的人,著絲粒(尤其是X染色體上的著絲粒)傾向于分成兩大簇,還有一些有意思的突變會(huì)出現(xiàn)在有非洲人血統(tǒng)的人身上。未來,科學(xué)家或許能通過解析著絲粒序列來追溯人類的譜系,對人類的演化史探索有重要意義。
▲新研究揭示了人類著絲粒基因組序列的演化機(jī)制(圖片來源:參考資料[4])
最后得到完整測序的區(qū)域
在此次發(fā)表的一系列成果中,研究人員著重分析了基因組中的重復(fù)片段在人類演化、遺傳多樣性的形成以及疾病中的重要作用。
重復(fù)片段(segmental duplication)是基因組中反復(fù)出現(xiàn)的、序列相似性超過90%以上的大段序列。無論是物種內(nèi)還是物種之間的演化過程中,大多數(shù)的遺傳變異都出現(xiàn)在重復(fù)片段區(qū)域,這里是產(chǎn)生新基因和新基因功能發(fā)生適應(yīng)性變化的關(guān)鍵。但由于結(jié)構(gòu)的復(fù)雜性,這里也是人類基因組中最后得到完整測序的區(qū)域。
▲更完整的人類基因組測序結(jié)果加深我們對重復(fù)片段的理解(圖片來源:參考資料[3])
現(xiàn)在,基于最新的完整人類基因組測序結(jié)果,科學(xué)家終于能夠以更綜合的視角審視人類的重復(fù)片段。在這類區(qū)域,科學(xué)家找到了182個(gè)全新的蛋白質(zhì)編碼基因,并且?guī)椭覀兝斫庖幌盗兄匾难莼c醫(yī)學(xué)難題。
例如,比較人類與其他靈長類動(dòng)物的測序結(jié)果,研究發(fā)現(xiàn)了與人類前額葉皮層擴(kuò)張相關(guān)的基因TBC1D3,這將有助于重現(xiàn)古人類演化的歷史。而在不同人類個(gè)體間,在重復(fù)片段區(qū)域編碼脂蛋白的LPA基因,其數(shù)量與心血管疾病風(fēng)險(xiǎn)高度相關(guān)……
基于這項(xiàng)研究,我們能夠全面理解重復(fù)片段的組織、表達(dá)與調(diào)控,并提升基因注釋與基因分型。
▲詳細(xì)描繪了人類基因組中重復(fù)序列的轉(zhuǎn)錄和甲基化狀態(tài),為功能研究奠定基礎(chǔ)(圖片來源:參考資料[6])
在另一項(xiàng)研究中,康涅狄格大學(xué)Rachel O'Neill教授領(lǐng)導(dǎo)的團(tuán)隊(duì)揭示了重復(fù)序列的轉(zhuǎn)錄與表觀遺傳狀態(tài)。重復(fù)序列包含移動(dòng)遺傳元件,它們可以移動(dòng)至基因組的其他區(qū)域。研究指出,一些多次重復(fù)的片段所包含的基因,能在很大程度上解釋人類的遺傳多樣性。
除了從基因組的角度揭示特定重復(fù)序列對人類的影響,這項(xiàng)研究還從局部(例如著絲粒中)分析了重復(fù)序列的轉(zhuǎn)錄圖景、描繪了甲基化的情形。這些結(jié)果將幫助我們理解轉(zhuǎn)錄在基因組穩(wěn)定性以及染色體分離機(jī)制中的作用。
參考資料:
[1] Sergey Nurk et al., (2022) The complete sequence of a human genome. Science. Doi: 10.1126/science.abj6987
[2] Sergey Aganezov et al., (2022) A complete reference genome improves analysis of human genetic variation. Science DOI: 10.1126/science.abl3533
[3] Mitchell R. Vollger et al., (2022) Segmental duplications and their variation in a complete human genome. Science https://doi.org/10.1126/science.abj6965
[4] Complete genomic and epigenetic maps of human centromeres. Science(2022), DOI: 0.1126/science.abl4178
[5] A. Gershman et al., Epigenetic patterns in a complete human genome. Science 376, eabj5089 (2022). DOI: 10.1126/science.abj5089
[6] S. J. Hoyt et al., (2022) From telomere to telomere: The transcriptional and epigenetic state of human repeat elements Science DOI: 10.1126/science.abk3112
[7] Complete human genome deciphered for the first time. Retrieved Apr. 1, from https://www.eurekalert.org/news-releases/946948
300多萬優(yōu)質(zhì)簡歷
17年行業(yè)積淀
2萬多家合作名企業(yè)
微信掃一掃 使用小程序