10月29日,《自然-通訊》(Nature Communications)在線發(fā)表了華夏科學(xué)院上海營養(yǎng)與健康研究所/復(fù)旦大學(xué)徐書華團(tuán)隊(duì)題為Refining models of archaic admixture in Eurasia with ArchaicSeeker 2.0得研究論文。該工作提出了基于隱馬爾科夫模型(Hidden Markov Model)得計(jì)算分析新方法ArchaicSeeker 2.0。相比之前得方法,新方法能更有效地檢測和量化近緣種得基因交流,并在更精細(xì)尺度上重構(gòu)復(fù)雜得基因交流歷史;該方法也適用于非人類物種得遺傳數(shù)據(jù)分析。研究團(tuán)隊(duì)?wèi)?yīng)用新方法分析了公共開放數(shù)據(jù)庫中得人群基因組數(shù)據(jù),重塑了歐亞大陸以及大洋洲現(xiàn)代人類(modern humans)史前與遠(yuǎn)古人類(archaic hominins)得基因交流模型并重構(gòu)了現(xiàn)代人類得史前演化歷史。
近年來得研究發(fā)現(xiàn),現(xiàn)代人類得祖先在“走出非洲”、向全球探索得征途中,可能與先期抵達(dá)得古人類接觸并共存了相當(dāng)長得時(shí)期,在此期間產(chǎn)生了基因交流。其中,有代表性得古人類是目前已知得尼安德特人和丹尼索瓦人。雖然這些古人類作為物種在3萬年前均走向滅絕,但他們得基因片段卻散布在包括我們自己在內(nèi)得現(xiàn)存人類得基因組中。然而,目前幾個(gè)關(guān)鍵問題尚待探究:(1)如何在現(xiàn)代人類基因組中準(zhǔn)確識別出這些古人類得基因片段?(2)研究這些基因片段是否可以揭示出現(xiàn)代人類與古人類得族群交融史?(3)通過對從古人類遺傳交融得分析視角,重新審視長期以來建立得人類演化模型,是否應(yīng)修正或者改變我們對現(xiàn)代人類演化歷史得認(rèn)知?(4)與古人類得遺傳交融對現(xiàn)代人類遺傳和表型多樣性產(chǎn)生什么影響?特別是這些古人類基因片段具有什么樣得進(jìn)化和醫(yī)學(xué)意義?基于此,研究團(tuán)隊(duì)在前期研究基礎(chǔ)上提出了新方法ArchaicSeeker 2.0,并利用該方法分析和探討了東亞、南亞、歐洲及大洋洲得現(xiàn)代人群與尼安德特人、丹尼索瓦人之間基因漸滲、共同演化得歷史重構(gòu)等系列問題。研究團(tuán)隊(duì)進(jìn)一步將該方法應(yīng)用于分析全球人群基因組公共數(shù)據(jù),從現(xiàn)代人類基因組中檢測遠(yuǎn)古人類得基因序列并在更精細(xì)得尺度上重構(gòu)史前人類在歐亞大陸得遷徙和基因交流歷史。
曾經(jīng)發(fā)生在史前得基因交流可視為遠(yuǎn)古人類對現(xiàn)代人類得基因滲入或遺傳漸滲(genetic introgression)。從現(xiàn)代人類基因組序列中搜尋和鑒定遠(yuǎn)古人類基因片段難度較大,而基于1~2%得基因滲入信息推斷史前人類發(fā)生得歷史則更具挑戰(zhàn)。研究團(tuán)隊(duì)為此設(shè)計(jì)出一種尋找遠(yuǎn)古人類基因滲入片段,基于滲入片段長度推斷遠(yuǎn)古人類基因滲入歷史得方法——ArchaicSeeker 2.0(圖1)。相比于其他方法,ArchaicSeeker 2.0具有獨(dú)特優(yōu)勢性能,并在計(jì)算機(jī)模擬數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)分析中得到了系統(tǒng)得評估與確證。結(jié)果表明,在遠(yuǎn)古人類基因片段得判定方面,ArchaicSeeker 2.0準(zhǔn)確率超過90%,而誤判率約為0.14%。在幾乎所有得模擬實(shí)驗(yàn)中,至少80%以上推斷得古人類片段均能被匹配至正確得祖先上。此外,ArchaicSeeker 2.0在遺傳混合事件次數(shù)、基因滲入比例和遺傳交融發(fā)生得時(shí)間估計(jì)上也有良好表現(xiàn)。ArchaicSeeker 2.0對遠(yuǎn)古人類基因滲入片段精準(zhǔn)而高效地檢測以及對遺傳滲入歷史得準(zhǔn)確推斷,有助于研究現(xiàn)代人類和遠(yuǎn)古人類得混合歷史重構(gòu)。
ArchaicSeeker 2.0方法基于遠(yuǎn)古人類滲入基因片段得長度分布來推斷滲入歷史,該方法不僅能有效估計(jì)基因滲入時(shí)間,也能對滲入事件發(fā)生次數(shù)進(jìn)行更準(zhǔn)確地估計(jì)。利用ArchaicSeeker 2.0方法,研究團(tuán)隊(duì)對東亞、南亞、歐洲、大洋洲以及現(xiàn)代亞歐人類祖先烏斯特-伊斯姆人與尼安德特人、丹尼索瓦人得混合時(shí)間、次數(shù)進(jìn)行估計(jì)。結(jié)合考古學(xué)證據(jù),研究人員從時(shí)空尺度上重構(gòu)了現(xiàn)代人類和遠(yuǎn)古人類得遺傳交融歷史。此外,以往關(guān)于古人類與現(xiàn)代人類遺傳混合得研究,大多基于現(xiàn)代人類“單次出非洲”得模型。然而,科研人員發(fā)現(xiàn),“單次出非洲”模型與現(xiàn)代人類史前和其他古人類如尼安德特人、丹尼索瓦人等得混合時(shí)間與次數(shù)存在矛盾。目前得數(shù)據(jù)需要至少兩次出非洲遷移事件才能較好地解釋。一次較早得“出非洲”遷徙發(fā)生在距今約6~12萬年前,而較晚近得一次發(fā)生在距今6萬年以后。
基于ArchaicSeeker 2.0對古人類基因滲入片段精準(zhǔn)高效地評估,研究還分析了全球近300個(gè)現(xiàn)代人群中遠(yuǎn)古人類基因滲入序列功能及其分布特點(diǎn),發(fā)現(xiàn)它們富集于免疫、體重(ZNF169 )、心肺功能(HHAT)、紫外線響應(yīng)和碳水化合物得代謝(HYAL1、HYAL2、HYAL3)等相關(guān)功能基因區(qū)域。除去這些遠(yuǎn)古人類滲入片段富集區(qū)域,研究團(tuán)隊(duì)還檢測到了84個(gè)完全缺乏古人類基因片段得“漸滲沙漠”區(qū)域。而在這些“漸滲沙漠”區(qū)域中,顯著富集了與皮膚發(fā)育和角化功能有關(guān)得基因。這些發(fā)現(xiàn)為揭示遠(yuǎn)古人類基因序列滲入對現(xiàn)代人類影響提供了線索,并為進(jìn)一步研究滲入基因片段得生物學(xué)功能以及遠(yuǎn)古人類遺傳漸滲對現(xiàn)代人類進(jìn)化得影響提供了候選基因和研究靶標(biāo)。
研究工作得到中科院戰(zhàn)略性先導(dǎo)科技專項(xiàng)、China自然科學(xué)基金、上海市科學(xué)技術(shù)、China重點(diǎn)研發(fā)計(jì)劃、英國皇家學(xué)會(huì)牛頓基金等得資助,并得到中科院動(dòng)物進(jìn)化與遺傳前沿交叉卓越創(chuàng)新中心及China遺傳與發(fā)育協(xié)同創(chuàng)新中心支持。
圖1.ArchaicSeeker 2.0 方法原理示意圖
圖2.現(xiàn)代人類史前遷徙路線及其與遠(yuǎn)古人類得基因交流模式示意圖
圖3.現(xiàn)代人類演化及其與遠(yuǎn)古人類遺傳交融模式示意圖
近日:華夏科學(xué)院上海營養(yǎng)與健康研究所