版納植物園基于全基因組數(shù)據(jù)解析新型冠狀病毒的演化和傳播
中國科學(xué)院西雙版納熱帶植物園
2019年12月在湖北武漢爆發(fā)了一種新型冠狀病毒(SARS-CoV-2)所致的肺炎(現(xiàn)稱COVID-19),新型冠狀病毒爆發(fā)已兩個多月,確定華南海鮮市場是不是唯一的發(fā)源地,對于尋找病毒的來源,以及確定中間宿主,對疫情的控制和避免再次爆發(fā)具有至關(guān)重要的意義。中國科學(xué)院西雙版納熱帶植物園聯(lián)合華南農(nóng)業(yè)大學(xué)和北京腦科中心的科研人員一起收集了全世界各領(lǐng)域共享到GISAID EpiFluTM數(shù)據(jù)庫中覆蓋了四大洲12個國家的93個新型冠狀病毒樣本的基因組數(shù)據(jù)(截止2月12日),通過全基因組數(shù)據(jù)解析,追溯傳染源及擴(kuò)散路徑。研究發(fā)現(xiàn),收到的93個樣本包含58種單倍型,可以歸納為五組(圖1),包括3個古老超級傳播者單倍型(H1,H3和H13)和2個新的超級傳播者單倍型(H56和mv2);華南海鮮市場的新型冠狀病毒是從其他地方傳入進(jìn)來,在市場中發(fā)生快速傳播蔓延到市場之外;同時,現(xiàn)擴(kuò)散的病例至少來自于3個途經(jīng)。新型冠狀病毒在2月12日之前發(fā)生過2次明顯的種群擴(kuò)張(分別是12月8日和1月6日)。
華南海鮮市場的新型冠狀病毒是從其他地方傳入的
基于120個變異位點得到58種單倍型(基因類型),單倍型演化關(guān)系顯示,單倍型H13和H38是比較“古老的”單倍型,通過一個中間載體(mv1,可能是一個祖先單倍型,可能是來自中間宿主或者“零號病人”)與蝙蝠冠狀病毒RaTG13關(guān)聯(lián),并通過單倍型H3衍生出了單倍型H1。與華南海鮮市場有關(guān)聯(lián)的患者樣品單倍型都是H1及其衍生的單倍型H2,H8-H12(圖1,A),而一份武漢樣品單倍型H3與華南海鮮市場無關(guān)。可見,華南海鮮市場的新型冠狀病毒是從其他地方傳入進(jìn)來,在市場中發(fā)生快速傳播蔓延到市場之外。另外,根據(jù)病患發(fā)病時間記錄和種群擴(kuò)張時間推斷,也印證了華南海鮮市場不是病毒發(fā)源地的推論。
對“古老的”單倍型H13和H38的病毒樣品溯源發(fā)現(xiàn)分別是來自深圳的病患(廣東首例)和美國華盛頓州的病患(美國首例)。他們的旅行記錄表明應(yīng)該都是2019年12月底至2020年1月初在武漢探親期間被感染的。現(xiàn)有武漢樣本中沒有檢測到H13和H38單倍型,可能是因為現(xiàn)有樣品主要采自幾家定點醫(yī)院,而且樣品采集時間局限于2019年12月24日和2020年1月5日。如果能在武漢其他醫(yī)院早期的病患檢測到這兩種單倍型,將對于尋找病毒來源非常有幫助。
新型冠狀病毒在2月12日之前發(fā)生過2次明顯的種群擴(kuò)張
根據(jù)新型冠狀病毒基因組數(shù)據(jù)推算1月之前的種群擴(kuò)張發(fā)生時間是12月8日,該結(jié)果暗示病毒可能在12月初,甚至11月下旬即已經(jīng)開始有人際傳播,隨后在華南海鮮市場加快了人際傳播(圖2)。研究推算2月份之前的種群擴(kuò)張時間在1月6日,這個可能與元旦假期有關(guān)聯(lián)。需要指出,這一天國家疾控中心發(fā)布了2級應(yīng)急響應(yīng)。當(dāng)時的預(yù)警起到了一些警示作用,公眾活動和出行都有所減少。如果當(dāng)時的警示能引起大眾更廣泛的重視,那么1月份中下旬向全國和全球蔓延的病例會有所降低。研究人員進(jìn)一步確認(rèn)我國其他9個省區(qū)和其他11個國家的感染病例基本都是從武漢直接或者間接輸入而來。
現(xiàn)擴(kuò)散的病例至少來自于3個途徑
為了能夠細(xì)分來源,研究人員將58種單倍型分成了五組(圖1),采用標(biāo)準(zhǔn)是3個中心(古老超級傳播者)單倍型(H1,H3和H13)和2個新的超級傳播者單倍型(H56和mv2)。以此鑒別出廣東的病毒可能有三個來源,重慶和臺灣的病毒有兩個來源。其中,廣東深圳一家人在早期就通過人傳人進(jìn)行了傳播。有較多樣本的澳大利亞、法國、日本和美國,他們的患者感染源至少有兩個,尤其是美國包括了五個來源。非常值得關(guān)注的是H56這個超級傳播者單倍型,它同時是澳大利亞、法國和美國,以及我國臺灣患者的傳染源。其他國家患者因為樣品比較少,大多數(shù)的來源比較單一,他們除了是武漢旅游輸入或在武漢感染外,有一些人可能是在廣東、新加坡等地被感染。
新型冠狀病毒基因組尚未發(fā)生重組事件
研究人員發(fā)現(xiàn)新型冠狀病毒基因組沒有發(fā)生重組事件,93個基因組之間有120核苷酸發(fā)生了突變(0.41%序列長度),并均勻分散在10個編碼區(qū)(χ2=1.958, df=9, P=0.99)。120個突變的核苷酸關(guān)聯(lián)了119個氨基酸密碼子,其中79個密碼子(65.83%)改變了氨基酸類型,并有42個(53.17%)氨基酸理化性質(zhì)都被改變(圖3)。這些氨基酸類型以及理化性質(zhì)改變是否會影響新型冠狀病毒的活性暫不清楚,需要其他蛋白組學(xué)和結(jié)構(gòu)生物學(xué)方面的專業(yè)人士進(jìn)行驗證。本研究是版納植物園綜合保護(hù)中心生物多樣性研究組的科研人員利用其在系統(tǒng)與演化領(lǐng)域的專長開展的,本研究提到單倍型演化關(guān)系分析方法可以結(jié)合到傳染病學(xué)研究中,對于尋找傳染源,以及精確的傳播和擴(kuò)散方向能提供非常重要的信息。
相關(guān)研究結(jié)果已提交到中國科學(xué)院科技論文預(yù)發(fā)布平臺http://www.chinaxiv.org/abs/202002.00033,可供疾控防疫相關(guān)部門參考,并接受專家學(xué)者的交流和討論。
圖1. 新型冠狀病毒58種單倍型的演化關(guān)系和地理分布格局(A,B),單倍型之間的可能演化關(guān)系(C),以及新型冠狀病毒的可能傳播和擴(kuò)散路線(D)。A和B圓圈中的數(shù)據(jù)是樣本數(shù)量。
圖2. 新型冠狀病毒單倍型的樣品采集時間情況。紅色圈的樣品是確認(rèn)與華南海鮮市場有關(guān);藍(lán)色圈的樣本確認(rèn)與海鮮市場無關(guān)。
圖3. 120個變異位點在8個編碼區(qū)的分布情況。統(tǒng)計類型包括替換或替代(左上角),密碼子位置1-3(右上角),同義突變或非同義突變(左下角),和氨基酸性質(zhì)(右下角)。