澎湃新聞記者 賀梨萍
國家基因組科學(xué)數(shù)據(jù)中心(NGDC)信息顯示,1月26日,該中心收錄了由中國醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院病原生物學(xué)研究所提供的5株2019新型冠狀病毒全基因組序列。
這是自2019年12月該病爆發(fā)以來,國內(nèi)公共數(shù)據(jù)平臺首次公開發(fā)布數(shù)據(jù)。此前科學(xué)家陸續(xù)獲得的2019新型冠狀病毒基因組序列一般遞交到全球流感序列數(shù)據(jù)庫(GISAID)和美國國家生物技術(shù)信息中心(NCBI)的GenBank數(shù)據(jù)庫。
此前的1月22日,國家基因組科學(xué)數(shù)據(jù)中心正式發(fā)布2019新型冠狀病毒信息庫。該庫整合了世界衛(wèi)生組織(WHO)、中國疾病預(yù)防控制中心(CDC)、美國國家生物技術(shù)信息中心、全球流感序列數(shù)據(jù)庫等機(jī)構(gòu)公開發(fā)布的冠狀病毒基因組序列數(shù)據(jù)、元信息、學(xué)術(shù)文獻(xiàn)、新聞動態(tài)、科普文章。同時,對不同冠狀病毒株的基因組序列做了變異分析與展示。
2019新型冠狀病毒信息庫基于不同參考基因組序列開展2019-nCoV病毒株基因組變異分析,并對結(jié)果進(jìn)行了統(tǒng)計與可視化展示。通過對全基因組序列相似性比較和變異位點(diǎn)分析,獲取2019-nCoV病毒株之間、2019-nCoV病毒株與SARS冠狀病毒以及與類SARS冠狀病毒蝙蝠株之間的變異程度、變異區(qū)域、變異堿基的詳細(xì)信息。
對2019-nCoV病毒株的基因組變異分析為追溯病毒來源、追蹤病毒株變異路徑、防控新型冠狀病毒引發(fā)的疫情、治療病毒性肺炎提供重要的數(shù)據(jù)基礎(chǔ)與決策支持。
上述資源庫發(fā)布之際,中科院北京基因組所研究員、國家基因組科學(xué)數(shù)據(jù)中心主任鮑一明在接受《中國科學(xué)報》采訪時曾表示,“我們這個數(shù)據(jù)庫發(fā)布以后,就有單位聯(lián)系要將武漢新型冠狀病毒基因組的數(shù)據(jù)送到這兒來,而不是先到國外然后國內(nèi)研究人員再去拿回來‘出口轉(zhuǎn)內(nèi)銷’了。”
國家基因組科學(xué)數(shù)據(jù)中心介紹,冠狀病毒屬于套式病毒目、冠狀病毒科、冠狀病毒屬,是一類具有囊膜、基因組為線性單股正鏈的RNA病毒,是自然界廣泛存在的一大類病毒。某些冠狀病毒會感染人類并引起疾病,比如中東呼吸綜合征(MERS)和嚴(yán)重急性呼吸綜合征(SARS),其癥狀可從普通感冒到重癥肺部感染。
此次在武漢首先發(fā)現(xiàn)的冠狀病毒是一種先前尚未在人類中發(fā)現(xiàn)的病毒株系,被WHO命名為2019新型冠狀病毒(2019-nCoV)。NCBI的病毒分類工具PASC將2019-nCov分類為嚴(yán)重急性呼吸綜合征相關(guān)冠狀病毒種(Severe acute respiratory syndrome-related coronavirus),該種還包含2003年爆發(fā)的SARS病毒,兩者基因組序列相似度為80%。
此次發(fā)布的5株2019新型冠狀病毒基因組序列的序列號為GWHABKF00000000、GWHABKG00000000、GWHABKH00000000、GWHABKI00000000、GWHABKJ00000000,相關(guān)項目編號為PRJCA002165。
以上序列可在國家生物信息中心/國家基因組科學(xué)數(shù)據(jù)中心的項目庫或者冠狀病毒序列庫檢索并下載,無需注冊或向數(shù)據(jù)遞交者申請。