深圳東南部大鵬半島被政府規劃為“生態島、生物島、生命島”,也被稱為深圳最后的“桃花源”。這裡有一座狀似哈尼梯田的建筑依山面海而建,這就是目前世界最大的基因庫。9月22日,國家基因庫開門迎客的當日,來自國內外政界、產業界以及媒體界的人士聚集於此。人們欣賞著別致建筑,也在探尋,如此大庫究竟何用?
為什麼要建全球最大基因庫
美國、歐盟、日本先后建立了大型基因數據庫,這三大基因數據庫的生物信息數據幾乎涵蓋了所有已知的DNA、RNA和蛋白質數據。華大基因董事長汪建稱,我國每年產出的大量基因數據也存在國際三大數據庫中,如果國內不能保存我國獨特的基因數據,這本身就是一種風險。同時,國家基因庫對保護生物多樣性也有重要意義。
國家基因庫主任梅永紅介紹,國家基因庫一期佔地面積4.75萬平方米,還有二期待建。與三大世界級的基因庫不同,中國國家基因庫不僅僅是數據庫,更是國際上現有的各類生物樣本庫、數據庫、生物多樣性庫、疾病庫等的綜合升級版。除了“干庫”(即基因、蛋白、分子、影像等多組學生物信息數據庫)、“濕庫”(多樣性生物樣本和物種遺傳資源庫)之外,國家基因庫還引入了“活庫”,即生物活體庫,包括動物資源、植物資源、微生物資源和海洋資源等。梅永紅稱,“在農業時代,擁有更多的耕地,就意味著擁有了優勢﹔在工業時代,擁有更多的能源,你也具有了相應的優勢﹔在生命時代,擁有更多的基因資源,並對這些資源加以認知和利用,就在新時代擁有了自己的優勢。”
不但要保留信息還要制造生命
國家基因庫的三樓數字化平台擺放著華大基因自主研發的150台BGI-Seq500基因測序儀和一台造價2000萬美元的超級測序儀,后者全球共六台,其中兩台在中國。國家基因庫執行主任徐訊介紹,“這裡每年產出5個PB的數據量,什麼概念?如果做全基因組深入測序的話可以做1.5萬個,做基因篩查可以做一千萬個,未來將達到10個PB的產量。”
此外,還有基因組合成與編輯平台。走進國家基因庫大門,首先看到一個巨大的猛?象雕塑。徐訊說,“這個大型的哺乳動物滅絕了,但是它的細胞可以完整的保存,因為這樣的保存我們才可以恢復出來胚胎,如果有合適的母體的話就可以重新復活猛?象。這也是為什麼我們要做遺傳物質保存,要做讀和寫的原因,為什麼要做合成的原因。我們計劃在2020年的時候完成10萬個噬菌體的合成,如果項目完成可能會對治療疾病產生新的希望。同時,我們還將完成全球第一個動物基因組和全球第一個植物基因組以及人類21號染色體的合成。”他表示,人工合成新生命的完成不僅僅應用廣泛,而且對人類自身和生命本質的認識將產生一個質的飛躍。
國家基因庫服務全社會
和世界其他單一的基因數據庫以服務科研為主不同,深圳國家基因庫是綜合性的,不僅僅有科研的數據,還有產業的數據,它不僅僅面向科研,同時也面向產業,給產業機構提供服務和支持。國家基因庫的啟動同時,國家基因庫公共平台的公共服務也正式對外開始提供。
徐訊介紹,國家基因庫數據中心,將為公眾提供免費的數據檢索和比對的服務,第一期釋放的數據包括三大類七萬個物種,可訪問數據的能力為20個PB,也接收公開數據的遞交和免費的索引服務。
未來的二期將達到500個PB的可訪問能力,超越目前三大庫所有的總和。目前開放的數據庫既包括了疾病數據庫,也包括農業多樣性以及動植物基因數據庫。
同時還將啟動兩大項目,第一是全球生態數據化項目,將完成50案株不同的植物、5萬個不同動物和一百萬個不同微生物全面的影像數字化。第二是聯合全國啟動百萬雲健康隊列項目,母親懷孕到小孩4歲中的關鍵點遺傳信息、關鍵生物樣本和一些生理特征將被詳細保存,對母嬰健康的精准醫療提供數據庫服務。國家基因庫還面向推動中國精准醫學、精准農業的發展。(劉傳書)