中國科學院院士陳潤生
生物信息學在生物醫(yī)藥等研究領域的引領作用日益凸顯。隨著大數據的發(fā)展,生物信息學研究還將為精準醫(yī)學發(fā)展和人類健康作出更多貢獻
生物信息學將引導以診治為主的現(xiàn)代醫(yī)學過渡到以健康保障為主的精準醫(yī)學階段
文 |《瞭望》新聞周刊記者 孫英蘭 郭雨齊
今年5月,國家發(fā)展改革委印發(fā)了《“十四五”生物經濟發(fā)展規(guī)劃》(下稱《規(guī)劃》)。《規(guī)劃》提出,“十四五”期間,推動生物技術和信息技術融合創(chuàng)新,加快發(fā)展生物醫(yī)藥、生物育種、生物材料、生物能源等產業(yè),做大做強生物經濟。對此,長期從事生命科學研究的中科院核酸生物學重點實驗室學術委員會主任、中國科學院院士陳潤生表示,《規(guī)劃》的頒布,對相關領域研究及科研成果轉化將起到推動促進作用。
陳潤生是我國最早從事理論生物學、生物信息學以及非編碼RNA研究的科研人員之一,曾參加我國第一個完整基因組泉生熱袍菌B4基因組序列的組裝和基因標識,參加人類基因組“1%項目”和水稻基因組工作草圖的研究,構建了國際上在非編碼RNA領域有重要影響力的兩個數據庫,是國內講授《生物信息學》第一人,曾獲中國生物信息學學會(籌)頒發(fā)的首屆中國生物信息學終身成就獎。
他在接受《瞭望》新聞周刊專訪時表示,生物信息學在中國蓬勃發(fā)展,已經產生了大量重要研究成果,其在生物醫(yī)藥等領域的引領作用日益凸顯。隨著大數據的發(fā)展,生物信息學研究還將為醫(yī)療的精準化發(fā)展和人類健康作出貢獻。
破譯人類遺傳基因密碼催生新學科
《瞭望》:人類基因組計劃被譽為生命科學領域的“登月計劃”。為什么要啟動這項計劃?
陳潤生:人類基因組計劃1990年正式啟動,其實質,是要破譯人類遺傳基因密碼,即將人體細胞DNA的約30億個堿基對(遺傳密碼)的排列組合進行測序,拼成一張完整的人類基因組圖譜,研究人類的生長發(fā)育及疾病的診斷、治療和預防。
1999年9月,中國成為繼美、英、日、法、德外,第六個參與該計劃的國家。中國在人類基因組計劃中負責測定和分析3號染色體短臂上從端粒到標記D3S3610間大約30厘摩爾(相當于3000萬個核苷酸)的區(qū)域,因此被稱為人類基因組計劃“1%項目”。2001年8月,中國科學家提前兩年高質量完成了“1%項目”的基因序列圖譜。
《瞭望》:什么是生物信息學?為什么說沒有基因組研究就沒有生物信息學?
陳潤生:生物信息學是伴隨著人類基因組計劃實施而產生的一門新學科。
人類基因組由約30億個堿基對組成??茖W家們先要把它切割成上千萬個小段,每個小段測序完成后,使用專門編寫的程序在大型計算機上運算,再把它們重新拼接組裝起來,過程十分復雜,為此需要建立一個新的學科。另外,過程中產生的大數據如何存儲、整理、加工,如何提供給大家使用,這些問題也需要解決。更重要的是要分析基因組大數據,挖掘出與人類生長、發(fā)育及疾病相關的知識,這就產生了生物信息學。
可以說,生物信息學是一門整合數學、物理、計算機和生命科學、醫(yī)學、藥學等學科的新興交叉學科,是與人類基因組研究綁定的、為破譯人類遺傳密碼服務的??茖W家通過對基因組信息的獲取、處理、加工、分布、分析和解釋,就能夠從分子水平上了解人的生長發(fā)育、疾病發(fā)生情況,這是人類生物研究領域的進步,它使得整個生物醫(yī)學進入了大數據時代。
生物信息學促進醫(yī)療體系范式變革
《瞭望》:我國生物信息學研究取得了哪些重大成果?
陳潤生:生物信息學在我國起步于上世紀80年代末,此后獲得了快速發(fā)展。我國科學家在完成人類基因組計劃“1%項目”后,又開展了針對植物、動物、微生物等的基因測序研究,完成了“千人基因組計劃”等工作。我國的基因組測序數量,也是世界上最大的。
經過40年發(fā)展,基因組研究已“繁衍”到生物醫(yī)學的各個方面,只要是分子水平,都離不開基因組,核酸疫苗、核酸藥物的研發(fā),都是基于基因組研究的結果。更重要的是,它會引導以診斷治療為主的現(xiàn)代醫(yī)學過渡到以健康保障為主的精準醫(yī)學階段。
《瞭望》:為什么說生物信息學將促進醫(yī)療體系范式的變革?
陳潤生:現(xiàn)在的醫(yī)療模式以治療為主,這種模式是為病人服務的。而利用生物信息學手段,可以通過解析遺傳基因大數據,提前了解人體疾病的危險因素,并加以預防、干涉;也可以對人從出生到死亡的全生命周期進行監(jiān)控,以保證人體健康。
因此,在大數據驅動下,人類社會的健康模式,就從現(xiàn)在的診療模式轉變成全民、全時程的預防保障模式。與醫(yī)療相關的法律法規(guī)、藥品管理、社會保健制度等都會發(fā)生相應變化,這相當于完成了一個醫(yī)療體系范式變革,也為精準醫(yī)療奠定了基礎。
陳潤生院士(左一)與學生討論實驗結果 受訪者供圖
精準醫(yī)療面臨挑戰(zhàn)
《瞭望》:現(xiàn)今,精準醫(yī)學研究已成為國家之間新一輪科技競爭和引領國際發(fā)展潮流的戰(zhàn)略制高點。它的核心是什么?
陳潤生:自2015年時任美國總統(tǒng)奧巴馬首次在年度國情咨文里提出“精準醫(yī)學”概念以來,世界各國開始追逐相關概念和產業(yè)。精準醫(yī)療和精準醫(yī)學指向是一致的,都是指整個醫(yī)療體系,要從診斷、治療過渡到健康保障,從醫(yī)院、醫(yī)生診療為主的模式過渡到健康保障、健康評估和健康干預為主的模式。醫(yī)療體系將面對全民,可以對任何人做出健康決策,這也是精準醫(yī)療帶來的變化。而它的核心,就是組學大數據和醫(yī)學的結合。
《瞭望》:精準醫(yī)療的發(fā)展需要哪些基礎條件?
陳潤生:精準醫(yī)療主要指精準診斷、精準用藥、精準治療。而“精準”的基礎首先就是組學大數據。
人的遺傳密碼作為一個組學,就有了基因組,通過測序還有蛋白組、轉錄組、表觀組、空間組等一系列的“組”,一個基因組帶來的是組學大數據——生命活動的不同層次都變成可測的,這也帶來了不同層次的信息,組學大數據就出現(xiàn)了。當這些新知識與醫(yī)生原有的知識融合,醫(yī)生就會做出更準確的判斷。
其次,隨著組學大數據的出現(xiàn),還需要具備一個數據時代的科學思維,就是把分子基礎的變化和當前的影像學、生化學結合起來,因為精準醫(yī)學是建立在現(xiàn)代臨床基礎上的。比如把原來不作為大數據的數據也變成了大數據,像電子病歷、帶有監(jiān)測人體生命指標的可穿戴設備提供的數據、生理生化指標、影像學、病人的動態(tài)數據等個體數據加以收集整理,提取這些復雜、多尺度、多變量、高度異質化的數據進行分析,找出其中規(guī)律性的問題。還需要發(fā)展一系列生物醫(yī)學信息解讀的技術、方法。有了這些基礎,組學大數據才能應用到診療中來,并與影像學、檢驗學以及醫(yī)生的臨床診斷實踐等相結合,更大程度提高診療的精準性。
進入大數據時代,不僅是把組學大數據這份過去沒有的信息提供給生物醫(yī)學工作者,還要把過去孤立的個體數據都變成可共同分析的相關大數據。這就給出了一個在人類基因組研究沒有出現(xiàn)之前所不能得到的、橫向縱向都存在的大數據集合。分析破譯這些生物大數據背后隱藏的生命密碼,就會使得精準醫(yī)療逐步從理想變成現(xiàn)實。
《瞭望》:目前精準醫(yī)療的發(fā)展面臨哪些困難和挑戰(zhàn)?
陳潤生:用精準醫(yī)學的核心來衡量,我國離達到精準醫(yī)療的目標還有差距。從研究層面看,最大挑戰(zhàn)就是基因組當中的“暗信息”。
人類遺傳密碼是可測的,但是目前人類能夠真正破譯,能夠從根本上、規(guī)律上讀懂的這部分遺傳密碼不超過人類基因組總量的3%,而精準醫(yī)療的起步點就是分析和應用這3%。剩余97%的遺傳密碼,其生物學作用現(xiàn)在還只是部分掌握、部分了解,破譯分析這些“暗信息”,過程將非常緩慢,但非常關鍵。
第二個挑戰(zhàn)來自生物大數據。我國的數據源很大,但從樣本源來講,要做某一個相關疾病的研究,得到特定樣品很難。比如說要研究肺癌,收集肺癌樣本就十分不易。像腫瘤、心腦血管病,都是多基因病,它的自變量是成百上千的,要得到這個量級的樣本進行專項研究,作為研究組很難辦到。
同一種疾病,發(fā)生的微觀情況也不同。比如同樣是肺癌病人,病灶分布位點不同、數量不同,變化也不相同。那么,相同的疾病,什么是共同的分子基礎,什么是個體差異,這個需要在新的組學意義上定義。這是第三個挑戰(zhàn)。
另外,影響某一種疾病發(fā)生的不僅僅是每一個基因的變化,還有基因間的相互作用。所以,還要考慮各個遺傳基因密碼的相互作用。就是說,一個活的生命體,它所具有的包括信號傳導、大分子相互作用、調控等這些復雜網絡,都是動態(tài)的、有向的。而一個動態(tài)、有向組成的非線性網絡是復雜的,如何解析,同樣是高難度的挑戰(zhàn)。
《瞭望》:這是否也意味著重大創(chuàng)新機遇?
陳潤生:是的。在人類基因組研究中,科學家只破譯了3%的遺傳密碼,這對“精準”而言是不夠的,但從僅僅破譯的3%遺傳密碼已為生命科學帶來的無數新發(fā)現(xiàn)、為生物醫(yī)學帶來的巨大發(fā)展的角度講,破譯97%的非編碼序列更具挑戰(zhàn)性,也意味著更多機遇。
如今,對非編碼RNA的研究已成為國際科學研究領域的熱點。在基因組的研究、測量、分析方面,我國與歐美等國家和地區(qū)處在同一方陣。在非編碼遺傳基因研究方面,我們與國外科學家也是各有優(yōu)勢、同時進步的,有些方面我們還走在前面。
我在國內最早開展非編碼研究,就是基于“人的基因組不可能只用3%的遺傳密碼造蛋白、而其他序列沒有用”這個樸素的邏輯判斷。早在1993年,我就把研究團隊全部轉向97%的非編碼研究上來,這也推動了國內的非編碼研究。我們構建的收錄非編碼RNA及其基因的數據庫NONCODE,以及收錄非編碼RNA與其他生物大分子相互作用的數據庫NPInter,已成為國際在非編碼RNA領域非常有影響力的數據庫。
《瞭望》:我國在精準醫(yī)學發(fā)展中應注意哪些問題?
陳潤生:首先共享好大數據、大樣本。
現(xiàn)在各個地方、各家醫(yī)院、各醫(yī)學院校都存在大量生物醫(yī)學數據,怎樣才能在國家層面上實現(xiàn)數據共享,是科學、技術問題,也是管理問題。
從數據層面上講,要進行數據的挖掘分析,首先要有大數據,這就需要一個集中管理數據的體制機制,需要完善各地區(qū)、各醫(yī)療單位提供的數據共享的機制。
其次是知識產權問題。這是數據共享、交流中更深層次的問題。應從國家戰(zhàn)略高度統(tǒng)籌部署,并制定和大數據相關的政策法規(guī),解決大數據管理、共享等方面問題。
目前,伴隨著基因組學發(fā)展而發(fā)展的生物信息學,已走過了“測序基因組階段”,正步入功能基因組和整合基因組階段(又稱“系統(tǒng)生物學階段”)。這也說明,生物信息學的內涵更豐富,工具更多樣化,未來用途也會越來越廣泛。僅從民生角度看,它的發(fā)展,就帶動了生物醫(yī)學和生物醫(yī)藥產業(yè)的發(fā)展,比如核酸疫苗、核酸藥物的研發(fā)。隨著生物經濟的發(fā)展,生物醫(yī)藥產業(yè)有望駛入發(fā)展快車道,也必將對人類健康作出更多貢獻?!?/p>
聯(lián)系客服