中國(guó)科學(xué)院生物物理所研究院陳潤(rùn)生院士在2018年全國(guó)功能基因組學(xué)高峰論壇上作報(bào)告
上個(gè)世紀(jì)七十年代,生物化學(xué)家 Frederick Sanger 完成了世界上第一次全基因組測(cè)序——噬菌體 phiX-174 由 5375 個(gè)堿基構(gòu)成的遺傳密碼就此出現(xiàn)在世人眼前,這也標(biāo)志著第一代 DNA 測(cè)序技術(shù)從此誕生。時(shí)至今日,DNA 測(cè)序已經(jīng)發(fā)展到了不需要 PCR 擴(kuò)增、能夠一次性讀取上萬(wàn)個(gè)堿基的第三代——它成為了推動(dòng)當(dāng)代科學(xué)發(fā)展的重要力量,也發(fā)展成了生物技術(shù)領(lǐng)域內(nèi)最熱門的一項(xiàng)產(chǎn)業(yè)。
隨著測(cè)序技術(shù)的發(fā)展和大數(shù)據(jù)分析手段的完善,學(xué)界和業(yè)界一方面能夠獲得海量遺傳信息用于學(xué)術(shù)研究和產(chǎn)業(yè)應(yīng)用,另一方面也面臨著新事物帶給他們的挑戰(zhàn):爆發(fā)式增長(zhǎng)的組學(xué)和大數(shù)據(jù)研究是否會(huì)顛覆生物醫(yī)學(xué)領(lǐng)域的研究模式?如何保護(hù)和利用好我國(guó)龐大豐富的遺傳資源?飛速發(fā)展的測(cè)序行業(yè),未來(lái)和機(jī)遇又在何方?
帶著這些問(wèn)題,“科研圈”參加了由北京百邁客生物科技有限公司承辦的第五屆全國(guó)功能基因組學(xué)高峰論壇,并在會(huì)后對(duì)生物信息學(xué)家、中國(guó)科學(xué)院院士、中科院生物物理所研究員陳潤(rùn)生進(jìn)行了專訪,與他一起聊了聊大數(shù)據(jù)時(shí)代下,生物醫(yī)學(xué)研究者和從業(yè)者們所面臨的機(jī)遇和挑戰(zhàn)。
陳潤(rùn)生院士接受記者采訪
記者:在大數(shù)據(jù)時(shí)代,精準(zhǔn)醫(yī)學(xué)的發(fā)展會(huì)越來(lái)越快,整個(gè)醫(yī)療體系和醫(yī)學(xué)研究都將會(huì)面對(duì)重大變革,對(duì)于醫(yī)生和醫(yī)學(xué)研究人員來(lái)說(shuō),他們?cè)鯓舆m應(yīng)這種變革、抓住新的機(jī)遇?
陳潤(rùn)生:隨著近年來(lái)組學(xué)研究的發(fā)展,包括遺傳密碼破譯,一定會(huì)對(duì)生物醫(yī)學(xué)研究造成巨大的沖擊,而這個(gè)沖擊一定會(huì)促進(jìn)學(xué)科發(fā)展,從而能更好地為疾病的診斷治療服務(wù)。在這種情況下,社會(huì)中的每個(gè)人都會(huì)面對(duì)這種變革,當(dāng)然也包括醫(yī)生。我認(rèn)為一方面,醫(yī)生當(dāng)然要適應(yīng)科學(xué)發(fā)展的新趨勢(shì),增加自己對(duì)新領(lǐng)域的了解,提高自己在這方面的認(rèn)知,學(xué)習(xí)跟它相關(guān)的一些技術(shù)方法,這是必要的。
但是另外一方面,作為在大數(shù)據(jù)研究一線挖掘數(shù)據(jù)、獲取知識(shí)的從業(yè)人員,為使用者帶來(lái)更方便的使用體驗(yàn),比如給用戶提供更好的操作界面也是他們的責(zé)任??梢暬且粋€(gè)把復(fù)雜的、抽象的東西展示在用戶面前的好辦法。所以業(yè)界對(duì)復(fù)雜大數(shù)據(jù)做出的可視化服務(wù),都值得鼓勵(lì)和推薦。百邁客公司的云平臺(tái)就是一個(gè)商業(yè)化的例子。所以我相信在未來(lái)面對(duì)精準(zhǔn)醫(yī)學(xué)等新事物的時(shí)候,在明確它會(huì)給社會(huì)帶來(lái)有利影響的前提下,大數(shù)據(jù)研究者們也應(yīng)當(dāng)為醫(yī)生、為社會(huì)大眾提供更友好的工具和界面,讓他們能夠理解和接受。只要大家共同努力,我相信新的事物會(huì)順利融入到各個(gè)方面,醫(yī)生們更好的能利用這個(gè)新事物為臨床服務(wù)。
記者:那大數(shù)據(jù)和精準(zhǔn)醫(yī)學(xué)的發(fā)展,會(huì)不會(huì)讓醫(yī)生們失業(yè)呢?
陳潤(rùn)生:醫(yī)療的發(fā)展和進(jìn)步應(yīng)當(dāng)是大家共同努力完成的,醫(yī)生有他自己的工作范圍和技術(shù),這不可能被一個(gè)簡(jiǎn)單的命題或方法代替。
IBM 的商業(yè)人工智能 Watson 計(jì)劃遇到了困難、遭到了批評(píng),就是因?yàn)樗阉哪芰U(kuò)展到了技術(shù)沒(méi)有發(fā)展到位的地方去,這無(wú)法帶來(lái)有意義的使用效果,所以當(dāng)然就會(huì)受到多方面的批評(píng)。目前的大數(shù)據(jù)、精準(zhǔn)醫(yī)學(xué),包括人工智能的發(fā)展,它給人提供了更好的工具,但這個(gè)工具不是萬(wàn)能的,我們不能讓它走向取代人類的極端。
記者:對(duì)于生命科學(xué)研究來(lái)說(shuō),大數(shù)據(jù)時(shí)代也改變研究人員的實(shí)驗(yàn)方式:現(xiàn)在以數(shù)據(jù)挖掘?yàn)榇淼母蓪?shí)驗(yàn)比例顯著增加,而傳統(tǒng)的從生物樣本中獲取材料進(jìn)行檢驗(yàn)分析的濕實(shí)驗(yàn)的主導(dǎo)地位似乎受到了“威脅”。我們應(yīng)該如何看待干實(shí)驗(yàn)和濕實(shí)驗(yàn)在科研活動(dòng)中的重要性?在青年人才培養(yǎng)方面,該如何順應(yīng)時(shí)代做出調(diào)整呢?
陳潤(rùn)生:干實(shí)驗(yàn)和濕實(shí)驗(yàn)歷來(lái)在科學(xué)發(fā)展中都是相輔相成的。生物醫(yī)學(xué)研究的常見模式,是把大量濕實(shí)驗(yàn)總結(jié)提升,用“干”的形式把它固定下來(lái)??赡茉谝欢螘r(shí)間里,干實(shí)驗(yàn)比重會(huì)比濕實(shí)驗(yàn)的比重高,而在另外一些情況下則相反,但這并不是本質(zhì)問(wèn)題。兩者都是科研過(guò)程中被需要的方法,這才是重要的。
每個(gè)時(shí)期科學(xué)都在發(fā)展,新的學(xué)科不斷出現(xiàn),舊的學(xué)科在融合,所以交叉融合創(chuàng)新永遠(yuǎn)是學(xué)科發(fā)展的方向。因此需要每一個(gè)人去重視科學(xué)發(fā)展自身的規(guī)律,它是一個(gè)永恒的命題。所以年輕人當(dāng)前一定要適應(yīng)學(xué)科交叉、發(fā)展和創(chuàng)新的態(tài)勢(shì),在這樣的態(tài)勢(shì)下提高自己。不要總是追求靜態(tài)的東西,基礎(chǔ)會(huì)打得厚一點(diǎn)牢一點(diǎn),這對(duì)將來(lái)從事頂尖的工作和研究,當(dāng)然是更有利的。金字塔只有底層打得好,塔尖才能弄得高。所以交叉融合創(chuàng)新是任何一個(gè)年輕人都應(yīng)當(dāng)考慮的問(wèn)題,
記者:現(xiàn)在與國(guó)際同行的交流與合作是個(gè)司空見慣的事情。但是人類遺傳資源數(shù)據(jù)是個(gè)比較敏感的話題,我們應(yīng)該如何應(yīng)對(duì)由此帶來(lái)的數(shù)據(jù)安全問(wèn)題?
陳潤(rùn)生:對(duì)于遺傳資源的認(rèn)識(shí)和保護(hù),隨著科學(xué)的發(fā)展,其內(nèi)涵也應(yīng)當(dāng)有所變化。過(guò)去我們比較注意的主要是那些濕的資源,比如說(shuō)血樣、種子等等。但是隨著組學(xué)的發(fā)展,由那些濕的資源派生出來(lái)的組學(xué)大數(shù)據(jù)這類干的遺傳資源越來(lái)越多。因此數(shù)據(jù)的地位越來(lái)越重要,舉個(gè)例子,如果整個(gè)基因組都是可以合成的,那么生物樣本就不必要了,有數(shù)據(jù)就能把這個(gè)資源握在手中。所以隨著生物醫(yī)學(xué)大數(shù)據(jù)的發(fā)展,遺傳資源的含義也在逐漸的向干數(shù)據(jù)遷移。在這種情況下,我們保護(hù)范圍和保護(hù)的政策法規(guī)也應(yīng)當(dāng)有適應(yīng)性的變化。
如果我們每個(gè)人的遺傳信息都以完全保密的形式存在,可能不利于某些疾病的診斷治療。但是如果沒(méi)有任何約束和限制,將來(lái)會(huì)可能會(huì)造成遺傳資源的丟失。這就要求我們既要保護(hù)每個(gè)人的知情權(quán),包括在疾病和醫(yī)療情況下對(duì)于組學(xué)數(shù)據(jù)測(cè)量的需求;又要保護(hù)整個(gè)國(guó)家、民族、地區(qū)的資源不流失,這兩者之間如何做到恰如其分,做到更科學(xué)更客觀,需要仔細(xì)考慮。據(jù)我所知,目前我們國(guó)家在這方面的立法可能還有待完善。目前整個(gè)大環(huán)境中各種組學(xué)數(shù)據(jù)快速增加,什么樣的資源保護(hù)方案才是客觀的、可行的,是一個(gè)刻不容緩、亟待解決的問(wèn)題。
記者:目前,第三代測(cè)序技術(shù)飛速發(fā)展,它擁有更低廉的成本,也引領(lǐng)著整個(gè)行業(yè)的革新,Nanopore,Pacific Bioscience 等公司就是其中的代表。對(duì)基因測(cè)序行業(yè)以后的發(fā)展,您怎么看?
陳潤(rùn)生:測(cè)序技術(shù)發(fā)展非???。從上世紀(jì) 90 年代到現(xiàn)在,測(cè)序能力提高了幾百萬(wàn)倍,這推動(dòng)了社會(huì)對(duì)整個(gè)組學(xué)研究進(jìn)展的認(rèn)知,它也會(huì)對(duì)生物醫(yī)學(xué)研究產(chǎn)生巨大推動(dòng)作用。所以以后依然會(huì)被人們所關(guān)注。
目前最新的三代測(cè)序技術(shù),擁有一些大家明顯可以感覺到的巨大優(yōu)勢(shì),比如讀長(zhǎng)通??梢赃_(dá)到百萬(wàn)數(shù)量級(jí)。這讓過(guò)去在二代測(cè)序中出現(xiàn)的一些組裝拼問(wèn)題能夠得到根本的解決。但是三代測(cè)序依然存在缺點(diǎn),比如它的測(cè)序錯(cuò)誤率高,有些時(shí)候可以達(dá)到 15%,這在一個(gè)需要精確使用基因序列的場(chǎng)景中——例如疾病診斷——顯然是不能滿足使用者的需求的。因?yàn)楹芏嗲闆r下某一個(gè)點(diǎn)突變就能導(dǎo)致腫瘤的發(fā)生,15% 的錯(cuò)誤率造成的后果可想而知。所以三代測(cè)序技術(shù)還有發(fā)展的空間,它既有明顯的優(yōu)點(diǎn),也有明顯的缺點(diǎn)。同時(shí),它促使組學(xué)研究產(chǎn)生了極大的進(jìn)步,所以仍然會(huì)獲得廣泛的關(guān)注,擁有廣闊的發(fā)展前景。
此外,通過(guò)測(cè)序獲取的海量數(shù)據(jù)如何進(jìn)行挖掘和解析,也是測(cè)序行業(yè)發(fā)展的一個(gè)重要方面。比如我們需要發(fā)展好的平臺(tái)、工具和方法,然后從大數(shù)據(jù)中獲得跟疾病、健康相關(guān)的知識(shí),這可能會(huì)成為未來(lái)組學(xué)研究的重要一環(huán)。
參考資料
聲明:化學(xué)加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認(rèn)同其觀點(diǎn)或證實(shí)其描述。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時(shí)更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn