實(shí)時(shí)焦點(diǎn):蛋白質(zhì)科學(xué)版ChatGPT來(lái)了?
2018年,在瑞典斯德哥爾摩諾獎頒獎典禮后,趙惠民(右)向導師、當期諾獎得主Arnold表示祝賀。受訪(fǎng)者供圖
凝視著(zhù)手中的試管,又望向桌上那些依舊在運轉的大大小小的實(shí)驗儀器,趙惠民的心像被人用力攥著(zhù)。他明白,已經(jīng)到了不得不放棄的時(shí)候。讀博第三年,學(xué)校資格考試的巨大壓力如海嘯般襲來(lái),這項奮戰了兩年但依然沒(méi)走通的課題,被他親手按下了停止鍵。
事情雖已過(guò)去30年,但對美國伊利諾伊大學(xué)香檳分校教授趙惠民而言,那時(shí)的痛苦仍然記憶猶新。
(相關(guān)資料圖)
趙惠民并未因一次羈絆而止步?!翱茖W(xué)探索是無(wú)止境的,而且有很多的不可預測性,這就是做科研的魅力所在?!?3年間,他帶領(lǐng)團隊取得累累碩果。
3月31日,趙惠民團隊再次在《科學(xué)》發(fā)表論文。這回,他們發(fā)明了一種新的人工智能(AI)工具,可以根據酶的氨基酸序列預測酶的功能。就像ChatGPT使用文字數據創(chuàng )建預測文本一樣,他們正在利用蛋白質(zhì)的語(yǔ)言預測它們的功能。
30多年后又回到原點(diǎn)
20世紀80年代流傳著(zhù)一句順口溜:“窮清華,富北大,不要命的上科大?!壁w惠民就是“不要命的”那一個(gè)。
1987年,他以?xún)?yōu)異成績(jì)從浙江嘉興一中考入中國科學(xué)技術(shù)大學(xué)(以下簡(jiǎn)稱(chēng)中國科大)生物系。他對科研的興趣從這里萌生。
“那時(shí)候,中國科大的訓練非常嚴格,學(xué)風(fēng)在高校中名列前茅,五年制教學(xué)課程任務(wù)重,科研氛圍很濃?!壁w惠民告訴《中國科學(xué)報》。前3年他就掌握了數學(xué)、物理、化學(xué)、生物等學(xué)科知識。
后來(lái),趙惠民成了施蘊渝(1997年當選中國科學(xué)院院士)的學(xué)生。彼時(shí),施蘊渝剛從國外進(jìn)修回來(lái),率先在國內開(kāi)展蛋白質(zhì)結構與功能的計算生物學(xué)研究。受老師指引,趙惠民開(kāi)啟了分子動(dòng)力學(xué)方面的計算模擬研究。
為了開(kāi)闊眼界、提升自己,本科畢業(yè)后,23歲的趙惠民在1992年到美國加州理工學(xué)院讀博,第一次接觸到了酶工程。從那以后,他便與酶結下了不解之緣。
酶有多重要呢?它是一種生物催化劑,在生命體系中扮演著(zhù)關(guān)鍵角色,控制和調節各種代謝途徑,保障它們高效工作。
研究酶的人都希望把它的功能改造得更好,得到更高效、更穩定、更優(yōu)質(zhì)的催化劑。趙惠民獨辟蹊徑,想預測酶的功能。
8年前,他的實(shí)驗室自主建立了一套全集成自動(dòng)化系統。6年前,他開(kāi)始涉獵AI領(lǐng)域,想把AI技術(shù)與合成生物學(xué)、自動(dòng)化結合起來(lái),以更快地改造酶工程或者代謝工程。在中國科大積累的計算模擬知識重新派上了用場(chǎng)。
“沒(méi)想到兜兜轉轉30多年,又回到了原點(diǎn)?!壁w惠民感慨說(shuō),“可見(jiàn),很多東西你學(xué)的時(shí)候覺(jué)得沒(méi)多大用,但說(shuō)不定將來(lái)哪個(gè)時(shí)候就能發(fā)揮價(jià)值?!?/p>
趙惠民團隊在2014年搭建了第一臺原型機,在2020年完成了強化版。一切正式起步。他帶領(lǐng)團隊用了3年時(shí)間,研發(fā)出被稱(chēng)為CLEAN的AI工具。論文在線(xiàn)后,通過(guò)網(wǎng)絡(luò )界面,研究人員只需在搜索框中輸入序列就可以看到結果,如同使用搜索引擎一樣。
“我們不是第一個(gè)使用AI工具預測酶功能的,但我們是第一個(gè)使用這種被稱(chēng)為對比學(xué)習的新深度學(xué)習算法預測酶功能的。我們發(fā)現,這種算法比其他AI工具更準確、更可靠、更靈敏?!壁w惠民表示。
無(wú)論是生物學(xué)界、醫學(xué)界還是工業(yè)界,這種工具都將幫助研究人員快速識別合成化學(xué)物質(zhì)和材料所需的最合適的酶。
“投頂刊比較順的一次”
2022年10月8日,一切準備就緒,趙惠民將論文投給了《科學(xué)》。有著(zhù)豐富投稿經(jīng)歷的他,預感這次不會(huì )遭遇審稿人“刁難”,他對這項成果有信心。
果不其然,文章很快通過(guò)編輯這一關(guān),進(jìn)入外審環(huán)節。不到兩個(gè)月,趙惠民就收到了審稿人的意見(jiàn)。
審稿人都給出了積極正面的評價(jià),認為這項研究成果中的AI算法非常新穎。最關(guān)鍵的是,很多有關(guān)AI的文章幾乎都是用數據組測試AI工具有多好,而趙惠民團隊的論文中不僅有計算機的論證,還提供了強有力的實(shí)驗數據支持。
計算和體外實(shí)驗驗證顯示,該工具不僅可以預測以前未表征的酶的功能,還可以糾正被領(lǐng)先軟件錯誤標記的酶,并正確識別具有兩種或多種功能的酶。
當然,研究并非盡善盡美,審稿人還是提出了一些小意見(jiàn)。因為預測并非百分百準確,審稿人希望作者進(jìn)行更仔細的研究,以回答預測的準確率到底是多少。
趙惠民帶領(lǐng)團隊緊鑼密鼓地進(jìn)行了兩個(gè)月補充實(shí)驗,加入了很多新數據。改進(jìn)后的文章在2023年1月底再次送審,不到一個(gè)月文章就被接收,從投稿到發(fā)表僅耗時(shí)5個(gè)月。
“這是我投頂刊比較順的一次?!壁w惠民說(shuō)。
在趙惠民看來(lái),論文在《科學(xué)》上發(fā)表只是邁出第一步。他們計劃擴大CLEAN背后的AI,進(jìn)一步開(kāi)發(fā)機器學(xué)習算法,以表征其他蛋白質(zhì),如結合蛋白。
“有很多未被表征的結合蛋白,如受體和轉錄因子,我們也想預測它們的功能?!壁w惠民有一個(gè)宏大的愿望,他想預測所有蛋白質(zhì)的功能,這樣就可以對細胞中所有蛋白質(zhì)了如指掌,以便更好地研究或設計整個(gè)細胞用于生物技術(shù)或生物醫學(xué)。
為了讓這款工具越發(fā)強大,該團隊還在訪(fǎng)問(wèn)頁(yè)面專(zhuān)門(mén)設置了一個(gè)鍵,用戶(hù)可以點(diǎn)進(jìn)去輸入反饋意見(jiàn)?!跋M蠹叶嗵嵋庖?jiàn),我們會(huì )根據反饋再增加一些新的功能?!?/p>
在美國做科研一點(diǎn)也不容易
閑暇時(shí),趙惠民常跟學(xué)生很走心地分享過(guò)往經(jīng)歷,想讓他們明白做科研本就不會(huì )一帆風(fēng)順。
30年前,他就曾因為考核壓力,不得不放棄一項兩年都未走通的研究。他不吝與學(xué)生分享科研路上曾有過(guò)的至暗經(jīng)歷,因為科研本就是一條“光榮的荊棘路”,接受失敗是必修課。
“常聽(tīng)朋友說(shuō)在國內做科研很‘卷’,有些人會(huì )以為在美國做科研很輕松,從我的親身經(jīng)歷來(lái)說(shuō),一點(diǎn)也不容易?!壁w惠民表示。
他讀博的時(shí)候,就有好幾名同年進(jìn)實(shí)驗室的同學(xué)因為頂不住壓力,沒(méi)拿到學(xué)位就心灰意冷地離開(kāi)了。好在他跨過(guò)黑暗,選擇再度出發(fā),成為了美國加州理工學(xué)院教授Frances H. Arnold最有成就的弟子之一。
2018年,Arnold因為“酶定向進(jìn)化”上的突出成就獲得諾貝爾化學(xué)獎。在A(yíng)rnold所獲諾貝爾化學(xué)獎的科學(xué)背景材料中,趙惠民在5篇關(guān)鍵論文里都有署名,其中有4篇是第一作者。
導師對趙惠民的影響除了科研上的飛躍外,還有做人做事的改變。Arnold對學(xué)生總是直來(lái)直去,毫不留情地當面指出缺點(diǎn)?!拔覀冎袊苏f(shuō)話(huà)比較委婉,當面批評多少有點(diǎn)讓人下不了臺。所以剛去的時(shí)候,我不太適應,她的嚴厲,有時(shí)候連美國學(xué)生也吃不消?!?/p>
但相處久了,他發(fā)現,導師的很多反饋就像酶一樣,促使他迅速成長(cháng)和進(jìn)步。后來(lái)他帶學(xué)生時(shí),也習慣就事論事、不繞彎子,并且鼓勵學(xué)生勇于表達自己的意見(jiàn)和想法,最好跟他爭個(gè)面紅耳赤。
現在,他的很多學(xué)生已經(jīng)成長(cháng)為一些高校、科研院所的中堅力量。其中,33人成為了教授,在國內做教授的就有15人?,F在,他的團隊有近50名成員,來(lái)自世界多個(gè)國家,中國人占了大多數。
相關(guān)論文信息:https://www.science.org/doi/10.1126/science.adf2465
本文作者:張晴丹,來(lái)源:中國科學(xué)報,原文標題:《中國科大校友今發(fā)Science!蛋白質(zhì)科學(xué)界版ChatGPT來(lái)了》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: