百圖生科AIGP平臺發(fā)布:提供多種蛋白質(zhì)生成能力,加速前沿生命科學(xué)研究
近日來(lái),ChatGPT和文心一言等超大規模預訓練模型紛紛登場(chǎng),讓我們看到了AI破解人類(lèi)自然語(yǔ)言的力量。
(資料圖)
成立兩年多來(lái),BioMap百圖生科一直致力于打造生命科學(xué)領(lǐng)域的AI大模型,構建了千億參數的跨模態(tài)大模型?“xTrimo” (The Cross-Modal Transformer Representation of Interactome and Multi-Omics)。該大模型從跨物種、跨模態(tài)的生命信息中學(xué)習蛋白質(zhì)如何構成和實(shí)現功能、如何相互作用、如何組合和調控細胞功能的關(guān)鍵規律,從而破解生命的自然語(yǔ)言——蛋白質(zhì)?;诖竽P?,AI在一系列任務(wù)算法上取得了明顯的進(jìn)展,除了更好地完成結構預測等基礎任務(wù)外,也開(kāi)始可以根據不同的問(wèn)題輸入,以生成的方式,設計創(chuàng )新的蛋白質(zhì),來(lái)回答各種生命科學(xué)問(wèn)題。
2023 年 3 月 23 日,百圖生科在北京發(fā)布生命科學(xué)大模型驅動(dòng)的?AIGP——AI Generated Protein?平臺,旨在將這一技術(shù)平臺的能力與更多行業(yè)伙伴分享,利用設計創(chuàng )新蛋白質(zhì)的能力,共同研發(fā)更多的前沿藥物和其他生命科學(xué)項目,也通過(guò)挑戰性的新任務(wù),驅動(dòng)AIGP平臺的技術(shù)進(jìn)步。
在發(fā)布前,AIGP平臺已經(jīng)進(jìn)行了一段時(shí)間的內部測試,在百圖生科內部承載了其創(chuàng )新免疫調控藥物 ImmuBot 的研發(fā)工作,貢獻了多個(gè)高性能彈頭、新功能傳感器的研發(fā)案例。
除此之外,有近20家合作伙伴和百圖生科開(kāi)展了AIGP聯(lián)合研發(fā)合作,方向覆蓋高性能彈頭設計、新功能蛋白質(zhì)設計、靶點(diǎn)挖掘和調控蛋白設計等領(lǐng)域,其中多個(gè)項目取得了階段性的發(fā)現成果。在合作的創(chuàng )新藥企、學(xué)術(shù)PI的幫助下,AIGP平臺也進(jìn)行了諸多優(yōu)化。
因此,本次百圖生科AIGP平臺的對外發(fā)布,意味著(zhù)對平臺創(chuàng )新蛋白質(zhì)的生成能力開(kāi)啟“公測”新階段,也意味著(zhù)百圖生科AIGP平臺將為更多伙伴,亦面向包括科研、環(huán)保、材料、消費等更多場(chǎng)景的需求,提供解決方案。
圖: AIGP3大功能模塊+12項核心能力示意圖
目前,百圖生科AIGP平臺設置了3類(lèi)功能模塊,分別是Function to Protein Design(F2P,根據結構、功能、可開(kāi)發(fā)性等功能指標設計/優(yōu)化蛋白質(zhì))、Protein to Protein Design(P2P,給定抗原等目標蛋白,設計與之以特定方式結合的抗體等蛋白)、以及Cell to Protein Design(C2P,給定細胞,發(fā)現調控細胞功能的靶點(diǎn)蛋白并設計相應的調控蛋白)。
根據不同模塊的輸入和要求,AIGP平臺可在較短時(shí)間內設計和生成具有特定性質(zhì)的蛋白質(zhì)。
隨著(zhù)面向合作伙伴的公測階段取得進(jìn)展,百圖生科計劃于2023年6月起將部分功能模塊進(jìn)一步開(kāi)放,讓專(zhuān)業(yè)用戶(hù)可以直接自主使用,在更多的研究場(chǎng)景調用AI的蛋白質(zhì)生成能力,激發(fā)更多的生命科學(xué)探索。
對于百圖生科AIGP平臺的發(fā)布,世界生物信息學(xué)界的著(zhù)名學(xué)者、哈佛計算生物醫學(xué)中心創(chuàng )始主任、R語(yǔ)言的主要發(fā)明人、百圖生科科學(xué)顧問(wèn)委員會(huì )委員Robert Gentleman教授表示,在哈佛,他的團隊同樣在進(jìn)行蛋白質(zhì)生成/預測模型的相關(guān)研究,“百圖生科在這個(gè)方向上走得很遠了”。
他期待,AIGP會(huì )帶來(lái)更多的蛋白質(zhì)/抗體生成模型,抗體工程師們可能會(huì )從這些模型的預測中,發(fā)現自己從未注意過(guò)的細節,“如果將這些模型視作‘idea generator’,一切會(huì )變得更加美妙”。
中國科學(xué)院院士、著(zhù)名免疫學(xué)家董晨教授認為:“AI能夠解決的問(wèn)題,就是對大數據的分析和進(jìn)一步的演繹和應用。在當下的時(shí)間節點(diǎn),AIGP確實(shí)是一個(gè)呼之欲出的平臺。相信AIGP對于我們理解蛋白質(zhì),以及在生物系統中研究和發(fā)現它的功能和調控,乃至于將來(lái)研發(fā)新藥,都會(huì )有非常大的作用?!?/p>
圖 : 百圖生科CTO 、首席AI科學(xué)家宋樂(lè )博士
從AIGC到AIGP,人工智能的生成和預測能力對真實(shí)世界的影響將進(jìn)一步加深。
而AIGP能力的背后,正是百圖生科在底層技術(shù)上的持續投入,以及與合作伙伴對前沿創(chuàng )新的共同追求。發(fā)布會(huì )上,百圖生科CTO宋樂(lè )博士對此進(jìn)行了詳細介紹。
此前的媒體采訪(fǎng)中,宋樂(lè )博士也表示:“因為生命體的高度復雜度。目前數據量很大,但仍然是有限的。隨著(zhù)生命科學(xué)領(lǐng)域觀(guān)測手段和技術(shù)的發(fā)展,將使我們能夠更加精細精準地理解進(jìn)化,理解生命。這也就意味著(zhù),要實(shí)現這一目標,我們需要不斷吸納新的合作伙伴?!?/p>
正如百圖生科CEO劉維在本次發(fā)布活動(dòng)所提到的,雖然百圖生科的AI大模型和與之配套的大規模數據圖譜、高通量驗證體系都遠不完美,但已經(jīng)凝結了很多前沿技術(shù)的創(chuàng )新和探索,接下來(lái),從開(kāi)始展露一些能力到提高它的泛化能力和速度,需要專(zhuān)業(yè)伙伴的合作的加入,而且,合作伙伴也將得益這一系列嘗試,實(shí)現前沿項目的加速研發(fā)。
本文作者:AIGP,來(lái)源:BioMap百圖生科,原文標題:《百圖生科AIGP平臺發(fā)布:提供多種蛋白質(zhì)生成能力,加速前沿生命科學(xué)研究》
關(guān)鍵詞: