【獨家焦點(diǎn)】醫渡科技(02158)正研發(fā)醫療大模型,將擇機邀請測試
【資料圖】
近期業(yè)界傳言的“醫渡科技正研發(fā)醫療大模型”在7月3日得到了證實(shí),醫渡科技(02158)首席技術(shù)官、首席人工智能科學(xué)家閆峻在該公司2023財年業(yè)績(jì)發(fā)布會(huì )上確認了這一消息。
閆峻表示,公司在大語(yǔ)言模型的訓練和面向場(chǎng)景的調優(yōu)上早有布局,也做了很大投入。醫渡科技的“醫療智能大腦“YiduCore一直在自然語(yǔ)言處理領(lǐng)域深耕,語(yǔ)言模型的訓練也一直是其中很重要的組成部分。從整個(gè)技術(shù)鏈來(lái)看,大語(yǔ)言模型并非新鮮事物,未來(lái)的大模型訓練數據規模更大,并且要針對一些特定場(chǎng)景進(jìn)行調優(yōu),這樣才能解決很多的實(shí)際問(wèn)題。
大語(yǔ)言模型的訓練和調優(yōu)對數據、算力和算法以及工程都有著(zhù)極高的要求。在數據層面,醫渡科技正在注入更多的專(zhuān)業(yè)知識型數據。相比之前,公司對這些知識型數據的表達方式做了很多精細化加工與處理,并使用了課程學(xué)習等手段。在計算資源上,公司也重點(diǎn)增強了算力,用以支持從之前幾億參數,到幾十億參數乃至幾百億參數的模型。
閆峻還介紹到,醫療健康垂直領(lǐng)域與開(kāi)放領(lǐng)域有著(zhù)很大的不同。對于醫療健康垂直領(lǐng)域而言,其下游任務(wù)相對比較明確,因此參數規模和要解決下游任務(wù)上存在一個(gè)性?xún)r(jià)比的平衡點(diǎn)。
在以傳統方法為基礎的模型算法和工程經(jīng)驗上,醫渡科技已有大量積累。在模型規模放大的過(guò)程中,公司還在持續針對下游任務(wù)調優(yōu)投入大量精力。
閆峻強調,由于醫療健康領(lǐng)域的嚴肅性,在這一垂直領(lǐng)域的大模型訓練過(guò)程中,對于專(zhuān)業(yè)性和信息安全等多方面要求都非常高,需要從業(yè)者心懷敬畏并以謹慎的態(tài)度去提供服務(wù)。
比如,在眾多開(kāi)放領(lǐng)域遇到的問(wèn)題,機器提供的答案能夠達到70-80分便可達到應用水平;但對于醫療健康領(lǐng)域而言,下游任務(wù)要求足夠的專(zhuān)業(yè)性和模型的精準度,而且要同時(shí)確保信息安全,做到95分甚至更高才能達到真正的應用水平。因此,需要更多的時(shí)間補充知識及測試調優(yōu)。
智通財經(jīng)APP了解到,醫渡科技將于近期在適當的時(shí)間針對部分目標場(chǎng)景推出小范圍邀請測試,所涉及場(chǎng)景將包括內部生產(chǎn)效率提升,面向當前業(yè)務(wù)產(chǎn)品的智能化升級,以及提供對患者的新服務(wù)能力,也不排除對行業(yè)中的科研及商業(yè)機構開(kāi)放提供專(zhuān)業(yè)醫療垂直領(lǐng)域大模型服務(wù)的可能。
關(guān)鍵詞: