AI見(jiàn)聞日報:AI智能體成為科技巨頭爭搶的新風(fēng)口 | 見(jiàn)智研究 當前熱聞
今日要點(diǎn)
1、AI智能體成為科技巨頭爭搶的新風(fēng)口;
2、宣稱(chēng)超越Gen-2還免費開(kāi)放,文生視頻大模型進(jìn)入開(kāi)源競賽;
3、國內發(fā)布首個(gè)胸部X-ray診斷大模型,將提高醫療診斷準確性和效率;
(資料圖)
每日見(jiàn)智AI
1、AI智能體成為科技巨頭爭搶的新風(fēng)口
近期,AI?領(lǐng)域的大佬和科技巨頭對人工智能智能體的發(fā)展表現出極大興趣,并寄予了厚望。特斯拉前AI總監、今年年初回歸OpenAI的Andrej?Karpathy近日在一次開(kāi)發(fā)者活動(dòng)上透露,OpenAI內部對于新的AI智能體論文表現出極大興趣,并進(jìn)行認真討論。
與此同時(shí),英偉達公司開(kāi)源的VOYAGER也給AI圈帶來(lái)了轟動(dòng)效應。作為一個(gè)基于大模型驅動(dòng)和具備終身學(xué)習能力的游戲智能體,VOYAGER在《我的世界》中展現出了非凡的水平。這一成就進(jìn)一步引發(fā)了對于A(yíng)I智能體的興趣,并被認為是通用人工智能(AGI)的雛形之一。
見(jiàn)智點(diǎn)評:
盡管目前這些AI智能體還遠未達到完全模擬人類(lèi)智能的程度,但其出現表明了人工智能領(lǐng)域正在不斷向前發(fā)展,并且吸引了全球范圍內的關(guān)注。對于這些智能體的研究和開(kāi)發(fā)有望為我們在未來(lái)實(shí)現通用人工智能的目標邁出重要一步。
隨著(zhù)越來(lái)越多的公司和研究機構投入到AI智能體的研究中;比如已經(jīng)出現用于科學(xué)發(fā)現的智能體ChemCro能夠完成有機合成、藥物發(fā)現和材料設計等任務(wù);未來(lái)可以預見(jiàn),我們將會(huì )看到更多令人驚嘆的成果和突破,推動(dòng)人工智能技術(shù)邁向新的高度。
2、宣稱(chēng)超越Gen-2還免費開(kāi)放,文生視頻大模型進(jìn)入開(kāi)源競賽
最近,Huggingface上有作者發(fā)布了一個(gè)文生視頻模型Zeroscope_v2,開(kāi)發(fā)者cerspense表示,他的目標就是和Gen-2進(jìn)行開(kāi)源較量,即提高模型質(zhì)量的同時(shí),還能免費供大眾使用。
Zeroscope_v2大模型是基于17億參數量ModelScope-text-to-video-synthesis模型進(jìn)行二次開(kāi)發(fā)。相比于原版本,Zeroscope生成的視頻沒(méi)有水印,并且流暢度和分辨率都得到了提升,適配16:9的寬高比。
見(jiàn)智點(diǎn)評:
文生視頻領(lǐng)域仍處于起步階段,可生成幾秒鐘的視頻且存在視覺(jué)缺陷。Zeroscope_v2的快速生成速度和較低的顯存需求使其適用于視頻概念的快速驗證。這將幫助創(chuàng )作者、設計師等快速生成原型和樣本視頻,節省時(shí)間和資源成本。
但見(jiàn)智并不認為目前該模型具備超越Gen2的能力;不過(guò)Zeroscope_v2為開(kāi)發(fā)者提供了高質(zhì)量的開(kāi)源模型,提高了視頻生成效率,同時(shí)也為文生視頻應用的創(chuàng )新提供了更廣闊的可能性。
與文生圖不同,文生視頻領(lǐng)域面臨更高的資源需求和技術(shù)挑戰,同時(shí)對時(shí)間和連貫性有更高的要求,應用領(lǐng)域也更為廣泛。
3、國內發(fā)布首個(gè)胸部X-ray診斷大模型,將提高醫療診斷準確性和效率
上海交通大學(xué)與上海人工智能實(shí)驗室聯(lián)合團隊聚焦醫學(xué)人工智能,提出了首個(gè)基于醫學(xué)領(lǐng)域知識增強的?Chest?X-ray?的基礎模型:即?KAD(Knowledge-enhanced?Auto?Diagnosis?Model),論文成果入選Nature子刊。
KAD模型通過(guò)在大規模醫學(xué)影像與放射報告數據進(jìn)行預訓練,通過(guò)文本編碼器對高質(zhì)量醫療知識圖譜進(jìn)行隱空間嵌入,利用視覺(jué)?-?語(yǔ)言模型聯(lián)合訓練實(shí)現了知識增強的表征學(xué)習。
在不需要任何額外標注情況下,KAD?模型即可直接應用于任意胸片相關(guān)疾病的診斷,為開(kāi)發(fā)人工智能輔助診斷的基礎模型提供了一條切實(shí)可行的技術(shù)路線(xiàn)。
見(jiàn)智點(diǎn)評:
KAD模型提出了一種基于知識增強的表征學(xué)習方法,為醫療基礎模型的應用和落地提供了解決方案。其訓練框架只需要影像-報告數據,不依賴(lài)于人工注釋?zhuān)⑶覠o(wú)需監督微調即可達到與專(zhuān)業(yè)醫生相當的精度。這一創(chuàng )新有望推動(dòng)醫療基礎模型在臨床實(shí)踐中的應用,提高醫療效率和診斷準確性。
總體而言,KAD模型在醫學(xué)人工智能領(lǐng)域具有重要的意義和影響。它為醫學(xué)影像診斷提供了一種新的技術(shù)路線(xiàn),能夠加速診斷過(guò)程、提高準確性,并為醫生提供更多的輔助信息。隨著(zhù)該模型的進(jìn)一步發(fā)展和推廣,預計會(huì )促進(jìn)醫療基礎模型在臨床實(shí)踐中的廣泛應用,為醫療行業(yè)帶來(lái)更多的創(chuàng )新和效益。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: