AI見(jiàn)聞日報:見(jiàn)智實(shí)測“超級網(wǎng)紅”Runway Gen2,一鍵文生視頻,比Midjourney更易用 | 見(jiàn)智研究
今日要點(diǎn):
1、谷歌大手筆投資的Runway正式發(fā)布Gen2,文字生成視頻成真,內附見(jiàn)智實(shí)測;
2、360智腦通過(guò)中國信通院可信AIGC大語(yǔ)言模型功能評估,為國內首家;
(資料圖)
3、阿里達摩院開(kāi)源Video-LLaMA,幫大語(yǔ)言模型加上“眼睛”、“耳朵”;
4、AI生成二維碼—將快速應用于廣告市場(chǎng);
每日AI
1、谷歌大手筆投資的Runway正式發(fā)布Gen2,文字生成視頻成真,內附見(jiàn)智實(shí)測
今天,真正的文本一鍵生成視頻出現了。Stable Diffusion和《瞬息全宇宙》背后技術(shù)公司Runway,出品的text?to?video的AI視頻編輯工具Gen2,今日開(kāi)放用戶(hù)使用。Gen2,也在內測階段就被網(wǎng)友稱(chēng)贊“視頻界的Midjourney”。
見(jiàn)智今天使用runway的app版本做了一個(gè)貓的視頻;Prompt:?A golden gradient cat is jumping in the grass,同時(shí)又給了一張小貓咪的圖作為模板。
目前來(lái)看runway已經(jīng)能夠按照指令生成相應的視頻,但是精細程度和對prompt的理解程度相對圖片生成平臺Midjourney還是明顯要弱一些的。但是隨著(zhù)用戶(hù)大規模的使用改進(jìn),相信Runway的Gen2很快可以風(fēng)靡小視頻創(chuàng )作領(lǐng)域。
見(jiàn)智點(diǎn)評:隨著(zhù)多模態(tài)模型的發(fā)展,從文字-圖片-視頻之間的相互生成將改變整個(gè)用戶(hù)生態(tài)。對于產(chǎn)業(yè)界來(lái)說(shuō),只成為素材生產(chǎn)者還遠遠不夠,能夠將生成素材進(jìn)一步便捷讓用戶(hù)生成最終形態(tài)應用將是AI應用發(fā)展更重要的一步。
2、360智腦通過(guò)中國信通院可信AIGC大語(yǔ)言模型功能評估,為國內首家
360智腦的360GPT-S2-V8型號產(chǎn)品獲得了中國信息通信研究院“可信AIGC大語(yǔ)言模型基礎能力”評估報告,報告顯示必選項目評估內容均通過(guò)。據悉,360智腦是國內首個(gè)通過(guò)中國信通院該項權威評估的大模型產(chǎn)品。
見(jiàn)智點(diǎn)評:360智腦成為首家通過(guò)中國信通院權威認證,一方面說(shuō)明了通用大模型的基礎能力得到認可,重要的是數據集的安全性有了國家的背書(shū),更有助于之后大范圍的商用應用推廣。同時(shí)關(guān)注明天的360智腦發(fā)布會(huì )。
3、阿里達摩院開(kāi)源Video-LLaMA,幫大語(yǔ)言模型加上“眼睛”、“耳朵”
阿里達摩院的研究人員提出了 Video-LLaMA,一個(gè)具有綜合視聽(tīng)能力大模型。Video-LLaMA 能夠感知和理解視頻中的視頻和音頻信號, ?并能理解用戶(hù)輸入的指令,完成一系列基于音視頻的復雜任務(wù),例如音 / 視頻描述,寫(xiě)作,問(wèn)答等。目前論文,代碼,交互 demo 都已開(kāi)放。另外,在 Video-LLaMA 的項目主頁(yè)中,該研究團隊還提供了中文版本的模型,讓中文用戶(hù)的體驗更絲滑。
見(jiàn)智點(diǎn)評:阿里達摩院讓Video-LLaMA開(kāi)源,進(jìn)一步推動(dòng)國內多模態(tài)大模型的發(fā)展進(jìn)程。視聽(tīng)綜合大模型非常適用于辦公、學(xué)習領(lǐng)域的應用。另外,Video-LLaMA大模型對于靜態(tài)圖像也有比較強的理解能力,能夠完成圖片描述和問(wèn)答。
4、AI生成二維碼—將快速應用于廣告市場(chǎng)
擺脫單調的黑白,使用 ControlNet 的 AI 生成的二維碼將更具特色和商業(yè)價(jià)值。
具體來(lái)看一個(gè)應用顯示:識別二維碼推薦的是QRBTF -就是一款能夠制作漂亮有趣二維碼的免費開(kāi)源在線(xiàn)工具;
見(jiàn)智點(diǎn)評:ControlNet是基于Stable_Diffusion進(jìn)行AI生成的一種訓練方式,它的特點(diǎn)是計算方法更高效,因為訓練不需要在原始編碼器上進(jìn)行,所以更節省GPU內存,訓練速度也更快。最值得關(guān)注的是,ControlNet這種有控制的生成AI圖像更能夠得到我們想要的圖片結果,同時(shí)操作方式簡(jiǎn)單能夠在PC端運行。
從應用層面來(lái)看,我們看到這種創(chuàng )意形 AI 生成的二維碼更能夠具有品牌專(zhuān)屬特性且方便進(jìn)行品牌或者網(wǎng)站等任何產(chǎn)品的推廣應用。在不久的將來(lái),這將在廣告中越來(lái)越普遍。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: