環(huán)球新動(dòng)態(tài):“視頻領(lǐng)域的Midjourney”!AI視頻生成新秀Gen-2內測作品流出,網(wǎng)友直呼太逼真
號稱(chēng)可以一句話(huà)拍大片的AI視頻生成工具Gen-2,開(kāi)始露出廬山真面目。
【資料圖】
有推特博主已經(jīng)率先拿到了內測資格。
這是他用提示詞“一個(gè)身材勻稱(chēng)or對稱(chēng)(symmetrical)的男人在酒吧接受采訪(fǎng)”生成的結果:
只見(jiàn)一個(gè)身著(zhù)深色襯衣的男人正望著(zhù)對方侃侃而談,眼神和表情透露著(zhù)一股認真和坦率,對面的人則時(shí)不時(shí)點(diǎn)頭以示附和。
視頻整體非常連貫且畫(huà)質(zhì)很是清晰,乍一看,真實(shí)訪(fǎng)談感滿(mǎn)滿(mǎn)有沒(méi)有!
同樣的提示詞生成的另一個(gè)版本也不賴(lài):
這次鏡頭更加拉近,背景更逼真,人物則仍然富有表現力。
有網(wǎng)友看完這組作品直呼:
太不可思議了吧,只靠文字提示就能生成這樣的結果!
還有人直言:
這是視頻領(lǐng)域的Midjourney來(lái)了。
博主實(shí)測Gen-2
這位博主名叫Nick St. Pierre,專(zhuān)門(mén)在推上分享他用AI制作的作品。
除了開(kāi)頭所見(jiàn)的寫(xiě)實(shí)風(fēng),他還發(fā)布了一組Gen-2的科幻作品。
比如“宇航員穿越太空”:
“一名武裝士兵沿著(zhù)宇宙飛船的走廊奔跑,身后一道黑影摧毀了墻壁”:
“一家在人類(lèi)動(dòng)物園吃微芯片的機器人”:
“人形機器人大軍在冰凍的平地上進(jìn)行殖民”:
(有種權游里面異鬼大軍進(jìn)擊長(cháng)城的氣勢……)
“地球上最后一個(gè)人看著(zhù)入侵的宇宙飛船降落在東京上空”:
……
以上這些全部都只憑一句提示詞就能完成,不需要借鑒其它圖片和視頻。
雖然說(shuō)這組科幻的效果相比“酒吧男人接受采訪(fǎng)”稍顯遜色,但神奇的是,它和AI圖像生成模型誕生之初的那種“混沌不清”的味道可以說(shuō)不相上下——仿佛看到了Stable diffusion等AI當時(shí)的影子。
如Nick St. Pierre表示:
Gen-2還處于嬰兒期,后面一定會(huì )更好。
我們也在網(wǎng)上找到了其他已經(jīng)拿到內測資格的人測試的一些效果:
可以說(shuō),除了比較難的科幻作品,其它它拿捏的都還不錯的亞子。
AI視頻生成也狂飆
專(zhuān)攻視頻生成的AI工具Gen-2于3月20日發(fā)布(論文3月11號)。
作為AIGC領(lǐng)域的新秀,它的迭代速度和質(zhì)量也是相當快了:
Gen-1版本2月才剛誕生,那會(huì )還只能對已有視頻進(jìn)行編輯;
現在Gen-2就已經(jīng)可以用文字和圖像作為提示詞直接生成視頻了。
官方號稱(chēng)它為“生成式AI的下一步”,宣傳語(yǔ)給的也是很霸氣:
say it,see it。(只要你能說(shuō)出來(lái),我就能讓你看到)
Gen-2的更新一口氣帶來(lái)了八大功能:
文生視頻、文本+參考圖像生視頻、靜態(tài)圖片轉視頻、視頻風(fēng)格遷移、故事板(Storyboard)、Mask(比如把一只正在走路的小白狗變成斑點(diǎn)狗)、渲染和個(gè)性化(比如把甩頭小哥秒變海龜人)。
它的出現和AI繪畫(huà)一樣,讓人看到了影視、游戲和營(yíng)銷(xiāo)等領(lǐng)域暗藏的巨大變革。
其背后開(kāi)發(fā)公司也值得說(shuō)道,它就是Runway。
Runway成立于2018年,為《瞬息全宇宙》特效提供過(guò)技術(shù)支持,也參與了Stable Diffusion的開(kāi)發(fā)(妥妥的潛力股)。
提示:Gen-1已經(jīng)可以開(kāi)始玩了(125次機會(huì )用完之后就只能按月付費了),Gen-2還沒(méi)有正式對公開(kāi)放。
除了Gen系列,微軟亞研院還最新發(fā)布了一個(gè)可以根據文字生成超長(cháng)視頻的AI:NUWA-XL。
只用16句簡(jiǎn)單描述,它就能get一段長(cháng)達11分鐘的動(dòng)畫(huà):
在往前一點(diǎn)兒,就在Gen-2發(fā)布同一天,阿里達摩院也開(kāi)源了17億參數的文本轉視頻AI:
效果是醬嬸的:
……
可以預見(jiàn),不止圖像生成,視頻領(lǐng)域也要變得熱鬧起來(lái)了。
咳咳,所以下一波大眾AI狂歡,會(huì )是它嗎?
本文作者:豐色,來(lái)源:量子位,原文標題:《“視頻領(lǐng)域的Midjourney”!AI視頻生成新秀Gen-2內測作品流出,網(wǎng)友直呼太逼真》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: