方正楊曉峰:AI大幅降低游戲制作成本,半年到一年內將取得突破性進(jìn)展 | 見(jiàn)智研究
華爾街見(jiàn)聞·見(jiàn)智研究特邀到了方正證券AI互聯(lián)網(wǎng)首席分析師【楊曉峰】詳細拆解了AI大模型對游戲行業(yè)能夠帶來(lái)哪些降本增效的影響,并且初步預判該影響至少要二個(gè)季度才能反應在財務(wù)上。
核心觀(guān)點(diǎn):
(相關(guān)資料圖)
1、AI現在有兩個(gè)大模型能夠極大程度提高游戲在美術(shù)制作流程上的效率,節省制作成本以及縮短時(shí)間。這兩個(gè)大模型分別是Stable Diffusion和NeRF模型,能夠分別在游戲美術(shù)制作過(guò)程中,對2D和3D場(chǎng)景和人物生成進(jìn)行優(yōu)化。
2、Stable Diffusion又稱(chēng)文生圖模型,能夠生成多視角的2D圖,進(jìn)一步為生成3D圖奠定基礎,但是條件受限于需要性能等級高的顯卡,因此在普通消費者群體中很難大范圍滲透。
3、NeRF模型主要是對2D-3D過(guò)程進(jìn)行了降本增效,當前制作一個(gè)3D游戲角色的周期在30-45天左右,且需要的步驟較多,參與的人員眾多;使用NeRF可以快速建模,從而提高效率,節省成本。之前要10個(gè)工作日的工作現在只需要半天到一天就能完成,這相當于節省了90%的時(shí)間。
4、但是NeRF模型尚未達到引爆點(diǎn),主要原因是該技術(shù)有一定壁壘,不過(guò)龍頭公司Luma AI,開(kāi)發(fā)了NeRF相關(guān)的APP,目前已上線(xiàn)APP Store,極大的降低了NeRF的使用門(mén)檻,預計在未來(lái)的半年到一年內會(huì )取得突破性進(jìn)展。
5、總得來(lái)看,AI模型能夠對游戲研發(fā)設計過(guò)程中成本和時(shí)間進(jìn)行極大的優(yōu)化,據不完全統計,在游戲的研發(fā)成本中美術(shù)成本一般占50%到80%。如果一個(gè)游戲公司的研發(fā)成本占70%,那么其中的40%基本上都可以大幅降低。
6、大公司和小公司的區別就是否只能降 2D 的錢(qián),還是也能降 3D 的錢(qián),如果 2D 和?3D 都能降低了,那么整個(gè)降本增效的幅度其實(shí)是60%-70%都不一定打得住,所以說(shuō)下降的幅度其實(shí)非常大的。
正文:
見(jiàn)智研究:為什么AI在游戲的應用受到關(guān)注?
楊曉峰:
核心原因是游戲公司的商業(yè)模式相對比較優(yōu)秀,他們有一定的資源可以運用AI模型。另一個(gè)原因是現在有很多 AI 模型已經(jīng)比較成熟,例如 AI 作畫(huà),這直接顛覆或者改變了游戲行業(yè),所以目前來(lái)看游戲行業(yè)是最快應用 AI 的行業(yè)。當然,動(dòng)畫(huà)行業(yè)也是類(lèi)似的,因為現在國內和國外的技術(shù)水平基本持平,尤其在 AI 作畫(huà)方面。
最近我們注意到海外有一款游戲,其中有好幾個(gè)角色都是通過(guò)人工智能控制的??梢韵胂?,這款游戲就像《西部世界》一樣,游戲中的許多角色都有自己的成長(cháng)軌跡和個(gè)性。在這個(gè)世界里,除了玩家自己以外,每個(gè)人都是真實(shí)的。這種體驗的沉浸感非常高,這種應用將會(huì )越來(lái)越普及。這種體驗其實(shí)就是 NPC 的一個(gè)改進(jìn)。
我們還注意到另一個(gè)案例,當我們用游戲制作美術(shù)的時(shí)候,花同樣的錢(qián),我們可以把整個(gè)美術(shù)場(chǎng)景做得越來(lái)越漂亮。過(guò)去,我們只能把在前面的視角做得比較漂亮,但現在花同樣的錢(qián)能把整個(gè)視覺(jué)都做得非常漂亮。我們已經(jīng)看到很多這樣的案例。
此外,我們最近還發(fā)現了一個(gè)名為?Inword 的平臺。這個(gè)產(chǎn)品事先已經(jīng)訓練好了各種非常有性格的人物角色,可以直接將這個(gè)代碼集成到游戲中。這樣游戲中可能會(huì )出現像馬斯克這樣有性格的角色。其他人已經(jīng)把這些集成好了,只需要接入使用就可以了,游戲體驗將會(huì )得到非??焖俚母纳?。
見(jiàn)智研究:哪些AI模型可以應用于游戲領(lǐng)域?各自的特點(diǎn)是什么?
楊曉峰:
現在有兩種成熟的模型,一種是大文本模型,另一種是 2D 作圖模型,還有一種處于爆發(fā)期的2D轉3D NeRF模型。
第一類(lèi)模型是文本生成模型,例如 ChatGPT 和國內的各種大模型,它們可以接受文本輸入并輸出對應的文本,這種模型被廣泛使用。但在游戲中,通常直接使用其中的角色。
第二類(lèi)模型類(lèi)似于文生圖,它可以根據輸入的文本生成各種各樣的圖片。這種模型已經(jīng)非常成熟,大多數互聯(lián)網(wǎng)公司都在使用它來(lái)生成圖片。比較著(zhù)名的有Stable?Diffusion和 Midjourney,其中Stable?Diffusion的使用較為廣泛,因為它所需的費用較少;Midjourney面向消費者,使用體驗較好,且對電腦的要求較低。因此,后續制作 2D 圖像時(shí)可以使用它。
現在還有一個(gè)模型即將爆發(fā),可能會(huì )在未來(lái)半年到一年內實(shí)現,它是將 2D 轉化為 3D 的模型,名為神經(jīng)輻射場(chǎng)(NeRF)。只需拍幾張照片,就可以立即生成一個(gè)包括場(chǎng)景和人物的 3D 模型。想象一下以前制作游戲時(shí)需要的場(chǎng)景圖,如刺客信條中的巴黎場(chǎng)景?,F在只需花費一些資金用無(wú)人機拍攝一些視頻,就能立即將 3D 模型建立起來(lái),成本降低非???。這是目前可能已經(jīng)使用的模型。
見(jiàn)智研究:生成3D模型的方式有哪些?分別有何優(yōu)劣?
楊曉峰:
過(guò)去生成 3D 的方法一般是通過(guò)畫(huà)平面圖進(jìn)行建模,例如對于一個(gè)角色,可能需要從不同視角畫(huà)多張圖來(lái)進(jìn)行建模。然后建模師會(huì )使用建模軟件一個(gè)個(gè)搭建,例如將立體的頭發(fā)貼到人臉上。這種方法需要花費大量的時(shí)間,可能需要 2 到 3 周才能完成一個(gè)人物的建模。優(yōu)勢是每個(gè)物體都是比較精巧的立體結構,但劣勢在于時(shí)間成本很高,因此一般會(huì )交給外包公司去完成。
還有一種叫照相技術(shù)的方法,即通過(guò)拍攝物體的照片來(lái)建立模型,但是每張照片必須要重合50%才能建立一個(gè)模型,但這種技術(shù)對光影等細節處理比較困難,因此很少被使用。
最近開(kāi)始使用的 NeRF 模型已經(jīng)有了一篇公開(kāi)的論文,目前可供使用的軟件只有兩個(gè):Instant NGP和Luma。目前這兩個(gè)產(chǎn)品已經(jīng)能夠做到只需拍攝一個(gè)物體,即可立即生成3D模型。但它也有缺點(diǎn),即在制作產(chǎn)品時(shí)未考慮兼容性。
比如在英偉達的生態(tài)系統內制作了一個(gè)非常漂亮的3D模型,但我們并不會(huì )考慮將其優(yōu)化并放到Unity或虛幻引擎中運行,因為3D建模完成后必須將其放入游戲引擎中才能產(chǎn)生最佳效果。目前看來(lái),這個(gè)領(lǐng)域仍在發(fā)展中,但是Luma已將其插件放入虛幻引擎和游戲引擎中,它的進(jìn)展可能會(huì )更快。我們可以這樣理解:目前這個(gè)模型并不十分開(kāi)源,因此需要一些人工智能工程師才能更好地使用它。優(yōu)點(diǎn)就是確實(shí)可以降低很大的成本,但是需要掌握一些相對高水平的技能。
見(jiàn)智研究:NeRF是否會(huì )替代原來(lái)的 3D 模型成為未來(lái)主流選擇?
楊曉峰:
我認為大概率會(huì )實(shí)現,因為行業(yè)目前的最新進(jìn)展是,就像我們剛才介紹的,2D照片可以生成3D模型?,F在,行業(yè)最新的動(dòng)態(tài)是可以直接進(jìn)行修改,比如說(shuō)我有一個(gè)自己的人物3D模型,我可以通過(guò)輸入文本,將我的人物頭像替換成馬斯克的頭像。這個(gè)技術(shù)已經(jīng)相當成熟了。
最近,有一個(gè)海外的大一新生,對NeRF技術(shù)貢獻了非常迅速的進(jìn)展。將來(lái),你可以通過(guò)文本修改3D模型,例如,你可以讓它為你的模型加胡子或眼鏡。這個(gè)功能看起來(lái)非??犰?,也相當強大,但如果你了解其原理,你就會(huì )發(fā)現其實(shí)并不是那么難,只是以前沒(méi)有人去優(yōu)化。
現在大多數人使用模型進(jìn)行嫁接,每個(gè)模型都有自己擅長(cháng)的領(lǐng)域。例如,文本模型擅長(cháng)處理文本輸入和輸出,Stable?Diffusion擅長(cháng)生成 2D 圖像,而 NeRF 模型則擅長(cháng)將 2D 圖像轉換為 3D 圖像。
未來(lái)的發(fā)展趨勢是將所有模型連接在一起,用戶(hù)只需簡(jiǎn)單地表達意圖,模型就能幫助實(shí)現任務(wù)。目前,NeRF 模型是最具潛力的模型之一,但其尚未達到引爆點(diǎn)。預計在未來(lái)的半年到一年內,NeRF 模型會(huì )大放異彩。
見(jiàn)智研究:Stable?Diffusion模型的特點(diǎn)是?
楊曉峰:
我們剛才提到了 NERF 可以將 2D 照片轉換成 3D 圖片,而Stable?Diffusion 本質(zhì)上是一個(gè)文生圖的工具。這個(gè)工具為什么會(huì )這么受歡迎?它目前的功能有多強大?
在去年的 11 月到 12 月之前,這個(gè)軟件其實(shí)并沒(méi)有什么熱度,但突然間變得火爆起來(lái)。原因是有人上傳了一個(gè)數據包,用戶(hù)只需要輸入想要的卡通或真人形象,就能迅速生成一個(gè)非常漂亮的圖像,吸引了大量用戶(hù)涌入。同時(shí)無(wú)數人也開(kāi)始為其提供各種訓練數據包,進(jìn)一步豐富了其功能,現在不僅能畫(huà)出二次元卡通和真人形象,還能畫(huà)出 GTA5 的圖像。
這個(gè)軟件之所以能如此強大,因為市場(chǎng)上的無(wú)數用戶(hù)都在為其提供訓練數據包,使得模型能夠生成各種精美圖像。但是需要注意的是,這個(gè)軟件需要較好的顯卡,最好是 3090 或者更高的4090,因此對于普通消費者的用戶(hù)體驗可能一般。為此,有人專(zhuān)門(mén)用Stable?Diffusion的建模開(kāi)發(fā)了網(wǎng)頁(yè)版,讓用戶(hù)不需要擁有好的電腦,就能在網(wǎng)頁(yè)上使用。不過(guò),這個(gè)服務(wù)需要付費,普通用戶(hù)每月需要支付幾十美元,企業(yè)用戶(hù)則需要支付更高的費用。
因為開(kāi)源的原因,現在Stable?Diffusion 不僅能夠生成靜態(tài)圖像,甚至能夠生成視頻。這是因為在今年3月份,有人修改了底層代碼,使得可以規定 AI 作圖的一些參數,例如如果我畫(huà)了一匹馬,我可以再畫(huà)一張馬抬腿的圖像,然后將每個(gè)馬的腿都抬起來(lái),合成為一個(gè)視頻。這就是為什么現在國內外很多公司突然推出了 AI 視頻的原因,因為它們都是基于 Stable?Diffusion這個(gè)原理,只是可能在這個(gè)渠道上進(jìn)行了一些優(yōu)化。
此外,Stable?Diffusion 現在更強大的一點(diǎn)是可以無(wú)中生有地建立 3D 模型,只要你能描述這個(gè)物體的各個(gè)角度,它就能夠生成多個(gè)角度的2D圖片,接著(zhù)再利用多視角的2D圖片生成3D圖片。因此未來(lái)是可以無(wú)中生有的生成 3D 的。這意味著(zhù)Stable?Diffusion 已經(jīng)成為了 AI 作圖領(lǐng)域最強大的工具之一,其他的工具都是在其基礎上進(jìn)行迭代。
見(jiàn)智研究:開(kāi)源的模型的優(yōu)勢和意義在哪?拓展插件對于模型起到什么作用?
楊曉峰:
模型一旦開(kāi)源,全球頂尖的人才就可以使用它并做微調,他們可以貢獻各種各樣的素材包,使得模型使用效果更強大。因為Stable?Diffusion開(kāi)源,全球所有人都可以享受到這個(gè) AI 作圖的紅利,大家都可以在上面進(jìn)行修改或將其放到自己的服務(wù)器上。開(kāi)源意味著(zhù)這個(gè)軟件的每一條代碼都是公開(kāi)的,可以下載到本地,而別人也無(wú)法對你進(jìn)行操作。
當然,行業(yè)可能需要一些相對厲害的人才,才能將這個(gè)產(chǎn)品推向更高層次,修改底層代碼,進(jìn)一步提升產(chǎn)品水平。因此,開(kāi)源對整個(gè)模型的進(jìn)步速度非???,可以想象,在 11 月和 12 月之前,大多數人的水平都比較低,但是因為開(kāi)源,無(wú)數人在 1 月和 2 月份上傳了數據包,3 月份修改了底層代碼,這個(gè)產(chǎn)品的進(jìn)展就非??炝???梢赃@樣理解,開(kāi)源把所有人的水平都提高了一個(gè)非常高的狀態(tài)。
見(jiàn)智研究:模型開(kāi)源很大程度加速了應用層面的落地?
楊曉峰:
Midjourney為什么會(huì )如此受歡迎呢?并不是因為它有技術(shù)上的優(yōu)勢,而是因為它更能夠滿(mǎn)足C端用戶(hù)的需求。比如,我們都知道Stable?Diffusion技術(shù)很好,產(chǎn)品性能也很好,但問(wèn)題在于并非每個(gè)人的電腦都有如此高的顯卡,同時(shí),數據包越多并不一定意味著(zhù)更好的體驗,因為很多人更想要一些更加真實(shí)的、大氣的效果,對吧?因此,很多產(chǎn)品都是在這個(gè)基礎上針對C端用戶(hù)的體驗進(jìn)行了優(yōu)化。背后的技術(shù)可能需要使用Stable?Diffusion等原創(chuàng )技術(shù),或者出于成本考慮使用其他技術(shù),但對于普通的C端用戶(hù),使用Midjourney基本上就足夠了。
見(jiàn)智研究:AI是如何對游戲進(jìn)行降本增效的?
楊曉峰:
以一個(gè)游戲公司為例,該公司的研發(fā)成本中,美術(shù)成本一般占50%到80%。因為有些游戲的用戶(hù)數量非常多,不能出現卡頓等問(wèn)題,因此游戲的程序成本非常高,那么美術(shù)成本占據了研發(fā)成本的 50%。但是有些游戲只是卡牌游戲,只需要將卡片畫(huà)好,它就能自己動(dòng)了,這種游戲的美術(shù)成本占據了80%??梢韵胂笠幌逻@種情況下的成本。
而作為游戲美術(shù),首先,我需要設計游戲的UI界面,如果我手頭有10個(gè)人,其中一個(gè)人會(huì )負責繪制游戲橫屏的UI界面,比如登錄界面。剩下的三個(gè)人會(huì )設計人物模型,做2D的人物設計,比如繪制多個(gè)視角下的角色,通常需要兩周的時(shí)間才能完成一個(gè)角色的繪制。
這四個(gè)人以前需要兩周才能完成的工作,現在只需要半天就能完成了。這意味著(zhù)我們可以節省很多時(shí)間和成本。之前需要10個(gè)工作日的工作現在只需要半天到一天就能完成,這相當于節省了90%的時(shí)間。
如果我們只考慮2D方面,那就是2D的人物和平面界面。其余的六層都是外包給其他人做建模的。比如說(shuō),我拿到了一個(gè)2D的畫(huà)面,我可以找一個(gè)建模師幫我把它建成一個(gè)3D的物體或人物,這個(gè)錢(qián)一般都是給外面的人。這一部分成本是可以砍掉的。
但NeRF不是開(kāi)源的,很多公司沒(méi)有這么優(yōu)秀的AI人才去使用它,所以這方面的進(jìn)展還不是很大。如果一個(gè)游戲公司的研發(fā)成本占70%,那么其中的40%基本上都可以大幅降低。
所以我覺(jué)得說(shuō),大公司和小公司的區別就是你是否只能降 2D 的錢(qián),還是說(shuō)你也能降 3D 的錢(qián),如果你 2D 加 3D 都能降低了,那么我覺(jué)得整個(gè)降本增效的幅度其實(shí)是60%-70%都不一定打得住,所以說(shuō)下降的幅度其實(shí)非常大的。
互動(dòng)環(huán)節:
見(jiàn)智研究:游戲降本增效的成果多久能夠反映在財務(wù)報表上?
楊曉峰:
這個(gè)主要看的是一個(gè)自上而下的邏輯,因為 2D 作畫(huà)這個(gè)工具在今年一、二月份才開(kāi)始反映,在公司內推行基本上要到4月以后,可能在二季度甚至三季度會(huì )逐步顯現。
而從模型上來(lái)看,生成多個(gè)視角圖的功能都是在 3 月份才開(kāi)始的,二季度慢慢地就開(kāi)始熟練起來(lái),三季度可能慢慢就顯現出來(lái)了成品效果。
見(jiàn)智研究:對擁有 IP 較多的公司會(huì )有什么影響?
楊曉峰:
IP的價(jià)值被認為很高,因為它可以持續產(chǎn)生產(chǎn)品。通過(guò)提高生產(chǎn)能力,像迪斯尼動(dòng)畫(huà)一樣,供應量可以大幅增加,但需求可能無(wú)法跟上。人工智能可以將生產(chǎn)能力增加至5倍,但市場(chǎng)是否能夠承受這么多還不確定,可能需要打折扣。擁有強大的IP可以增加產(chǎn)品的吸引力,因為隨著(zhù)產(chǎn)品數量的增加,創(chuàng )造新IP變得越來(lái)越困難。
見(jiàn)智研究:對于不同類(lèi)型的游戲公司降本增效的方式會(huì )有哪些側重?
楊曉峰:
我們首先看的就是對于頭部的公司而言,它降本增效特別明顯,就是2D、 3D 同時(shí)降,因為他們招的是一些頂級的 AI 工程師,所以2D、 3D 都能降。他們可能能夠跟海外的 3A 大廠(chǎng)進(jìn)行競爭了,因為 3A 大廠(chǎng)過(guò)去構筑的那種美術(shù)壁壘就相對于漏了非常多,那么這是頭部的公司,那么對于中腰部的公司而言,就相對而言說(shuō),它可以通過(guò)使用一定的技術(shù)把自己的成本降下去。
見(jiàn)智研究:接下來(lái)您比較看好的是哪些的賽道?
楊曉峰:
AI作畫(huà)是當前比較成熟的技術(shù)之一,其中動(dòng)畫(huà)和游戲是最有可能最快落地應用的領(lǐng)域。由于之前美術(shù)人才緊缺,這些行業(yè)在使用AI作畫(huà)后將大幅提高產(chǎn)能。此外,隨著(zhù)時(shí)間的推移,使用AI作畫(huà)的成本也會(huì )顯著(zhù)降低。因此,這兩個(gè)領(lǐng)域是值得關(guān)注的賽道,不僅能降低成本,還能快速提高產(chǎn)能。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: