国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

您的位置：首頁(yè) > 股票 >

注入AI的靈魂后，數字人將成為所有人的“門(mén)戶(hù)”_環(huán)球熱訊

來(lái)源：阿爾法工場(chǎng) ? 2023-06-27 17:31:49

（原標題：注入AI的靈魂后，數字人將成為所有人的“門(mén)戶(hù)”）

自古以來(lái)，人類(lèi)就有著(zhù)對自我影像的追求和渴望。影像是人類(lèi)的延伸、記憶，也是人類(lèi)的表達。

過(guò)去的兩百多年里，人類(lèi)為了留住自我的影像，創(chuàng )造了各種手段和工具。從最初的畫(huà)像，到后來(lái)的攝像機，再到今天的數字人，都是人類(lèi)為了留住畫(huà)像，解放人類(lèi)的軀體，而進(jìn)行一次次技術(shù)革新。

(資料圖)

盡管數字人從誕生那天起，就一直在試圖模仿和復制真實(shí)的人類(lèi)，但由于時(shí)代的局限，以往的數字人，離人們想象中那栩栩如生的形象，總是差了點(diǎn)氣候，

其在商業(yè)上的應用，也總是難免被人視作“雞肋”。

然而，AI時(shí)代的到來(lái)，似乎為這一曾經(jīng)“聊勝于無(wú)”的技術(shù)，注入了新的靈魂。憑借愈發(fā)逼真的形象，數字人開(kāi)始在更多的場(chǎng)景、行業(yè)中進(jìn)行賦能。

01 “前浪”艱難探索

很多人在談到數字人的過(guò)去時(shí)，往往都會(huì )陷入一個(gè)誤區，認為最初的數字人僅僅是個(gè)被炒起來(lái)的概念，是個(gè)像VR那樣，看似潛力無(wú)限，實(shí)則可有可無(wú)的“雞肋”。

實(shí)際上，這樣的看法，忽略了一個(gè)重要的現實(shí)，那就是：

在數字人誕生的早期，不是人們沒(méi)有對數字人的需求，而是當時(shí)的技術(shù)、成本，根本滿(mǎn)足不了這樣的需求。

具體來(lái)說(shuō)，早期的數字人，主要存在著(zhù)成本高昂、技術(shù)標準不統一、形象難以與真人媲美等缺陷。

據國內領(lǐng)先的數字人企業(yè)風(fēng)平智能介紹，在數字人處于2D卡通時(shí)代時(shí)，雖然也有部分企業(yè)，出于營(yíng)銷(xiāo)時(shí)增加新奇感的需要，訂購了一些數字人，但其中99%的數字人，在訂購之后半年就再無(wú)人問(wèn)津。

究其原因，是當時(shí)數字人的成本太高，而應用場(chǎng)景卻又太窄了。

試想一下，花費數十萬(wàn)制作出來(lái)的卡通數字人，除了在部分需要增加“新奇感”的應用場(chǎng)景外，還能用在什么地方呢？

你不能指望人們在上課、開(kāi)會(huì )或講座這些嚴肅的場(chǎng)景里，看著(zhù)一個(gè)卡通形象滔滔不絕吧？

后來(lái)，雖然隨著(zhù)技術(shù)的進(jìn)步，數字人的形象開(kāi)始逐漸朝著(zhù)寫(xiě)實(shí)、3D的方向發(fā)展，可居高不下的成本，仍然讓許多企業(yè)望而卻步。

一般來(lái)說(shuō)，數字人的制作主要包括了數據采集、處理和應用等方面，而根據數據處理的復雜度和效率，以及數據應用的規模和質(zhì)量的不同，一個(gè)3D化的寫(xiě)實(shí)數字人，成本可達到數十萬(wàn)到百萬(wàn)元不等。

這還是剔除了后期運營(yíng)成本的情況下。

以抖音美妝達人“柳夜熙”為例，其制作企業(yè)創(chuàng )壹科技CEO梁子康曾對媒體表示，“柳夜熙”僅制作投入就在百萬(wàn)元級別，而第一條“柳夜熙”的短視頻成本約幾十萬(wàn)元。超寫(xiě)實(shí)虛擬人視頻每秒的成本都在萬(wàn)元區間。

因為想要讓數字人“動(dòng)”起來(lái)，就需要讓AI驅動(dòng)數字人的語(yǔ)音表達、面部表情、動(dòng)作生成等等，這都是巨大的投入。

而花費了如此巨大的數字人，最后還是只能局限在娛樂(lè )、直播、內容IP等領(lǐng)域；

這是因為，當時(shí)的數字人，交互能力還不夠強大和智能，無(wú)法理解復雜語(yǔ)境、也無(wú)法處理多輪對話(huà)，導致用戶(hù)的溝通和服務(wù)效率很低。

即便有的數字人，可以通過(guò)真人的方式驅動(dòng)，可這類(lèi)數字人的交互能力，也要受限于真人操作者的水平和風(fēng)格，這使其很難滿(mǎn)足不同用戶(hù)和場(chǎng)景的多元化需求。

因此，只有在娛樂(lè )、直播等更加看重“門(mén)面”和“顏值”的場(chǎng)景中，數字人才能占據一席之地。

然而，所有這一切的限制，都隨著(zhù)當今AI革命的到來(lái)，而被紛紛打破了。

02 成本暴降、井噴來(lái)臨

2020年，隨著(zhù)元宇宙概念的火熱，市場(chǎng)對于提高數字人生產(chǎn)效率和提升商業(yè)化的訴求日益高漲。同時(shí)，5G、AI等新技術(shù)更新?lián)Q代，也讓數字人得到了煥發(fā)新生的機會(huì )。

其中幾項關(guān)鍵的技術(shù)，讓數字人極大地提升了與真人的接近度。

例如，人像驅動(dòng)引擎，可以通過(guò)4D掃描、智能綁定等AI技術(shù)，實(shí)現數字人的唇形驅動(dòng)、肢體驅動(dòng)、表情驅動(dòng)、手勢感知等，同時(shí)減少動(dòng)作捕捉、CG合成的制作流程，大幅降低了成本。

而智能對話(huà)引擎，通過(guò)自然語(yǔ)言處理技術(shù)，為數字人快速定制對話(huà)能力、持續提升對話(huà)效果。

這些技術(shù)，讓數字人在表現力、智慧度、交互能力上都得到了大幅提升。

也就是在這一階段，包括百度、騰訊在內的國內各大企業(yè)，開(kāi)始在數字人領(lǐng)域八仙過(guò)海，各顯神通。

例如，百度推出的曦靈數字人平臺，通過(guò)自然語(yǔ)言處理、語(yǔ)音識別、計算機視覺(jué)等技術(shù)的提升，讓數字人在視覺(jué)表現力上有了顯著(zhù)提升。

雖然形象仍然是3D人物，但從五官細節，神態(tài)動(dòng)作等方面，都明顯在朝著(zhù)更寫(xiě)實(shí)的方向進(jìn)行發(fā)展。

以前需要兩三個(gè)月時(shí)間做出來(lái)的3D數字人，現在可以壓縮到小時(shí)級。

同時(shí)，通過(guò)在線(xiàn)語(yǔ)音交互注意力模型，數字人也終于變得“音畫(huà)同步”了，逐字口型準確率達到了98.5%。

而得益于新一代數字更生動(dòng)的表現力，曦靈平臺推出的數字人，也從單一的娛樂(lè )領(lǐng)域，擴展到了更多元的行業(yè)。例如在2B端擔任數字理財專(zhuān)員、數字客服、虛擬培訓師等角色，或是新聞播報員等。

騰訊在數字人方面，也發(fā)布了智能小樣本數智人生產(chǎn)平臺。

騰訊方面稱(chēng)，該平臺可實(shí)現“自助式”數智人生產(chǎn)制作，只需經(jīng)過(guò)3分鐘真人口播視頻、100句語(yǔ)音素材的訓練，便可在輸入音頻、文本等多模態(tài)數據后，實(shí)時(shí)建模并生成高清人像，在24小時(shí)內制作出與真人近似的“數智人”，其使用成本也將被降至千元級別。

可以說(shuō)是BAT三巨頭中，最早實(shí)現真人級數字人的企業(yè)。

小樣本“數智人”從直觀(guān)上感受是2D視頻，但背后其實(shí)是3D人像技術(shù)在支撐。通過(guò)3D人臉結構的先驗信息引入，使數智人口型、表情更到位，讓小樣本“數智人”形象實(shí)現“皺紋級”還原。

除了百度、騰訊這些大廠(chǎng)外，一些默默耕耘于數字人垂直賽道的企業(yè)，也憑借日益精湛的技術(shù)，打造出了更逼真和生動(dòng)的數字人。

在數字人領(lǐng)域鉆研已久的風(fēng)平智能，就是一個(gè)這樣的代表。

其獨特的XGen智造系統，和豐富、可定制的知識庫，在低成本高質(zhì)量生產(chǎn)數字人的同時(shí)，還能使每一個(gè)數字人都擁有獨一無(wú)二的“智能大腦”。從而擴展了其多元化的場(chǎng)景應用能力。

同時(shí)，通過(guò)深度學(xué)習技術(shù)建模，風(fēng)平智能的數字人還能支持129種語(yǔ)種，實(shí)現了跨國互動(dòng)無(wú)障礙的交流。其制造的數字人，已應用在了新東方的課堂直播中。

在這一階段，數字人所呈現出的總體趨勢，是制作成本的大幅度下降，以及表現力的突飛猛進(jìn)。

而這些技術(shù)進(jìn)步，所帶來(lái)的直接的后果，就是數字人技術(shù)的不斷下沉和趨同。

03 當AI的靈魂注入數字人

從概念提出到場(chǎng)景落地，AIGC加持下的數字人，已經(jīng)從原先幾十萬(wàn)、上百萬(wàn)的制作成本，數個(gè)月的制作周期，降低到了現在數千元，十幾個(gè)小時(shí)的制作門(mén)檻。

數字人的應用場(chǎng)景，早已從單一的B端逐漸向C端擴散。而這樣的擴散，必將會(huì )重塑人類(lèi)信息的輸出端口。

縱觀(guān)數字時(shí)代的每一次變革，人類(lèi)信息的輸出端口，一直在不停變化。

在傳統的PC時(shí)代，這樣的端口是屏幕上的一個(gè)個(gè)網(wǎng)頁(yè)；

到了移動(dòng)互聯(lián)網(wǎng)時(shí)代，這樣的端口則變成了一個(gè)個(gè)APP；

自媒體興起后，這樣的端口又變成了一個(gè)個(gè)公眾號、短視頻；

而在A(yíng)IGC時(shí)代，經(jīng)過(guò)AI大模型強化后的數字人，則注定會(huì )擁有以往各類(lèi)端口所不具備的知識量和交互能力。

到了那一天，也許人類(lèi)真的會(huì )像比爾蓋茨所說(shuō)的那樣：“再也不會(huì )去使用搜索引擎，不會(huì )去生產(chǎn)力網(wǎng)站，也不會(huì )再去使用亞馬遜?！?/p>

在蓋茨的設想中，這個(gè)“AI助理”將有能力理解人類(lèi)的需求和習慣，同時(shí)會(huì )幫助人類(lèi)“讀他們沒(méi)有時(shí)間讀的書(shū)?！?/p>

如此一來(lái)，AI加持下的數字人，就成為了人類(lèi)更終極、更先進(jìn)的輸出端口。

此外，在每一具數字生成的皮囊下，人們仍能看到不一樣的靈魂。

這也是今天GPT-4等先進(jìn)的大模型，與數字人進(jìn)行結合的最大意義。

通過(guò)大模型豐富的知識，純熟的語(yǔ)義理解和交互能力，和相應行業(yè)、個(gè)人不同的需求，每一個(gè)數字人，都可以“因地制宜”、“因人制宜”地幻化出各種不同性格、思想和技能，進(jìn)而真正做到了“千人千面”的效果。

由此可見(jiàn)，在必將到來(lái)的AGI時(shí)代，真正決定數字人高下的，就是其獨一無(wú)二的靈魂。

關(guān)鍵詞：