国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

您的位置：首頁(yè) > 產(chǎn)經(jīng) >

英偉達帶火的“具身智能”是什么？AI價(jià)值遠比機器人更大 | 見(jiàn)智研究|全球視點(diǎn)

來(lái)源：華爾街見(jiàn)聞 ? 2023-05-18 18:05:10

近日，“具身智能”概念被英偉達創(chuàng )始人CEO黃仁勛帶火。

華爾街見(jiàn)聞·見(jiàn)智研究認為：具身智能帶來(lái)的AI價(jià)值遠比人形機器人更大。具身智能最大的特質(zhì)就是能夠以主人公的視角去自主感知物理世界，用擬人化的思維路徑去學(xué)習，從而做出人類(lèi)期待的行為反饋，而不是被動(dòng)的等待數據投喂。在人類(lèi)的五大感官中視覺(jué)獲取的信息占比超過(guò)80%，并且讓機器理解人類(lèi)語(yǔ)言也是非常重要的，所以機器視覺(jué)和多模態(tài)大模型正是開(kāi)啟機器自我感知學(xué)習的兩把鑰匙。

具身智能是什么？

具身智能簡(jiǎn)單來(lái)說(shuō)就是AI的大腦加上軀體。它能夠跟我們生活的環(huán)境進(jìn)行交互，從而展現出智能行為。

【資料圖】

而具身智能為什么被看作AI的iPhone時(shí)刻？

原來(lái)的人工智能可以看作第三人稱(chēng)的智能，也就是投喂數據給機器，讓它學(xué)習什么它就學(xué)習什么。而現在具身智創(chuàng )造了一種機器自主學(xué)習的新方式，能夠以第一人稱(chēng)的視角來(lái)感知和學(xué)習物理世界，并像人類(lèi)一樣理解和感知事物的能力，才能在此基礎上進(jìn)行相同思維的發(fā)展，最后表現出人類(lèi)期待的行為方式。

Windows為何能統治操作系統，iPhone為何創(chuàng )造智能手機時(shí)代，最重要的原因就是他們創(chuàng )造了最簡(jiǎn)單、最直觀(guān)的人機交互窗口。

發(fā)展人工智能的意義在于能夠讓機器造福人類(lèi)，協(xié)助處理事務(wù)，提高生產(chǎn)力；更進(jìn)一步則是讓AI進(jìn)行創(chuàng )造，推動(dòng)科學(xué)研究的進(jìn)展。而這一切的前提是：要讓機器理解人類(lèi)社會(huì )，要做到這一點(diǎn)，需要的就是具身智能。

見(jiàn)智研究認為：讓AI擬人化的進(jìn)行感知和理解世界方式，視覺(jué)和聽(tīng)覺(jué)是非常重要的?？匆?jiàn)并理解物理世界中存在的事物，并且能夠聽(tīng)懂人類(lèi)的語(yǔ)言這背后需要的是機器視覺(jué)技術(shù)和多模態(tài)大模型。在具身智能領(lǐng)域的快速發(fā)展下，這兩大領(lǐng)域的技術(shù)創(chuàng )新和需求也會(huì )與日俱增。

具身智能比人形機器人更有價(jià)值

具身智能相當于A(yíng)I的大腦，而這個(gè)大腦的載體可以是任何形式?？梢允且粋€(gè)機械臂，一只機器狗，更或者是一輛小汽車(chē)。

而反觀(guān)人形機器人，當下為何被看做是一個(gè)不太聰明的鋼鐵巨人，核心還是因為缺少AI大腦+不太靈活的軀體。

就像馬斯克所表示的，雖然未來(lái)有一天人人可能會(huì )擁有一個(gè)人形機器人，但是目前展現的Optimus人形機器人產(chǎn)品也就只能執行重復性的簡(jiǎn)單勞動(dòng)。

見(jiàn)智研究認為：我們真正需要的人形機器人目前還缺少具身智能特質(zhì)。馬斯克也表示：未來(lái)會(huì )將特斯拉的視覺(jué)技術(shù)用于人形機器人的研發(fā)中。而對于具身智能和人形機器人所能夠創(chuàng )造的價(jià)值，也非常明了了。具身智能的應用場(chǎng)景沒(méi)有局限性，所以市場(chǎng)空間更廣闊。

關(guān)注具身智能的硬實(shí)力

具身智能的硬實(shí)力包括：機器視覺(jué)和多模態(tài)大模型。

機器視覺(jué)是AI的感知工具，亦為數據生產(chǎn)的手段。在人類(lèi)的五大感官中視覺(jué)獲取的信息占比超過(guò) 80%。

機器視覺(jué)的端口是攝像頭，作為看懂世界的“眼睛”；機器視覺(jué)的大腦是算法，承擔分析功能。

見(jiàn)智研究認為：相比于單純迭代硬件的參數指標，算法和架構的升級對于A(yíng)I來(lái)說(shuō)更重要。因為攝像頭的發(fā)展目前已經(jīng)可以實(shí)現對物體的數據采集，無(wú)論是清晰度還是色彩度都已經(jīng)卷到了夠用的程度。

值得關(guān)注的是，多模態(tài)大模型在機器領(lǐng)域的應用。無(wú)論是視覺(jué)圖像信號還是人類(lèi)語(yǔ)言的聲音信號，最后都要轉化為機器能夠理解的語(yǔ)言，從而實(shí)現人機交互的目的。

從現階段應用來(lái)看，目前最好的是谷歌的PaLM-E大模型（參數5620億），可以將視覺(jué)和語(yǔ)言同時(shí)集成到機器人的控制中。這種大模型最大程度的解決了需要人工對數據進(jìn)行預處理和注視的繁瑣流程，極大提高了機器理解的效率。通過(guò)將PaLM-E大模型集成到控制中，能夠直接通過(guò)攝像頭的數據實(shí)現對機器執行命令，并且具備一定程度的抗干擾能力。

小結

AI的軀體其實(shí)并非是最重要的，核心應該是發(fā)展AI大腦，打通人機交互方式，讓AI能夠主動(dòng)感知物理世界，擬人化的思維路徑才能做到人類(lèi)期待的行為反饋。機器視覺(jué)和多模態(tài)大模型正是開(kāi)啟這個(gè)世界的兩把鑰匙。

風(fēng)險提示及免責條款市場(chǎng)有風(fēng)險，投資需謹慎。本文不構成個(gè)人投資建議，也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資，責任自負。

關(guān)鍵詞：