環(huán)球熱頭條丨ChatGPT已能操控機器人,工程師連代碼都不用寫(xiě),網(wǎng)友:微軟在搞天網(wǎng)?
當我還在跟ChatGPT吹牛尬聊時(shí),有人已經(jīng)在拿它操控機器人了。
(資料圖)
不是別人,正是OpenAI的金主爸爸、不久前剛拿ChatGPT“重新發(fā)明搜索引擎”的微軟。
到目前為止,開(kāi)發(fā)者調教機器人不僅技術(shù)門(mén)檻高,還道阻且長(cháng):
工程師需要在工作流程回路中,不斷手寫(xiě)新代碼和規范來(lái)糾正機器人行為;另外,操控不同的機器人可能需要不同的編程語(yǔ)言和環(huán)境。
而在ChatGPT的幫助下,工程師甚至不用手寫(xiě)代碼——直接用人話(huà)描述想做什么,AI就能自動(dòng)翻譯成機器語(yǔ)言。
這意味著(zhù),一方面專(zhuān)業(yè)人士與機器人的交互效率起飛;另一方面,技術(shù)門(mén)檻也降低一大截,外行人甚至也能參與調試,創(chuàng )造出更多使用方法。
舉個(gè)簡(jiǎn)單的例子:讓無(wú)人機自動(dòng)檢查貨架。
首先,操作者只需用自然語(yǔ)言給ChatGPT提出要求;然后,AI就能自動(dòng)翻譯成代碼,并指揮無(wú)人機行動(dòng)。(還可以規定無(wú)人機的飛行路徑。)
難怪特斯拉前AI主管Andrej Karpathy會(huì )調侃:
最新的熱門(mén)編程語(yǔ)言是英語(yǔ)。
一個(gè)AI指揮多種機器人
實(shí)際上,ChatGPT會(huì )玩兒的花樣可多了。
比如,一位操作者跟AI說(shuō):“我渴了,請幫我找個(gè)喝的?!?/p>
此時(shí)AI并不會(huì )直愣愣地就去找水了,而是會(huì )很機靈地反問(wèn):
請問(wèn)你想喝哪種?這里有好幾種飲料,比如椰子水、可樂(lè )等等。
當然操作者也不是吃素的,他并未直接告訴AI選哪個(gè),而是說(shuō):“我剛從健身房回來(lái),請幫我找個(gè)健康點(diǎn)兒的飲料?!?/p>
然后更神奇的操作就開(kāi)始了:
AI先是猜測他想喝椰子水,然后自己噼里啪啦寫(xiě)出一段代碼(甚至還有注釋?zhuān)?/p>
寫(xiě)完就自己指揮無(wú)人機去找椰子水:
除了無(wú)人機,ChatGPT還能輕松操控別的小機器人,包括攝像頭、機械臂等等。
比如讓攝像頭在房間里找出能加熱午飯的東西。
看到這些,有網(wǎng)友腦洞大開(kāi),有人發(fā)問(wèn):
他們是不是正在建立無(wú)所不能的天網(wǎng)?
不過(guò)話(huà)說(shuō)回來(lái),其實(shí)離網(wǎng)友說(shuō)的這些還差得遠,畢竟現在還是需要人類(lèi)參與的。
怎么實(shí)現的?
從前文可以看出,這只靈活的AI不僅與人交流暢通無(wú)阻,而且和機器也能快速溝通。
這主要得益于微軟團隊專(zhuān)門(mén)開(kāi)發(fā)的一系列API和高級函數庫。
他們沒(méi)有讓ChatGPT背后的語(yǔ)言大模型(LLM),生成某固定種類(lèi)的代碼;因為機器人是個(gè)多元化領(lǐng)域,這樣可能會(huì )在不同場(chǎng)景下涉及大量微調。
而在新穎的操作框架下,不同機器人,都有自己對應的特定函數庫。
——一個(gè)AI,就能適應不同的對象、不同的任務(wù)。
一方面,這些函數庫,能夠連接到機器人控制系統中管理底層硬件,以及執行基本運動(dòng)的代碼和功能模塊。
另一方面,為了讓ChatGPT也能遵循函數庫的規則,預定義函數命名就很關(guān)鍵。清晰的函數名,能讓各API之間建立良好的功能連接,最終生成高質(zhì)量的回答。
其中一項要求,就是所有API名稱(chēng)必須描述整體功能行為。例如,detect_object(object_name) 函數可以在內部鏈接到OpenCV函數或計算機視覺(jué)模型。
設計好庫和API后,微軟給ChatGPT編寫(xiě)了一個(gè)文本提示(prompt),描述目標任務(wù),并明確說(shuō)明函數庫中哪些函數可用;另外,這還能規定ChatGPT生成代碼用哪種編程語(yǔ)言。
值得一提的是,AI生成內容效果,和人為提示的質(zhì)量呈正相關(guān)。為此,微軟還開(kāi)發(fā)了一個(gè)協(xié)作開(kāi)源平臺PromptCraft,任何人都能在此分享不同類(lèi)機器人的Prompt策略。
到此,幕后部署基本完成,然后用戶(hù)就能通過(guò)“說(shuō)人話(huà)”間接操控機器人了。
如果想要檢查AI生成的代碼是否有Bug,隨時(shí)都能在聊天框直接檢查,或通過(guò)模擬器測試,人類(lèi)可以用自然語(yǔ)言指導AI進(jìn)行修正。
另外,還能到等到用戶(hù)對解決方案滿(mǎn)意為止,再在將ChatGPT生成代碼部署到機器人上。
最后,如果是你,會(huì )想用ChatGPT操控機器人做些什么呢?
本文來(lái)源:量子位,原文標題:《ChatGPT已能操控機器人,工程師連代碼都不用寫(xiě),網(wǎng)友:微軟在搞天網(wǎng)?》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: