国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

最資訊丨爆火論文打造《西部世界》雛形:25個(gè)AI智能體,在虛擬小鎮自由成長(cháng)

我們能否創(chuàng )造一個(gè)世界?在那個(gè)世界里,機器人能夠像人類(lèi)一樣生活、工作、社交,去復刻人類(lèi)社會(huì )的方方面面。


(資料圖片)

這種想象,曾在影視作品《西部世界》的設定中被完美地還原出來(lái):眾多預裝了故事情節的機器人被投放到一個(gè)主題公園內,它們可以像人類(lèi)一樣行事,記得自己看到的東西、遇到的人、說(shuō)過(guò)的話(huà)。每天,機器人都會(huì )被重置,回到它們的核心故事情節中。

《西部世界》劇照,左邊人物為預裝了故事情節的機器人。

再把想象力擴張一下:放在今天,如果我們想把 ChatGPT 這樣的大語(yǔ)言模型變成西部世界的主人,又會(huì )怎么做?

在最近爆火的一篇論文中,研究者們成功地構建了一個(gè)「虛擬小鎮」,25 個(gè) AI 智能體在小鎮上生存,它們不僅能夠從事復雜的行為(比如舉辦情人節派對),而且這些行為比人類(lèi)角色的扮演更加真實(shí)。

論文鏈接:https://arxiv.org/pdf/2304.03442v1.pdfDemo 地址:https://reverie.herokuapp.com/arXiv_Demo/

從《模擬人生》這樣的沙盒游戲到認知模型、虛擬環(huán)境等應用,四十多年來(lái),研究者們一直設想去創(chuàng )建能夠實(shí)現可信人類(lèi)行為的智能體。在這些設想中,由計算驅動(dòng)的智能體的行為會(huì )與其過(guò)往經(jīng)驗一致,并對環(huán)境做出可信的反應。這種人類(lèi)行為的模擬可以用現實(shí)社會(huì )現象填充虛擬空間和社區,訓練「人們」去處理罕見(jiàn)但困難的人際關(guān)系、測試社會(huì )科學(xué)理論、制作理論和可用性測試的人類(lèi)處理器模型、提供泛在計算應用和社交機器人動(dòng)力,還能為在開(kāi)放世界(Open World)中駕馭復雜人類(lèi)關(guān)系的 NPC 角色奠定基礎。

但人類(lèi)行為的空間是巨大而復雜的。盡管在大型語(yǔ)言模型可以模擬單個(gè)時(shí)間點(diǎn)上的可信人類(lèi)行為,但要想確保長(cháng)期一致性,通用智能體需要一個(gè)架構來(lái)管理不斷增長(cháng)的記憶,因為新的互動(dòng)、沖突和事件隨著(zhù)時(shí)間推移而出現和消退,同時(shí)還要處理多個(gè)智能體之間展開(kāi)的級聯(lián)社會(huì )動(dòng)態(tài)。

如果一種方法能夠在很長(cháng)一段時(shí)間內檢索相關(guān)的事件和互動(dòng),對這些記憶進(jìn)行反思,并歸納和得出更高層次的推論,并應用這種推理來(lái)創(chuàng )建對當下和長(cháng)期智能體行為有意義的計劃和反應,那么距離夢(mèng)想實(shí)現就不遠了。

這篇新論文介紹了「Generative Agents」(生成式智能體),一種利用生成模型來(lái)模擬可信人類(lèi)行為的智能體,并證明它們能產(chǎn)生可信的個(gè)人和突發(fā)群體行為的模擬:

能夠對自己、其他智能體和環(huán)境進(jìn)行廣泛的推斷;能夠創(chuàng )建反映自身特點(diǎn)和經(jīng)驗的日常計劃,執行這些計劃,做出反應,并在適當的時(shí)候重新計劃;能夠在終端用戶(hù)改變環(huán)境或用自然語(yǔ)言命令它們時(shí)做出反應。

「Generative Agents」背后是一個(gè)新的智能體架構,能夠存儲、合成和應用相關(guān)的記憶,使用大型語(yǔ)言模型生成可信的行為。

舉個(gè)例子,「Generative Agents」如果看到它們的早餐正在燃燒,會(huì )關(guān)掉爐子;如果浴室有人,會(huì )在外面等待;如果遇到想交談的另一個(gè)智能體,會(huì )停下來(lái)聊天。一個(gè)充滿(mǎn)「Generative Agents」的社會(huì )是以新興的社會(huì )動(dòng)態(tài)為標志的,在這個(gè)社會(huì )中,新的關(guān)系被形成,信息被擴散,并在智能體之間產(chǎn)生協(xié)調。

具體而言,研究者在這篇論文中公布了幾點(diǎn)重要細節:?

Generative Agents,是對人類(lèi)行為的可信模擬,它以智能體不斷變化的經(jīng)驗和環(huán)境為條件進(jìn)行動(dòng)態(tài)調整;一個(gè)新穎的架構,使 Generative Agents 有可能記住、檢索、反思、與其他智能體互動(dòng),并通過(guò)動(dòng)態(tài)演變的環(huán)境進(jìn)行規劃。該架構利用了大型語(yǔ)言模型的強大 prompt 能力,并對這些能力進(jìn)行了補充,以支持智能體的長(cháng)期一致性、管理動(dòng)態(tài)演變的記憶能力,以及遞歸地產(chǎn)生更多的世代;兩項評估(對照評估和端到端評估),確定架構各組成部分的重要性的因果關(guān)系,以及確定因記憶檢索不當等原因而產(chǎn)生的故障;討論了交互系統中 Generative Agents 的機會(huì )和倫理及社會(huì )風(fēng)險。研究者認為應該對這些智能體進(jìn)行調整,減輕用戶(hù)形成寄生社會(huì )關(guān)系的風(fēng)險,對其進(jìn)行記錄以減輕由 deepfake 和定制說(shuō)服所帶來(lái)的風(fēng)險,并在設計過(guò)程中以補充而非取代人類(lèi)利益相關(guān)者的方式進(jìn)行應用。

文章一經(jīng)發(fā)布,就引起了全網(wǎng)的熱議。本就看好「AutoGPT」方向的 Karpathy 連連贊嘆,認為「Generative Agents」比之前玩概念的「Open World」高了不是一點(diǎn)半點(diǎn):

更有研究者斷言,這項研究的發(fā)布,意味著(zhù)「大型語(yǔ)言模型實(shí)現了新的里程碑式進(jìn)展」:

「Generative Agents」行為及其交互

為了使「Generative Agents」更加具體化,該研究將它們實(shí)例化為沙盒世界中的角色。

25 個(gè)智能體居住在名為 Smallville 的小鎮,每個(gè)智能體由一個(gè)簡(jiǎn)單的化身表示。所有的角色都可以:

與別人和環(huán)境交流;記住并回憶它們所做的和觀(guān)察到的事情;反思這些觀(guān)察結果;制定每天的計劃。

研究者用自然語(yǔ)言描述了每個(gè)智能體的身份,包括它們的職業(yè)以及與其他智能體的關(guān)系,并將這些信息作為種子記憶。舉例來(lái)說(shuō),智能體 John Lin 有如下描述(本文截取了一段):

「John Lin 是一名藥店店主,他樂(lè )于助人。他一直在尋找使客戶(hù)更容易獲得藥物的方法。John Lin 的妻子是大學(xué)教授 Mei Lin ,它們和學(xué)習音樂(lè )理論的兒子 Eddy Lin 住在一起;John Lin 非常愛(ài)它的家人;John Lin 認識隔壁的老夫婦 Sam Moore 和 Jennifer Moore 好幾年了……」

身份設定好之后,接著(zhù)就是智能體如何與世界交互了。

在沙盒的每個(gè) step 內,智能體都輸出一個(gè)自然語(yǔ)言語(yǔ)句,以描述它們當前的動(dòng)作,例如語(yǔ)句「Isabella Rodriguez 正在寫(xiě)日記」、「Isabella Rodriguez 正在查看郵件」等。然后這些自然語(yǔ)言被轉化為影響沙盒世界的具體動(dòng)作。動(dòng)作以一組表情符號的形式顯示在沙盒界面上,這些表情符號提供了動(dòng)作的抽象表征。

為了實(shí)現這一點(diǎn),該研究采用了一種語(yǔ)言模型,可以將動(dòng)作轉換為一組表情符號,這些表情符號出現在每個(gè)智能體化身上方的對話(huà)框中。除此以外,通過(guò)單擊智能體頭像可以訪(fǎng)問(wèn)完整的自然語(yǔ)言描述。

智能體之間用自然語(yǔ)言進(jìn)行交流,假如智能體意識到在其周?chē)衅渌悄荏w,它們會(huì )思考要不要走過(guò)去進(jìn)行聊天。例如 Isabella Rodriguez 和 Tom Moreno 就即將到來(lái)的選舉進(jìn)行了對話(huà):

除此以外,用戶(hù)還可以指定智能體扮演什么角色,例如,指定其中一個(gè)智能體為記者,你就可以向該智能體咨詢(xún)新聞方面的內容。

智能體與環(huán)境的交互

Smallville 小鎮有許多公共場(chǎng)景,包括咖啡館、酒吧、公園、學(xué)校、宿舍、房屋和商店。此外,每個(gè)公共場(chǎng)景還包括自身具有的功能以及對象,例如房子中有廚房、廚房中有爐子 (圖 2)。在智能體的生活空間中還有床、桌子、衣柜、架子,以及浴室和廚房。

智能體可以在 Smallville 內隨處走動(dòng),進(jìn)入或離開(kāi)一座建筑,導航前行,甚至去接近另一個(gè)智能體。智能體的移動(dòng)由 Generative Agents 的架構和沙盒游戲引擎控制:當模型指示智能體移動(dòng)到某個(gè)位置時(shí),該研究會(huì )計算其在 Smallville 環(huán)境中到達目的地的步行路徑,然后智能體開(kāi)始移動(dòng)。

此外,用戶(hù)和智能體還可以影響該環(huán)境下其他物體的狀態(tài),例如,當智能體睡覺(jué)時(shí)床是被占用的,當智能體用完早餐冰箱可能是空的。最終用戶(hù)還可以通過(guò)自然語(yǔ)言重寫(xiě)智能體環(huán)境。例如用戶(hù)在 Isabella 進(jìn)入浴室時(shí)將淋浴器狀態(tài)設置為漏水,之后 Isabella 會(huì )從客廳找到工具并嘗試修復漏水問(wèn)題。

智能體一天的生活

從一段描述開(kāi)始,智能體開(kāi)始計劃一天的生活。隨著(zhù)時(shí)間在沙盒世界中的流逝,智能體的行為隨著(zhù)彼此之間的交互以及與世界的互動(dòng)、自身建立的記憶等逐漸改變。下圖為藥店店主 John Lin 一天的行為。

在這個(gè)家庭中,John Lin 早上七點(diǎn)第一個(gè)起床,然后刷牙、洗澡、穿衣服、吃早餐,接著(zhù)在客廳的餐桌旁瀏覽新聞。早上 8 點(diǎn),John Lin 的兒子 Eddy 也跟著(zhù)起床準備上課。他臨出門(mén)時(shí)和 John 進(jìn)行對話(huà),內容為:

Eddy 出發(fā)后不久,他的媽媽 Mei 也醒了過(guò)來(lái),Mei 問(wèn)起兒子,John 回憶起它們剛剛的對話(huà),然后有了下面對話(huà)

社交能力

除此以外,「Generative Agents」還表現出社會(huì )行為的涌現。通過(guò)相互交互,「Generative Agents」在 Smallville 環(huán)境下交換信息,形成新的關(guān)系。這些社會(huì )行為是自然產(chǎn)生的,而不是預先設定好的。例如當智能體注意到對方的存在時(shí),可能會(huì )進(jìn)行一場(chǎng)對話(huà),對話(huà)信息可以在智能體之間傳播。

讓我們看幾個(gè)例子:

信息傳播。當智能體注意到對方,它們可能會(huì )進(jìn)行對話(huà)。當這樣做時(shí),信息可以從智能體傳播到另一智能體。例如,在 Sam 和 Tom 在雜貨店的對話(huà)中,Sam 告訴了 Tom 他在當地選舉中的候選資格:

當天晚些時(shí)候,在 Sam 離開(kāi)后,從另一個(gè)渠道聽(tīng)到消息的 Tom 和 John 討論了 Sam 贏(yíng)得選舉的機會(huì ):

漸漸地,Sam 的候選資格成為了鎮上的話(huà)題,有人支持他,也有人猶豫不決。

關(guān)系記憶。隨著(zhù)時(shí)間的推移,小鎮上的智能體形成了新的關(guān)系,并記住了它們與其他智能體的互動(dòng)。例如,Sam 一開(kāi)始并不認識拉 Latoya Williams。在約翰遜公園散步時(shí),Sam 碰到了 Latoya,互相做了自我介紹,Latoya 提到自己正在進(jìn)行一個(gè)攝影項目:「我在這里為正在進(jìn)行的一個(gè)項目拍攝照片?!乖诤髞?lái)的互動(dòng)中,Sam 與 Latoya 的互動(dòng)表明了對這件事的記憶,Sam 問(wèn)道:「Latoya,你的項目進(jìn)展如何?」Latoya 回答:「進(jìn)展得很好!」

協(xié)調能力。Isabella Rodriguez 經(jīng)營(yíng)一家 Hobbs 咖啡館,打算在 2 月 14 日下午 5 點(diǎn)到 7 點(diǎn)舉辦一場(chǎng)情人節派對。從這個(gè)種子開(kāi)始,當 Isabella Rodriguez 在 Hobbs 咖啡館或其他地方遇到朋友和顧客時(shí),就會(huì )發(fā)出邀請。13 日下午,Isabella 開(kāi)始裝飾咖啡館。Isabella 的??秃兔苡?Maria 來(lái)到咖啡館。Isabella 請求 Maria 幫忙布置派對,Maria 同意了。Maria 的角色描述是它喜歡 Klaus。那天晚上,Maria 邀請它的暗戀對象 Klaus 一起參加派對,Klaus 欣然接受。

情人節那天,包括 Klaus 和 Maria 在內的五名智能體在下午 5 點(diǎn)出現在 Hobbs 咖啡館,它們享受著(zhù)慶?;顒?dòng)(圖 4)。在這個(gè)場(chǎng)景中,終端用戶(hù)只設置了 Isabella 舉辦派對的初始意圖和 Maria 對 Klaus 的迷戀:傳播信息、裝飾、約對方、到達派對以及在派對上互動(dòng)的社交行為 ,由智能體架構發(fā)起。

架構

Generative Agents 需要一個(gè)框架來(lái)指導其在開(kāi)放世界中的行為,旨在讓 Generative Agents 能夠與其他智能體進(jìn)行交互并對環(huán)境變化做出反應。

Generative Agents 將其當前環(huán)境和過(guò)去的經(jīng)驗作為輸入,生成行為作為輸出。Generative Agents 的架構將大型語(yǔ)言模型和合成與檢索相關(guān)信息的機制結合到一起,以調節語(yǔ)言模型的輸出。

如果沒(méi)有合成與檢索機制,大型語(yǔ)言模型可以輸出行為,但 Generative Agents 可能不會(huì )根據智能體過(guò)去的經(jīng)驗做出反應,以至于無(wú)法做出重要的推理,也可能無(wú)法保持長(cháng)期的連貫性。即使使用當前性能最好的模型(例如 GPT-4),長(cháng)期規劃和連貫性方面的挑戰仍然存在 。

由于 Generative Agents 會(huì )產(chǎn)生大量必須保留的事件和記憶流(memory stream),因此其架構的核心挑戰是確保在需要時(shí)檢索和合成智能體記憶中最相關(guān)的部分。

Generative Agents 的架構中心是記憶流 —— 一個(gè)全面記錄智能體經(jīng)驗的數據庫。智能體會(huì )從記憶流中檢索相關(guān)記錄,以規劃智能體的動(dòng)作行為并對環(huán)境做出適當反應,并且每次行為都會(huì )被記錄以遞歸合成更高級別的行為指導。Generative Agents 架構中所有的內容都被記錄下來(lái)并以自然語(yǔ)言描述的形式來(lái)進(jìn)行推理,從而使智能體能夠利用大型語(yǔ)言模型的推理功能。

當前,該研究實(shí)現了使用 ChatGPT 的 gpt3.5-turbo 版本。研究團隊預計 Generative Agents 的架構基礎 —— 記憶、規劃和反思 —— 可能會(huì )保持不變。較新的語(yǔ)言模型(例如 GPT-4)擁有更好的表達能力和性能,這會(huì )進(jìn)一步擴展 Generative Agents。

記憶與檢索

Generative Agents 的架構實(shí)現了一個(gè)檢索功能,該功能將智能體的當前情況作為輸入并返回記憶流的一個(gè)子集以傳遞給語(yǔ)言模型。檢索功能有多種可能的實(shí)現方式,具體取決于智能體在決定如何行動(dòng)時(shí)考慮的重要因素。

反思

該研究還引入了第二種類(lèi)型的記憶,稱(chēng)為「反思」。反思是由智能體生成的更高層次、更抽象的思想。反思是周期性產(chǎn)生的,在該研究中,只有當智能體對最近事件的重要性分數總和超過(guò)某個(gè)閾值,智能體才會(huì )開(kāi)始反思。

實(shí)際上,該研究提出的 Generative Agents 每天大約反思兩到三次。反思的第一步是讓智能體確定要反思的內容,方法是根據智能體最近的經(jīng)歷確定可以提出的問(wèn)題。

規劃與反應

規劃被用于描述智能體未來(lái)行動(dòng)的順序,并幫助智能體隨著(zhù)時(shí)間的推移保持行為一致。規劃應該包含位置、開(kāi)始時(shí)間和持續時(shí)間。

為了創(chuàng )建合理的規劃,Generative Agents 會(huì )自上而下遞歸地生成更多細節。第一步是制定一個(gè)計劃,粗略地概述當天的「日程」。為了創(chuàng )建初始規劃,該研究向語(yǔ)言模型 prompt 智能體的總體描述(例如,姓名、特征和它們最近經(jīng)歷的摘要等等)。

在執行規劃的過(guò)程中,Generative Agents 會(huì )感知周?chē)h(huán)境,感知到的觀(guān)察結果會(huì )存儲在它們的記憶流中。該研究用這些觀(guān)察 prompt 語(yǔ)言模型來(lái)決定智能體是應該繼續它們的現有規劃,還是做出其他反應。

實(shí)驗及評估

該研究對 Generative Agents 進(jìn)行了兩項評估:一項是控制評估,以測試智能體是否能獨立地產(chǎn)生可信的個(gè)體行為;另一項是端到端評估,其中多個(gè) Generative Agents 在兩天的游戲時(shí)間內開(kāi)放式交互,這是為了了解智能體的穩定性和涌現(emergent)社會(huì )行為。

比如,伊莎貝拉計劃舉辦一場(chǎng)情人節派對。她傳播了這個(gè)信息,在模擬結束時(shí),12 個(gè)角色已經(jīng)知道了這件事。其中 7 個(gè)人「猶豫不決」——3 個(gè)人已有其他計劃,4 個(gè)人沒(méi)有表露想法,這和人類(lèi)的相處一樣。

在技術(shù)評估層面,該研究通過(guò)用自然語(yǔ)言「采訪(fǎng)」智能體,來(lái)評估智能體保持「性格」、記憶、規劃、反應和準確反思的能力,并進(jìn)行了消融實(shí)驗。實(shí)驗結果表明,這些組成部分中的每一個(gè)對于智能體在任務(wù)中的出色表現都至關(guān)重要。

在實(shí)驗評估中,智能體出現的最常見(jiàn)錯誤包括:

其未能檢索相關(guān)記憶;對智能體記憶進(jìn)行捏造修飾;從語(yǔ)言模型中「繼承」過(guò)于正式的言語(yǔ)或行為。

本文來(lái)源:ALLAI 行業(yè)瞭望,原文標題:《爆火論文打造《西部世界》雛形:25個(gè)AI智能體,在虛擬小鎮自由成長(cháng)》

風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

關(guān)鍵詞: