国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

您的位置：首頁(yè) > 產(chǎn)經(jīng) >

OpenAI發(fā)布炸裂研究：讓AI解釋AI黑箱，人類(lèi)無(wú)法理解，語(yǔ)言無(wú)法描述

來(lái)源：華爾街見(jiàn)聞 ? 2023-05-10 11:58:38

就算在新產(chǎn)品滿(mǎn)天飛，商業(yè)文明正在被 AI 重建的當下，我們仍然不知道，這些令人驚嘆的技術(shù)是如何運作的。

AI，語(yǔ)言模型，它是個(gè)黑箱（black box），人類(lèi)無(wú)法理解，我們甚至不知道怎樣研究才能夠理解。

但如果，研究這個(gè)黑箱的不是人類(lèi)，而是 AI 自己呢？

(資料圖)

這是一個(gè)令人好奇但又非常危險的想法。因為你甚至不知道，這一研究方法產(chǎn)生的結果，是否會(huì )徹底顛覆多年來(lái)人類(lèi)對人腦和 AI 的理解。

但是有人這樣做了。幾小時(shí)前，OpenAI 發(fā)布了最新的研究成果，他們用 GPT-4 解釋 GPT-2 的行為，獲得了初步的成果。

毫不夸張地說(shuō)，人們震驚極了：「求求你們讓它離覺(jué)醒遠點(diǎn)吧！」

「AI 理解 AI，然后很快，AI 訓練 AI，然后再過(guò)幾年，AI 創(chuàng )造新的 AI?！?/p>

但客觀(guān)來(lái)說(shuō)，學(xué)術(shù)界為之感到興奮：「瘋了，OpenAI 剛剛搞定了可解釋性問(wèn)題?！?/p>

人與機器之間是GPT-4

OpenAI 剛剛在官網(wǎng)發(fā)布博客文章《語(yǔ)言模型可以解釋語(yǔ)言模型中的神經(jīng)元》（Language models can explain neurons in language models）。

簡(jiǎn)單來(lái)說(shuō)，他們開(kāi)發(fā)了一個(gè)工具，調用 GPT-4 來(lái)計算出其他架構更簡(jiǎn)單的語(yǔ)言模型上神經(jīng)元的行為，這次針對的是 GPT-2，發(fā)布于 4 年前的開(kāi)源大模型。

大模型（LLM）和人腦一樣，由「神經(jīng)元」（neurons）組成，這些神經(jīng)元會(huì )觀(guān)察文本中的特定規律，進(jìn)而影響到模型本身生產(chǎn)的文本。

舉例來(lái)說(shuō)，如果有一個(gè)針對「漫威超級英雄」的神經(jīng)元，當用戶(hù)向模型提問(wèn)「哪個(gè)超級英雄的能力最強」時(shí)，這個(gè)神經(jīng)元就會(huì )提高模型在回答中說(shuō)出漫威英雄的概率。

OpenAI 開(kāi)發(fā)的工具利用這種規則制定了一套評估流程。

開(kāi)始之前，先讓 GPT-2 運行文本序列，等待某個(gè)特定神經(jīng)元被頻繁「激活」的情況。

然后有三個(gè)評估步驟：

第一步，讓 GPT-4 針對這段文本，生成解釋。比如在下面的案例中，神經(jīng)元主要針對漫威內容。GPT-4 接收到文本和激活情況后，判斷這與電影、角色和娛樂(lè )有關(guān)。

第二步，用 GPT-4?模擬這個(gè) GPT-2 的神經(jīng)元接下來(lái)會(huì )做什么。下圖就是 GPT-4 生成的模擬內容。

最后一步，對比評估打分。對比 4 代模擬神經(jīng)元和 2 代真實(shí)神經(jīng)元的結果，看 GPT-4 猜的有多準。

通過(guò)這樣的方法，OpenAI 對每個(gè)神經(jīng)元的行為作出了初步的自然語(yǔ)言解釋?zhuān)@種解釋和實(shí)際行為的匹配程度進(jìn)行了評分。

最終他們對 GPT-2 中 307200 個(gè)神經(jīng)元全部進(jìn)行了解釋?zhuān)@些解釋匯編成數據集，與工具代碼一起在 GitHub 上發(fā)布。

超越語(yǔ)言的機器?人類(lèi)無(wú)法理解的機器

據 OpenAI 在博客文章中表示，目前 GPT-4 生成的解釋還不完美，尤其要解釋比 GPT-2 更大的模型時(shí)，表現效果很差，「可能是因為后面的 layer 更難解釋」。

對于 GPT-2 解釋的評分大多也非常低，僅有 1000 個(gè)左右的解釋獲得了較高的評分（0.8 以上）。

OpenAI 可拓展對齊團隊的 Jeff Wu 表示，「大多數解釋的得分很低，或者無(wú)法解釋實(shí)際神經(jīng)元那么多的行為。比如，許多神經(jīng)元以一種難以判斷的方式保持活躍，它們在五六件事上保持激活，但卻沒(méi)有可以辨別的模式。有時(shí)候存在明顯的模式，但 GPT-4 有無(wú)法找到它?！?/p>

雖然現階段成績(jì)不好，但是 OpenAI 卻比較有信心，他們認為可以使用機器學(xué)習的方式提高 GPT-4 產(chǎn)出解釋的能力。

比如通過(guò)反復產(chǎn)出解釋?zhuān)⒏鶕せ钋闆r修改解釋?zhuān)换蛘呤褂酶蟮哪Ｐ妥鞒鼋忉專(zhuān)灰约罢{整解釋模型的結構等等。

OpenAI 還提到，這一方法目前還有很多局限性。

使用簡(jiǎn)短的自然語(yǔ)言進(jìn)行解釋?zhuān)苍S并不匹配神經(jīng)元可能非常復雜的行為，不能簡(jiǎn)潔地進(jìn)行描述。神經(jīng)元可能會(huì )具備多個(gè)不同概念，也可能，會(huì )具備一個(gè)人類(lèi)沒(méi)有語(yǔ)言描述甚至無(wú)法理解的概念。

最終 OpenAI 希望能夠自動(dòng)化找到并解釋能夠實(shí)現復雜行為的整個(gè)神經(jīng)回路，而目前的方法只解釋了神經(jīng)元的行為，并沒(méi)有涉及下游影響。

解釋了神經(jīng)元的行為，但沒(méi)有解釋產(chǎn)生這種行為的機制。這意味著(zhù)即使是拿了高分的解釋?zhuān)仓荒苊枋鱿嚓P(guān)性。

整個(gè)過(guò)程是計算密集型的。

在論文中，OpenAI 表示：「語(yǔ)言模型可能代表了人類(lèi)無(wú)法用語(yǔ)言表達的陌生概念。這可能是因為語(yǔ)言模型關(guān)心不同的事情，比如統計結構對下一個(gè)token預測任務(wù)有用，或者因為模型已經(jīng)發(fā)現了人類(lèi)尚未發(fā)現的自然的抽象，例如在不同領(lǐng)域的類(lèi)似概念家族?！?/p>

它把 LLM 的這種屬性，稱(chēng)為?Alien Feature，在生物領(lǐng)域翻譯為「異類(lèi)特征」。

把對齊問(wèn)題也交給 AI

「我們正試圖開(kāi)發(fā)預測『AI 系統會(huì )出現什么問(wèn)題』的方法，」OpenAI 可解釋性團隊負責人 William Saunders 對媒體說(shuō)，「我們希望能夠真正做到，讓這些模型的行為和生產(chǎn)的回答是可以被信任的?！?/p>

Sam Altman 也轉發(fā)博客文章稱(chēng)：GPT-4 對 GPT-2 做了一些可解釋性工作。

可解釋性（interpretability）是機器學(xué)習的研究子領(lǐng)域，指的是對模型的行為有清晰的理解和對模型結果的理解能力。

簡(jiǎn)單來(lái)說(shuō)，目的就是解釋機器學(xué)習模型「如何做到」（how）。

2019 年開(kāi)始，可解釋性成為機器學(xué)習的重要領(lǐng)域，相關(guān)研究有助于開(kāi)發(fā)人員對模型進(jìn)行優(yōu)化和調整。針對當下 AI 模型大規模應用時(shí)，亟需解決的可信度（trust）、安全性（safety）和決策參考（decision making）等問(wèn)題。

如果我們不知道 AI 是如何作出決策的，始終把它當做一個(gè)黑箱，那么就算 AI 在各種場(chǎng)景下表現得再完美，也無(wú)法解決部分人類(lèi)的信任問(wèn)題。

OpenAI 這次使用 GPT-4 來(lái)解決可解釋性的問(wèn)題，就是希望能夠使用自動(dòng)化的方式，讓機器完成 AI 研究。

「這是我們對齊研究的第三支柱的一部分：我們希望自動(dòng)化對齊研究。令人期待的是，這一方向能讓它（對齊）與 AI 發(fā)展的步伐相匹配?！?/p>

在 2022 年夏天，OpenAI 曾發(fā)布文章《我們做對齊研究的方法》（Our approach to alignment research）。

文中提到，宏觀(guān)來(lái)看，OpenAI 的對齊研究將由三大支柱支撐：

1、利用人工反饋訓練 AI

2、訓練 AI 系統協(xié)助人類(lèi)評估

3、訓練 AI 系統進(jìn)行對齊研究

「語(yǔ)言模型非常適合自動(dòng)化對齊研究，因為它們通過(guò)閱讀互聯(lián)網(wǎng)『預裝』了大量有關(guān)人類(lèi)價(jià)值觀(guān)的知識和信息。開(kāi)箱即用，它們不是獨立代理，因此不會(huì )在世界上追求自己的目標?！?/strong>

太快了?連認知都范式革命了

雖然 OpenAI 本意很好，但是這樣的研究成果著(zhù)實(shí)嚇壞了網(wǎng)友。

OpenAI 的推文下梗圖橫飛，有不少人在認真地建議 OpenAI 搞慢點(diǎn)。

「用我們不理解的東西，解釋另一個(gè)我們不理解的東西，這合理嗎？」

「護欄都被你撤了」

「這太迷人了，但也讓我感到極度不適?！?/p>

「自然創(chuàng )造了人類(lèi)來(lái)理解自然。我們創(chuàng )造了 GPT-4 來(lái)理解自己?！?/p>

「我們要怎么判斷解釋者是好的？這就像... 誰(shuí)監督著(zhù)監督者？」（who watches the watchers)

還有人看到了更深的一層：

「大模型很快就能比人類(lèi)更好地解釋他們自己的思維過(guò)程，我想知道我們未來(lái)要創(chuàng )造多少新的詞匯，來(lái)描述那些 AI 發(fā)現的概念（概念本身也不準確）？我們還沒(méi)有一個(gè)合適的詞描述它們?；蛘?，我們是否會(huì )覺(jué)得這些概念有意義？它們又能教會(huì )我們如何認識自己呢？」

另一網(wǎng)友回應道：「人類(lèi)本身對自己行為的解釋?zhuān)蠖嗍侵e言、捏造、幻覺(jué)、錯誤的記憶、事后推理，就像 AI 一樣?！?/p>

本文來(lái)源：?Founder Park，原文標題：《OpenAI發(fā)布炸裂研究：讓AI解釋AI黑箱，人類(lèi)無(wú)法理解，語(yǔ)言無(wú)法描述》

風(fēng)險提示及免責條款市場(chǎng)有風(fēng)險，投資需謹慎。本文不構成個(gè)人投資建議，也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資，責任自負。
關(guān)鍵詞：

相關(guān)推薦

OpenAI發(fā)布炸裂研究：讓AI解釋AI黑箱，人類(lèi)無(wú)法理解

環(huán)球精選！關(guān)鍵窗口期！拜登七天內搞不定債務(wù)上限，

當前關(guān)注：起個(gè)大早趕個(gè)晚集，IBM終于加入AI大戰，W

今年一季度，美國三分之一城市的房?jì)r(jià)都在跌-世界速

“摘B”后，諾誠健華離盈利還有多遠？全球觀(guān)點(diǎn)

前瞻指引“暴雷”，Airbnb股價(jià)重挫12%，全球旅游業(yè)

環(huán)球信息:“中特估”五大核心指標

對東盟出口大幅回落，透露什么信號？

財報2023｜戶(hù)外轉冷，增速放緩的牧高笛嘗試賺更多-

中德外長(cháng)舉行會(huì )談

簡(jiǎn)訊：Deepmind聯(lián)合創(chuàng )始人：未來(lái)5-10年，AI將使大量

賣(mài)爆了！黃金首飾每克直逼600元！有人靠100克金條，

深圳2022年人口“史上首次負增長(cháng)”的原因

油價(jià)走軟拖累業(yè)績(jì)，沙特阿美一季度凈利大減近20%，

微軟365 Copilot重磅更新：新增語(yǔ)義索引，自動(dòng)生成

科創(chuàng )板IPO 5月首審現被否項目：未盈利AI人機對話(huà)企

熱點(diǎn)圖集

海露集團與臺山市人民政府簽署戰略合作框架協(xié)議

耒陽(yáng)：旅客突發(fā)疾病列車(chē)臨時(shí)停車(chē)救人|環(huán)球信息

當前關(guān)注：起個(gè)大早趕個(gè)晚集，IBM終于加入AI大戰，W

2023年5月10日亞盤(pán)交易建議：黃金、白銀、歐元、英

天天視點(diǎn)！陜西麟游：構建“親清”警企警民關(guān)系助

瓊中女足3:0大勝天津圣德女足徐彩平梅開(kāi)二度

天天熱資訊！國內商品期市午盤(pán)多數收跌工業(yè)硅跌超3%

環(huán)球精選！關(guān)鍵窗口期！拜登七天內搞不定債務(wù)上限，

熱門(mén)看點(diǎn)：西藏林芝市四部門(mén)發(fā)布風(fēng)險預警

5月10日至14日白天海南全島仍有較強降雨過(guò)程

康方生物(09926)合作伙伴SUMMIT完成依沃西(PD -1/V

智能電網(wǎng)板塊多只概念股漲超10%

“三重”拉尼娜結束！厄爾尼諾今夏將“卷土重來(lái)”？

環(huán)球視點(diǎn)！60秒看“蘇大強”的科創(chuàng )硬核實(shí)力

當前要聞：汽車(chē)國六b排放標準7月起實(shí)施中汽協(xié)：行

實(shí)時(shí)焦點(diǎn)：辰溪縣船溪鄉：讓古村落里的歷史遺存“活

每日推薦

美國計劃補充戰略石油儲備刺激國際油價(jià)反彈-環(huán)球

市場(chǎng)聚焦美國通脹數據黃金逼近歷史高點(diǎn)-世界微速訊

全球今日訊！重磅數據今晚來(lái)襲！高盛和小摩：若通脹

世界訊息：港股概念追蹤 | 打磨七年之久！蘋(píng)果今

澳大利亞公布新財年預算案消費、醫療與能源行業(yè)獲

溫蒂漢堡(WEN.US)聯(lián)手谷歌(GOOG.US)推出人工智能點(diǎn)

最新原創(chuàng )

璀璨商務(wù)區夜景美如畫(huà) 天天即時(shí)

快消息！倍杰特中標宜化化工季戊四醇污水站托管運維

【環(huán)球熱聞】中工環(huán)境科技領(lǐng)導一行蒞臨博匯特共話(huà)合

詹姆斯假摔也是比賽的一部分_詹姆斯假摔

常德交警直屬一大隊開(kāi)展“零點(diǎn)行動(dòng)”嚴查酒駕違法行

中冶生態(tài)環(huán)保集團有限公司召開(kāi)資本戰略研討啟動(dòng)會(huì )

楊冪出走，沒(méi)了“印鈔機”的嘉行還“行”嗎？

西鄉農商銀行持續推動(dòng)“進(jìn)、知、解”活動(dòng)走深走實(shí)

衡水農商銀行加快推進(jìn)數字人民幣消費場(chǎng)景建設

每日快報!衡水農商銀行緊盯目標“加速跑” 三個(gè)轉

讀圖

美國計劃補充戰略石油儲備刺激國際油價(jià)反彈-環(huán)球

2023-05-10

市場(chǎng)聚焦美國通脹數據黃金逼近歷史高點(diǎn)-世界微速訊

2023-05-10

全球今日訊！重磅數據今晚來(lái)襲！高盛和小摩：若通脹

2023-05-10

世界訊息：港股概念追蹤 | 打磨七年之久！蘋(píng)果今

2023-05-10

澳大利亞公布新財年預算案消費、醫療與能源行業(yè)獲

2023-05-10

熱點(diǎn) / 快訊

商務(wù)部：一季度我國服務(wù)貿易繼續保持增長(cháng)態(tài)勢今日

甘肅工業(yè)經(jīng)濟提質(zhì)增效焦點(diǎn)速訊

金潤etc推動(dòng)交通行業(yè)的數字化進(jìn)程

百事通！“拆遷”變“搬遷”有何深意

云南多舉措激活消費潛能

世界黃金協(xié)會(huì )：中國金飾金條金幣需求回升

5月零售業(yè)景氣指數達51.1%-天天新消息

環(huán)球速看：乘風(fēng)聚勢擘畫(huà)美麗產(chǎn)業(yè)開(kāi)放合作新圖景

MUSES GIRL蜜介國際旗下子品牌白轉黑：MG應用基因

58同城聯(lián)合哈爾濱市道外區人社區保障局切實(shí)解決企

千零萬(wàn)食零食品牌創(chuàng )新品牌經(jīng)營(yíng)支持

天天觀(guān)焦點(diǎn)：經(jīng)營(yíng)者不得強制消費者“掃碼點(diǎn)餐”“掃

【全球熱聞】中國化妝品市場(chǎng)：美麗機遇世界共享

銀保機構創(chuàng )新涉農金融產(chǎn)品

今日報丨中央財政持續發(fā)力農村綜合性改革

今日熱聞!ETF觀(guān)察丨鋰電池板塊早盤(pán)逆勢走高，比亞迪

隔夜shibor下跌12.90個(gè)基點(diǎn)

環(huán)球速看：2022年度秋糧收購總量達近三年來(lái)最高

訊息：昨晚“談了個(gè)寂寞”！拜登刷爆美國“信用卡”

【早評】權重全線(xiàn)跳水警惕市場(chǎng)出向下拐點(diǎn) 全球熱訊

港股開(kāi)盤(pán)：指數分化，伊泰煤炭漲超4%，美團、騰訊小

天天動(dòng)態(tài):吉利牽手長(cháng)安：昔日宿敵何以“握手言和”

焦點(diǎn)觀(guān)察：教育部：防范手機作弊作為今年高考安全的

每日熱訊!金融板塊走弱中國銀河跌停

應急管理部：今年以來(lái)安全生產(chǎn)事故總量下降超三成，

業(yè)績(jì)歷史最佳估值歷史最低新能源何時(shí)否極泰來(lái)

美股三大股指全線(xiàn)收跌熱門(mén)中概股普跌_資訊

CPO概念股開(kāi)盤(pán)拉升聯(lián)特科技漲超10%再創(chuàng )新高

天天快訊:磷化工板塊異動(dòng)拉升湖北宜化沖擊漲停

當前快看：港股鋰電池股大幅走強天能動(dòng)力漲近4%

關(guān)于我們| 聯(lián)系方式| 版權聲明| 供稿服務(wù)| 友情鏈接

鋼企網(wǎng) 版權所有，未經(jīng)書(shū)面授權禁止使用

Copyright©2008-2020 By All Rights Reserved 京ICP備2022018928號-3

聯(lián)系郵箱：315 541 185@qq.com

感谢您访问我们的网站，您可能还对以下资源感兴趣：
国产精品久久久久久久久久久久午衣片
av动漫极品人妻丝袜乱经典系列人妻少妇精品视频一区二区三区人人妻人人澡人人爽精品