AI見(jiàn)聞日報:OpenAI遭客戶(hù)抱怨,都怪GPU太缺貨,英偉達訂單竟延到年底?| 見(jiàn)智研究_天天視點(diǎn)
今日要點(diǎn):
(資料圖片)
1、OpenAI遭客戶(hù)抱怨,都怪GPU太缺貨;
2、 OpenAI最新訓練方法:用過(guò)程監督法降低“幻覺(jué)現象”;
3、中文AI大模型首個(gè)反歧視對抗性開(kāi)源項目:每個(gè)人提出100道“有毒”問(wèn)題;
4、 阿里云AI助手“通義聽(tīng)悟”公測,應用落地速度超預期。
海外AI
1、OpenAI遭客戶(hù)抱怨,都怪GPU太缺貨
OpenAI目前遭到客戶(hù)最大的抱怨是API的可靠性和速度。OpenAI的CEO Sam Altman 承認當下GPU非常緊缺,這不得不推遲了許多的短期計劃,微調 API 、專(zhuān)用容量產(chǎn)品都受到GPU 可用性的限制。不過(guò),OpenAI還會(huì )提供專(zhuān)用容量,為客戶(hù)提供模型的私人副本,但如若訪(fǎng)問(wèn)此服務(wù),客戶(hù)必須預先承諾支付100萬(wàn)美元。
此外,Sam Altman重申了他對開(kāi)源重要性的信念,并表示OpenAI正在考慮開(kāi)源GPT-3。
見(jiàn)智研究認為:在生成式AI需求的推動(dòng)下,GPU產(chǎn)品會(huì )面臨持續性的缺貨和漲價(jià),英偉達目前的交貨周期還在不斷拉長(cháng),從之前一個(gè)月到現在基本上需要三個(gè)月或者更久,甚至部份訂單到年底才能交付。
GPU與CPU最大的不同就是擁有大量的并行計算單元,可以同時(shí)執行多個(gè)任務(wù),特別是在大模型處理數據的時(shí)候能夠顯著(zhù)提高速度,因此GPU的不足會(huì )直接影響API(程序之間的接口)之間的傳輸速度。
此外,大模型的開(kāi)源路徑已經(jīng)成大勢所趨,無(wú)論是語(yǔ)言大模型還是多模態(tài)大模型,Meta、Google以及Stable Diffusion都紛紛選擇開(kāi)源,現在連封閉大模型鼻祖openAI也選擇逐漸開(kāi)源的路徑,可見(jiàn)大模型的發(fā)展趨勢已經(jīng)明朗。
2、OpenAI最新訓練方法:用過(guò)程監督法降低“幻覺(jué)現象”
OpenAI發(fā)表最新的論文:《Let"s Verify Step by Step》通過(guò)獎勵每一個(gè)正確的推理步驟("過(guò)程監督"),而不僅僅是獎勵正確的最終結果(“結果監督”),對思考鏈條中的每一個(gè)單獨步驟提供反饋,能夠極大解決諸如GPT4“胡說(shuō)八道”和邏輯錯誤的這種“幻覺(jué)現象”。
見(jiàn)智研究認為:無(wú)論是過(guò)程監督還是結果監督都是對大模型生成結果可靠性和準確性的一種訓練機制,而從過(guò)程開(kāi)始監督的方式會(huì )比獎勵正確結果的表現更快速,優(yōu)先評估過(guò)程會(huì )使得結果可靠性更趨向于人類(lèi)所期待的,從而排除更多推理結果錯誤的概率。
但是,過(guò)程監督仍也存在一定的難度:數據獲取過(guò)程長(cháng),需要收集數據訓練的完成過(guò)程,包括輸入和響應操作以及決策,時(shí)間跨度更大,同時(shí)增加了樣本的復雜性以及成本。
國內AI
1、中文AI大模型首個(gè)反歧視對抗性開(kāi)源項目:每個(gè)人提出100道“有毒”問(wèn)題
業(yè)內首個(gè)大語(yǔ)言模型治理開(kāi)源中文數據集100PoisonMpts發(fā)布,十多位知名專(zhuān)家學(xué)者成為了首批“給AI的100瓶毒藥”的標注工程師。標注人各提出100個(gè)誘導偏見(jiàn)、歧視回答的刁鉆問(wèn)題,并對大模型的回答進(jìn)行標注,完成與AI從“投毒”和“解毒”的攻防。
相比國外廠(chǎng)商的治理方法,100PoisonMpts數據集在技術(shù)方法有幾個(gè)特點(diǎn):
更完整的標注流程。標注人同時(shí)設置問(wèn)題、對回答質(zhì)量排序、對最優(yōu)回答評分、并人工改寫(xiě)回答。
更隱性的問(wèn)題領(lǐng)域。如首批數據就重點(diǎn)針對了反歧視領(lǐng)域,包含人群、知識、法律等多維度復雜問(wèn)題。
探索更全面的有效性。標注數據對模型在繼續訓練、微調、強化學(xué)習、線(xiàn)上服務(wù)等多環(huán)節產(chǎn)生效益。
見(jiàn)智研究認為:數據標注是在大模型過(guò)程中至關(guān)重要的步驟,用標注后的“安全數據集”進(jìn)行模型訓練才能夠得到趨近理想的訓練結果。但是數據標準一直伴隨有主觀(guān)、宗教、個(gè)人偏好的特色,所以如果用國外的數據集進(jìn)行訓練,某種程度上會(huì )“水土不服”,而搭建本地訓練數據集就顯得非常重要。中文AI首個(gè)反歧視對抗項目凝聚力眾多行業(yè)專(zhuān)家,之后會(huì )成為國內開(kāi)源大模型訓練的高標準數據集之一。
2、阿里云AI助手“通義聽(tīng)悟”公測,應用落地速度將超預期
阿里云智能發(fā)布了工作學(xué)習AI助手“通義聽(tīng)悟”,開(kāi)始正式公測??勺饔迷跁?huì )議討論、教學(xué)培訓、調研訪(fǎng)談、視頻觀(guān)看等場(chǎng)景,可進(jìn)行實(shí)時(shí)語(yǔ)音識別,實(shí)現對話(huà)的實(shí)時(shí)記錄、多語(yǔ)言翻譯、發(fā)言總結、提取PPT、內容規整等。
值得關(guān)注的是:在內容總結方面,飛書(shū)妙記還只能給出關(guān)鍵詞;而針對不同嘉賓的發(fā)言,聽(tīng)悟都能給出對應的發(fā)言總結。
聽(tīng)悟已經(jīng)和阿里云盤(pán)打通,存放在云盤(pán)中的音視頻內容可以一鍵轉寫(xiě),在線(xiàn)播放云盤(pán)視頻時(shí)還能自動(dòng)顯示字幕。并且在企業(yè)版本中,AI整理后的音視頻文件將來(lái)還可以在內部快速分享。
見(jiàn)智研究認為:國內大模型在應用領(lǐng)域的落地進(jìn)展非常迅猛,通義聽(tīng)悟主要應用于音頻、視頻領(lǐng)域,為用戶(hù)帶來(lái)音頻和視頻內容記錄和閱讀的全新體驗。而傳統軟件的用戶(hù)粘性很快就會(huì )被打破。
通義聽(tīng)悟是采用阿里達摩院的語(yǔ)音識別模型Paraformer,不僅在推理效率上較傳統模型提升10倍,剛推出時(shí)還“屠榜”多個(gè)權威數據集,刷新語(yǔ)音識別準確率SOTA。在專(zhuān)業(yè)第三方全網(wǎng)公共云中文語(yǔ)音識別評測SpeechIO TIOBE白盒測試中,目前,Paraformer-large仍是準確率最高的中文語(yǔ)音識別模型。
此外,更應關(guān)注語(yǔ)音大模型在移動(dòng)端的應用進(jìn)展,比如智能音箱就是非常好的端口。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: