国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

全球速遞!鄔賀銓院士談AIGC:中國現有算力總規模相比美國,有差距但不大

隨著(zhù)ChatGPT在全球掀起熱潮,一時(shí)之間其背后的AI大模型風(fēng)起云涌。大家想知道,評價(jià)大模型水平高低的維度和標準有哪些?


(資料圖片僅供參考)

ChatGPT上線(xiàn)讓我們看到了在A(yíng)IGC上的中美差距,那么,當前中國大模型發(fā)展狀況如何?未來(lái)的中國大模型發(fā)展又面臨哪些機遇與挑戰?

當前處在向通用人工智能發(fā)展的關(guān)鍵時(shí)期,面臨各家機構獨立研究大模型的發(fā)展態(tài)勢,如何提高算力效率并有效避免低水平重復?

有業(yè)界人士擔憂(yōu)AI將毀滅人類(lèi),這是否是杞人憂(yōu)天?我們又該如何防患于未然,實(shí)現AI的結果可預期和行為可控?

帶著(zhù)關(guān)于A(yíng)IGC的各種問(wèn)題,騰訊研究院獨家專(zhuān)訪(fǎng)了中國工程院院士、我國通信領(lǐng)域權威專(zhuān)家鄔賀銓。

中國現有算力總規模相比美國:有差距但不大

T:有人說(shuō)中國的大模型開(kāi)發(fā)距離國外有1—2年的差距,您怎么看當前中國大模型的發(fā)展狀況??

鄔賀銓?zhuān)褐袊诖竽P烷_(kāi)發(fā)方面起步比美國晚,在ChatGPT出來(lái)后,國內不少單位紛紛表示在研發(fā)生成式大模型,與美國目前已知僅有微軟與谷歌等幾個(gè)企業(yè)在研究大模型相比,我國研制大模型的單位比美國多,但研究主體數量多并不意味中國在大模型上研發(fā)水平高。據稱(chēng)國內某一大模型的參數量高達1.75萬(wàn)億,超過(guò)了GPT-4,但尚未看到其應用的報道。雖然已有中國公司聲稱(chēng)可推出類(lèi)似ChatGPT的聊天機器人,但就支持多語(yǔ)種能力方面目前不如ChatGPT,就中文對話(huà)能力方面就響應速度而言也還有差距。

我們現在只注意到ChatGPT,它以生成式任務(wù)為目標,主要是完成如聊天和寫(xiě)作等語(yǔ)言生成,谷歌公司的BERT模型更注重判斷決策,強調如問(wèn)答和語(yǔ)義關(guān)系抽取等語(yǔ)言理解相關(guān)的任務(wù),BERT模型的技術(shù)也值得我們關(guān)注。評價(jià)大模型水平應該是多維度的,全面性、合理性、使用便捷性、響應速度、成本、能效等,籠統地說(shuō)目前我國大模型開(kāi)發(fā)與國外的差距為1—2年的依據還不清楚,現在下這一結論意義也不大。

中國企業(yè)在獲得中文語(yǔ)料和對中國文化的理解方面比外國企業(yè)有天然的優(yōu)勢,中國制造業(yè)門(mén)類(lèi)最全,具有面向實(shí)體產(chǎn)業(yè)訓練產(chǎn)業(yè)AIGC的有利條件。在算力方面中國已具有較好的基礎。據OpenAI報告,訓練GPT3 模型所需的算力高達3.64EFlops/天,相當于3—4個(gè)鵬城云腦Ⅱ(鵬城云腦Ⅱ為1Eflops,即每秒百億億次浮點(diǎn)計算)。按2022年年底的數據,美國占全球算力36%,中國占31%,現有算力總規模與美國相比有差距但不大,而以GPU和NPU為主的智能算力規模中,中國明顯高于美國(按2021年年底數據,美國智算規模占全球智算總規模15%,中國占26%),我國不僅是大型互聯(lián)網(wǎng)企業(yè)具有相當規模的算力,國家實(shí)驗室和一些城市政府支持的實(shí)驗室也有大規模的算力資源,可以說(shuō)在訓練大模型所需算力支持方面中國也能做到。據了解,鵬城實(shí)驗室正在設計鵬城云腦Ⅲ,算力達到16EFlops,比GPT-3所用算力高3倍,預計耗資60億元,將為人工智能訓練持續提供強有力的算力支持。

中國AIGC研發(fā):需認清差距重視挑戰 實(shí)在創(chuàng )新

T:除了我們在算力方面有較好的基礎之外,您認為在中國做大模型還面臨哪些挑戰?

鄔賀銓?zhuān)?/strong>僅有算力還是不夠的,在以下幾方面我們還面臨不少挑戰:

首先,大模型的基礎是深度學(xué)習框架,美國的Tensorflow和PyTorch已經(jīng)深耕深度學(xué)習框架生態(tài)多年,雖然國內企業(yè)也自主開(kāi)發(fā)了深度學(xué)習框架,但市場(chǎng)考驗還不夠,生態(tài)還有待打造。

其次,將AIGC擴展到產(chǎn)業(yè)應用可能需要不止一個(gè)大模型,如何將多個(gè)大模型高效地整合,有標準化和數據融合的挑戰。

第三,大模型需要海量數據訓練,中國有數千年的文明,但豐富的文化沉淀絕大多數并未數字化,中文在ChatGPT訓練所用到的語(yǔ)料中還不到0.1%。雖然我國互聯(lián)網(wǎng)企業(yè)擁有大量電商、社交、搜索等網(wǎng)絡(luò )數據,但各自的數據類(lèi)型不夠全面,網(wǎng)上知識的可信性又缺乏嚴格保證,中文可供訓練的語(yǔ)料還需要做大量的挖掘工作。

第四,大模型訓練所依賴(lài)的GPU芯片以英偉達公司的A100芯片為代表,但該芯片已被美國限制向中國出口,國產(chǎn)GPU的性能還有待進(jìn)一步考驗,目前在算力的利用效率上還有差距。

第五,在中國從事AI研究的技術(shù)人員不算少,但具有架構設計能力和AIGC數據訓練提示師水平的人才仍然短缺。在ChatGPT出現之前,有人認為中國在A(yíng)I方面的論文與專(zhuān)利數與美國不相上下,ChatGPT的上線(xiàn)使我們看到了在A(yíng)IGC上中美的差距,現在是需要清楚認識和重視我們面對的挑戰,做實(shí)實(shí)在在的創(chuàng )新,將挑戰化為機遇,在新一輪的AI賽道上做出中國的貢獻。

建議開(kāi)放國家算力平臺支持各類(lèi)大模型訓練

T:ChatGPT無(wú)疑是一個(gè)巨大的創(chuàng )新,中國未來(lái)應如何鼓勵類(lèi)似這樣的創(chuàng )新,應該多做哪些方面的工作?

鄔賀銓?zhuān)?/strong>人工智能從判別式發(fā)展到生成式是里程碑標志的創(chuàng )新,開(kāi)始進(jìn)入到走向通用人工智能的賽道。從GPT-3到GPT-4已經(jīng)從文字輸入發(fā)展到部分圖形輸入,即增加了對圖形的理解能力,在此基礎上向實(shí)現一個(gè)深度學(xué)習架構和通用模型支持多模態(tài)數據輸入的時(shí)間不遠了,不過(guò)大模型的任務(wù)通用化和大模型按需調用的精細化還需要更大的投入與創(chuàng )新,對圖形和視頻做數據無(wú)標注和無(wú)監督學(xué)習比語(yǔ)言和文字輸入情況要難得多。

現在處于向通用人工智能發(fā)展的關(guān)鍵時(shí)期,對我國來(lái)說(shuō)這是跨越發(fā)展的難得機遇也是嚴峻的挑戰。算力、模型、數據是ChatGPT成功的必要條件也將是通用人工智能成功的在因素,除此之外,創(chuàng )新的生態(tài)、機制與人才更是關(guān)鍵。中國在算力總規模上可與美國相比,但跨數據中心的算力協(xié)同還面臨體制機制的挑戰,不少智算中心算力利用率和效率不高。不少單位各自獨立研究大模型,難免低水平重復,建議在國家科技與產(chǎn)業(yè)計劃的協(xié)調下合理分工形成合力。建議開(kāi)放國家實(shí)驗室的算力平臺支持各類(lèi)大模型訓練,例如鵬城云腦現在對外開(kāi)放的算力達到總能力3/4,可支持規模與GPT-3相當的兩千億參數的開(kāi)源中文預訓練語(yǔ)言大模型。同時(shí)建議組建算力聯(lián)盟,集中已有高檔GPU的算力資源,提供大模型數據訓練所需算力。現在以鵬城實(shí)驗室為主建設的“中國算力網(wǎng)(C2NET)”已接入二十余個(gè)大型智算、超算、數據中心,匯聚異構算力達3EFlops,其中自主研發(fā)的AI算力超1.8EFlops。另外,聊天機器人的應用只是訓練與檢驗AIGC的一種直觀(guān)方式,但聊天不是剛需,需要基于大模型開(kāi)發(fā)出各類(lèi)面向行業(yè)應用的模型,盡快使大模型在產(chǎn)業(yè)上落地見(jiàn)效,在面向各行各業(yè)的應用中培養更多的人才。

大模型行業(yè)應用需既懂行業(yè)技術(shù)又懂AI訓練的綜合人才

T:目前我們已經(jīng)看到了 ChatGPT 在某些領(lǐng)域的應用,比如聊天機器人、文本生成和語(yǔ)音識別等。未來(lái)在實(shí)體行業(yè)和領(lǐng)域,是否會(huì )有一些應用機會(huì )?大模型在實(shí)體行業(yè)應用還面臨什么樣的障礙?

鄔賀銓?zhuān)?/strong>在現有ChatGPT類(lèi)聊天機器人基礎上經(jīng)補充相關(guān)行業(yè)和企業(yè)知識的訓練,可以在企業(yè)承擔智能客服工作,代替工人面向客戶(hù)提供售前與售后服務(wù)。在需要軟件編程的設計與制造環(huán)節,ChatGPT可代替程序員完成編程任務(wù)和檢驗軟件的Bug??梢猿袚O計與生產(chǎn)過(guò)程所需文件資料的收集、翻譯和整理工作。經(jīng)過(guò)專(zhuān)業(yè)的訓練,AIGC類(lèi)大模型可以用于設計EDA軟件,例如IC設計用的工具軟件。在動(dòng)漫和游戲企業(yè),基于A(yíng)IGC類(lèi)大模型訓練的機器人可以按照提示編寫(xiě)劇本、創(chuàng )作游戲腳本并進(jìn)行編程,完成3D動(dòng)漫的渲染。

但ChatGPT不是通用模型,很難直接在實(shí)體產(chǎn)業(yè)的生產(chǎn)制造過(guò)程上應用,但可以基于訓練ChatGPT的原理,利用行業(yè)與企業(yè)的知識圖譜進(jìn)行深度訓練,有可能開(kāi)發(fā)出企業(yè)專(zhuān)用的大模型,完成這一工作的挑戰是需要既熟悉企業(yè)上傳流程和關(guān)鍵環(huán)節技術(shù)又掌握人工智能大數據訓練技術(shù)的人才。

從關(guān)注結果到關(guān)注過(guò)程融合技術(shù)與法制主導AIGC推理過(guò)程

T:ChatGPT也會(huì )出現各種各樣的錯誤,也會(huì )帶來(lái)一些倫理、安全和隱私等方面的問(wèn)題,未來(lái)在應用大模型的時(shí)候,如何才能營(yíng)造一種既包容又兼顧安全和發(fā)展的環(huán)境?

鄔賀銓?zhuān)?/strong>生成式AI的出現將社會(huì )對人工智能的關(guān)注推到一個(gè)前所未有的高度,在引發(fā)科技界和產(chǎn)業(yè)界對AI的研究熱潮同時(shí),不少專(zhuān)家擔心人工智能將毀滅人類(lèi),呼吁停止GPT-5的研究。一些專(zhuān)家的擔憂(yōu)并非杞人憂(yōu)天,因為目前ChatGPT機器人的思考過(guò)程不透明,人類(lèi)創(chuàng )造出ChatGPT,但目前人類(lèi)對它的推理過(guò)程并不完全掌握,推理結果知其然不知所以然,可解釋性不足,不確定、不可知就會(huì )出現不可控,存在機器人變態(tài)和倫理失范及行為失控的風(fēng)險。

解決辦法不是停止對人工智能的研究,而是對AIGC的研究從關(guān)注結果到關(guān)注過(guò)程,設計和主導其推理過(guò)程,做到結果可預期和行為可控。未來(lái)對大模型的推廣應用需要經(jīng)有資質(zhì)的機構做安全可信的評價(jià),經(jīng)檢驗該大模型的推理過(guò)程是可追溯的。同時(shí)需要建立相應的AI治理法規,防止對AIGC訓練的誤導,追究AIGC訓練主體的責任,嚴懲教唆作惡犯罪行為。通過(guò)技術(shù)與法制相輔,使得人工智能成為人類(lèi)真正忠誠的助手。

本文來(lái)源:騰訊研究院,原文標題:《騰研專(zhuān)訪(fǎng)|鄔賀銓院士:中國大模型發(fā)展的優(yōu)勢、挑戰及創(chuàng )新路徑》

風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

關(guān)鍵詞:

關(guān)于我們| 聯(lián)系方式| 版權聲明| 供稿服務(wù)| 友情鏈接

鋼企網(wǎng) 版權所有,未經(jīng)書(shū)面授權禁止使用

Copyright©2008-2020 By    All Rights Reserved 京ICP備2022018928號-3

聯(lián)系郵箱:315 541 185@qq.com