全球新動(dòng)態(tài):三個(gè)月誕生79個(gè)基礎大模型,中國到底需要什么大模型?
去年年底ChatGPT發(fā)布后,中國企業(yè)至少已經(jīng)發(fā)布了79個(gè)基礎大模型。但其中絕大部分大模型都被外界認為技術(shù)上和ChatGPT存在差距。大模型商用箭在弦上,中國到底需要什么大模型?
(資料圖片)
2022年12月,微軟投資的AI創(chuàng )業(yè)公司OpenAI推出了對話(huà)式AI ChatGPT。ChatGPT本質(zhì)是OpenAI自主研發(fā)的GPT語(yǔ)言大模型,該大模型包含近1800億個(gè)參數。今年2月英偉達CEO黃仁勛評價(jià)稱(chēng),“ChatGPT讓AI迎來(lái)了iPhone時(shí)刻”。黃仁勛認為,大模型正在降低應用開(kāi)發(fā)門(mén)檻,所有應用都值得用大模型重做一次。
這并不是黃仁勛的一家之言,所有人都看到了機會(huì )。
今年3月開(kāi)始,中國企業(yè)也在競相發(fā)布大模型產(chǎn)品。其中包括頭部企業(yè),如百度的文心大模型、阿里的通義大模型、騰訊的行業(yè)大模型,還包括訊飛、商湯科技等行業(yè)企業(yè)以及一批創(chuàng )業(yè)公司。5月科技部下屬的中國科學(xué)技術(shù)信息研究所發(fā)布了《中國人工智能大模型地圖研究報告》。報告顯示,截至5月28日,國內10億級參數規模以上基礎大模型至少已發(fā)布79個(gè)。
模型的參數量很重要。目前,百度、阿里等頭部公司公布文心、通義參數量通常在1000億級別,如文心大模型參數量為2600億。其他企業(yè)或創(chuàng )業(yè)公司大模型參數量通常在100億、10億級別。? ? ? ?
雖然目前市場(chǎng)上發(fā)布的AI模型都叫“大模型”,但參數量被默認為是大模型、小模型的界定因素之一。百度集團副總裁侯震宇對《財經(jīng)》記者表示,2022年10億參數的模型,就叫大模型。但現在的大模型參數動(dòng)輒上千億。因為千億參數以上才會(huì )出現“智能涌現”效應,才會(huì )形成泛化能力,才能在各個(gè)場(chǎng)景下具備通用能力?;谶@種大模型精調出來(lái)的模型才具備更好的產(chǎn)業(yè)應用效果。
“智能涌現”效應,指的是模型規模、算力水平超過(guò)某個(gè)參數閾值后,AI效果將不再是隨機概率事件。在通用領(lǐng)域,參數量越大,智能通常涌現的可能性就越大,AI準確率也會(huì )更高。在專(zhuān)用垂直領(lǐng)域,大參數模型裁剪優(yōu)化后更容易獲得精確的效果。
雖然中國至少已經(jīng)出現了79個(gè)大模型,但多位接受《財經(jīng)》記者采訪(fǎng)的行業(yè)人士認為,大模型需要算力、算法、數據積累。由于高性能GPU芯片短缺,硬件采購成本、運營(yíng)成本高昂,中國具備資金儲備、戰略意志和實(shí)際能力跑通大模型商業(yè)化的企業(yè)寥寥無(wú)幾?!鞍倌4髴稹敝?,絕大部分產(chǎn)品和ChatGPT確實(shí)存在差距。
經(jīng)歷喧囂后,大模型狂熱正在逐漸回歸現實(shí)。國內外大模型市場(chǎng)正在出現更多理智思考——無(wú)法落地商用的ChatGPT只能是玩具,能成為企業(yè)應用的大模型才有產(chǎn)業(yè)價(jià)值。
蘋(píng)果、三星、摩根大通等企業(yè)因為安全考慮禁止員工使用ChatGPT。另一方面,ChatGPT用戶(hù)增長(cháng)、留存也已到瓶頸。網(wǎng)站分析工具SimilarWeb數據顯示,ChatGPT在1-5月流量環(huán)比增速分別為131.6%、62.5%、55.8%、12.6%、2.8%。6月初,摩根士丹利調查顯示,只有19%的受訪(fǎng)者表示使用過(guò)ChatGPT,只有4%的人表示依賴(lài)ChatGPT。
侯震宇說(shuō),“今年3月,客戶(hù)剛開(kāi)始跟我們聊大模型需求時(shí),都在發(fā)揮想象力,提的需求要多科幻有多科幻。但4月后,大模型的局限性顯露,大家才慢慢看到了更多實(shí)際需求?!敝骺陀^(guān)因素影響下,全球基礎大模型均主要面向To B行業(yè)市場(chǎng)。
大模型在To C端商業(yè)化進(jìn)程緩慢。目前面臨算力成本高昂,用戶(hù)規模越大企業(yè)虧損越多等問(wèn)題。也無(wú)法避免輸出錯誤“噪音”,甚至還有信息泄密、政策監管等倫理挑戰。即使微軟,也只是在工具類(lèi)產(chǎn)品(office辦公套件、網(wǎng)頁(yè)瀏覽器、Photoshop等修圖工具)中部署大模型。微軟向工具類(lèi)企業(yè)賣(mài)服務(wù),其本質(zhì)仍是To B商業(yè)化。
大模型面向To B端企業(yè)客戶(hù)落地才是務(wù)實(shí)做法。在行業(yè)市場(chǎng),客戶(hù)需求蓬勃且明確。在全球,零售、金融、制造、政府等領(lǐng)域都在靠大模型進(jìn)行智能化升級。行業(yè)共識是,在大模型基礎上經(jīng)過(guò)行業(yè)知識精調的模型,其特定工作表現,會(huì )優(yōu)于未經(jīng)優(yōu)化的通用基礎大模型。
市場(chǎng)調研機構IDC在今年5月公布的數據顯示,2022年中國人工智能市場(chǎng)總規模為122億美元,其中硬件81.3億美元,軟件26.9億美元,服務(wù)14.1億美元。IDC預測稱(chēng),2026年中國人工智能市場(chǎng)規模將達到269億美元,其中硬件148.5億美元,軟件76.9億美元,服務(wù)38.9億美元。硬件、軟件、服務(wù)的年復合增長(cháng)率分別為15.1%、 32.0%、28.5%。
狂熱總要回歸現實(shí)?!敦斀?jīng)》6月與百度集團副總裁侯震宇、百度智能云副總裁朱勇展開(kāi)了一場(chǎng)主題名為“中國到底需要什么大模型”的對話(huà),侯震宇和朱勇深度參與了百度文心千帆大模型平臺的打造和商用生態(tài)的塑造,在這場(chǎng)談話(huà)中,我們探討了三大問(wèn)題:大模型是不是豪華游戲?企業(yè)到底需要何種大模型?大模型市場(chǎng)是否出現了泡沫?
對話(huà)人簡(jiǎn)介:
百度集團副總裁 侯震宇(負責百度智能云事業(yè)群組云計算產(chǎn)研團隊和基礎技術(shù)工程團隊)
百度智能云副總裁 朱勇(負責百度智能云應用產(chǎn)品中心)
主持人:《財經(jīng)》雜志副主編 謝麗容
以下是對話(huà)實(shí)錄精華版:
大模型是不是豪華游戲?
《財經(jīng)》謝麗容:中國掀起了大模型創(chuàng )業(yè)潮,大模型的門(mén)檻很高,但從入局速度和規??粗袊袌?chǎng)現狀似乎并非如此?
朱勇:大模型門(mén)檻是相對的,其中會(huì )有不同類(lèi)型的玩家。第一類(lèi)和百度一樣,從零開(kāi)始做基礎大模型。這對算力、算法、數據、人才的要求都非常高。
以數據為例,基礎大模型需要海量數據訓練,其中包括互聯(lián)網(wǎng)數據、專(zhuān)業(yè)領(lǐng)域數據、新聞資訊數據,以及經(jīng)過(guò)高質(zhì)量的專(zhuān)業(yè)標注的數據。以算力為例,ChatGPT這樣的千億級參數大模型,需要英偉達最高端的A100/H100 GPU連續訓練100天才能得到。算法、人才也是關(guān)鍵。工程師訓練手法不同,就像不同廚師基于同樣原材料做的菜口味都不一樣。這需要長(cháng)期實(shí)踐經(jīng)驗積累,所以門(mén)檻很高。
第二類(lèi)是行業(yè)大模型,基于基礎大模型能力做一些微調、針對性定制。這比過(guò)去從零開(kāi)始數據標注、算法精調的成本大大降低。第三類(lèi)基于前兩類(lèi)大模型開(kāi)發(fā)應用,百度、其他企業(yè)甚至是一些開(kāi)源平臺都提供了開(kāi)發(fā)工具,讓軟件開(kāi)發(fā)門(mén)檻變得更低。
《財經(jīng)》謝麗容:中國的大模型在全球市場(chǎng)究竟是什么水平?
侯震宇:個(gè)人覺(jué)得中國的大模型在全球市場(chǎng)還是領(lǐng)先的。大模型研發(fā)和搜索引擎研發(fā)其實(shí)類(lèi)似,都需要非常深的技術(shù)積累。從全球來(lái)看,擁有獨立研發(fā)搜索引擎技術(shù)的國家就那么幾個(gè)。目前能完全獨立研發(fā)大模型技術(shù)的,可能也只有中美兩個(gè)國家。
《財經(jīng)》謝麗容:大模型有沒(méi)有絕對的先進(jìn)和落后?
侯震宇:大模型沒(méi)有絕對好、壞。盡管它在不同領(lǐng)域可能會(huì )有一定的差別,但就像選擇智能手機一樣。有人用蘋(píng)果,有人用安卓,最適合的才是好的。大模型剛推出時(shí),經(jīng)常會(huì )有人考它一些刁鉆的問(wèn)題。但事實(shí)上,在真正嚴肅的企業(yè)級環(huán)境里面,不太會(huì )有這樣的場(chǎng)景。企業(yè)需要針對業(yè)務(wù)場(chǎng)景選擇更適合自己的大模型。特別是中國企業(yè),需要選擇中文理解力更好,適合中國企業(yè)特點(diǎn)的產(chǎn)品。
《財經(jīng)》謝麗容:百度在大模型方向究投入了多少資源,多少人才?
侯震宇:AI大模型是百度核心戰略,它需要持續全方位高強度投入。以算力為例,我們過(guò)去GPU數量的積累,是以萬(wàn)為單位計量,這一筆巨大的投資。百度經(jīng)過(guò)多年還開(kāi)發(fā)出了一整套工具鏈,能夠更快更好地訓練模型。
過(guò)去10年,百度在A(yíng)I方向投入已超過(guò)1000億元。百度作為一家技術(shù)公司,每年研發(fā)投入的營(yíng)收占比都超過(guò)20%。(備注:2019年后,百度核心研發(fā)支出的營(yíng)收占比長(cháng)期超過(guò)20%。2022年百度研發(fā)支出率為24%,在中國科技企業(yè)中僅次于華為的25%。百度核心指剔除愛(ài)奇藝后的百度自有業(yè)務(wù))但大模型也不是投一筆錢(qián)、做一個(gè)模型那么簡(jiǎn)單,它需要有算力、有數據、有經(jīng)驗豐富的AI工程師在好的研發(fā)平臺上長(cháng)期積累。
《財經(jīng)》謝麗容:創(chuàng )業(yè)公司做基礎大模型,除了要有錢(qián)、要有卡、要有數據,還有哪些挑戰?
侯震宇:錢(qián)、卡、數據,本身就很有挑戰。創(chuàng )業(yè)公司做基礎大模型,除了起碼的算力,足夠多、質(zhì)量好的數據,有經(jīng)驗的AI研發(fā)人員,還需要能夠把模型、算力管理好的AI開(kāi)發(fā)平臺。目前大公司會(huì )把這些平臺以云的形式對外提供服務(wù)。比如,百度智能云通過(guò)文心千帆大模型平臺對外提供服務(wù)。但是從零開(kāi)始訓練出基礎大模型門(mén)檻依然很高。因為大模型不是訓出來(lái)就行,還需要后續持續敏捷迭代,大公司相對會(huì )更成熟。
《財經(jīng)》謝麗容:一些企業(yè)正在開(kāi)始自建大模型。自建大模型是不是必須的選擇?2014年公有云剛剛興起時(shí),某些客戶(hù)會(huì )擔心數據安全,它們使用大模型時(shí),是否也會(huì )擔心這個(gè)問(wèn)題?
侯震宇:每一家公司都一定要用大模型,但每一個(gè)企業(yè)是否都需要自己做一個(gè)大模型?我覺(jué)得不一定。自己從頭開(kāi)始去做一個(gè)基礎大模型成本非常高。企業(yè)拿自己的數據在別人的基礎大模型做精調,一樣可以獲得非常好的效果。
朱勇:我覺(jué)得企業(yè)更多應該去想怎么用上大模型,怎么用好大模型。每個(gè)企業(yè)都可以擁有自己的大模型,但沒(méi)必要重新開(kāi)始做。因為百度這樣的企業(yè)已經(jīng)提供了很好的技術(shù)底座??梢砸揽堪俣茸鲆恍┒ㄖ苹a(chǎn)品,這對客戶(hù)來(lái)說(shuō)是性?xún)r(jià)比更好的選擇。數據安全問(wèn)題并不是大模型出現才帶來(lái)的新問(wèn)題。如果類(lèi)比云計算的話(huà),有公有云、私有云、托管等方式。在大模型商業(yè)模式上,我們已經(jīng)充分考慮過(guò)相應的產(chǎn)品和解決方案。
《財經(jīng)》謝麗容:智能手機、云的普及都是因為價(jià)格足夠低。中國大模型什么時(shí)候才能進(jìn)入普遍應用階段?
侯震宇:大模型本身就帶來(lái)了大量成本節省。過(guò)去,企業(yè)研發(fā)AI應用時(shí),需要根據應用場(chǎng)景做數據清洗、標注,對模型訓練、推理、優(yōu)化。不管場(chǎng)景有多小,都得做全流程的工作,成本很高。但基于大模型,不需要過(guò)去那么多數據、時(shí)間、資源、人力。我建議企業(yè)盡早關(guān)注、使用大模型技術(shù),因為它本身就能大幅度降低AI應用門(mén)檻。
中國企業(yè)需要什么大模型?
《財經(jīng)》謝麗容:百度的文心大模型3月開(kāi)始內測。內測中,企業(yè)是否可以清晰地提出自己的需求?他們的需求集中在哪些層面?
朱勇:距離3月份內測以來(lái),我們已經(jīng)陸續接到了超過(guò)15萬(wàn)家客戶(hù)的接入請求。同時(shí)也有幾百家合作伙伴跟我們在場(chǎng)景中進(jìn)行研發(fā)測試。這覆蓋了互聯(lián)網(wǎng)、制造、金融等不同行業(yè),里面很多場(chǎng)景是高價(jià)值的??偨Y一下,比較高頻出現的場(chǎng)景有幾大類(lèi)——知識管理、內容創(chuàng )作(包括營(yíng)銷(xiāo)文案、媒體資訊)、智能客服、代碼生成和辦公提效。
《財經(jīng)》謝麗容:數字化轉型市場(chǎng)長(cháng)期存在一個(gè)問(wèn)題,很多客戶(hù)不知道自己想要什么。在大模型領(lǐng)域,這個(gè)矛盾是不是也存在?
朱勇:不同行業(yè)、不同客戶(hù)確實(shí)存在差別。大模型出來(lái)后,互聯(lián)網(wǎng)行業(yè)高度關(guān)注它的最新進(jìn)展,他們的技術(shù)理解、產(chǎn)品認知都非常領(lǐng)先,因此我們能很快在一起進(jìn)行研發(fā)測試,做出Demo和產(chǎn)品創(chuàng )新。
一些傳統產(chǎn)業(yè)的數字化基礎相對薄弱一些,所以百度會(huì )有大量工程師跟客戶(hù)一起共創(chuàng ),將AI能力跟他們的行業(yè)痛點(diǎn)相結合,產(chǎn)生很多很新穎的產(chǎn)品理念。AI技術(shù)跟行業(yè)相結合時(shí),一方面要懂技術(shù)、懂AI,另一方面要懂行業(yè)。所以我們跟客戶(hù)、合作伙伴對接時(shí),經(jīng)常需要雙方在一起共創(chuàng )。
《財經(jīng)》謝麗容:百度怎么給不同行業(yè)、不同類(lèi)型的客戶(hù)提供大模型服務(wù)?從客戶(hù)角度如何評估性?xún)r(jià)比?
朱勇:在價(jià)格層面,如果企業(yè)剛開(kāi)始嘗試且對價(jià)格敏感,可以使用公有云服務(wù),根據調用量,Pay-as-you-go?(用多少花多少),不需要一次性基礎設施投入,這也是公有云的優(yōu)勢。一些企業(yè)愿意進(jìn)行較大基礎設施投入,并建立自己智能化的應用,百度可以提供一整套AI模型和AI底座,企業(yè)可以基于A(yíng)I模型和AI底座開(kāi)發(fā)應用。
《財經(jīng)》謝麗容:企業(yè)怎么選擇適合自己的大模型?
侯震宇:第一,肯定是模型效果,這是選擇大模型的基礎。企業(yè)需要評估大模型在使用場(chǎng)景中能夠發(fā)揮的價(jià)值。第二,要關(guān)注迭代速度。既要看基礎大模型本身是否有生命力,也要看平臺是否有完善的工具鏈,支持便捷的二次開(kāi)發(fā)和模型再訓練,支撐大模型更好迭代。第三,大模型的實(shí)際落地成本和交付形態(tài)。企業(yè)可以根據需要選擇公有云、私有云的交付模式。
《財經(jīng)》謝麗容:文心千帆被定位為一站式企業(yè)級大模型平臺,怎么去理解“一站式”、“企業(yè)級”?
侯震宇:首先說(shuō)“一站式”, AI是由數據驅動(dòng)的技術(shù)。AI從誕生之初就要做數據收集、清理、標注,再根據現有模型做訓練,訓練結束后要對精調數據、模型版本做管理,最后將其投放到業(yè)務(wù)中使用。這是一整套流程。百度提供了這些能力,而且很易用,客戶(hù)在A(yíng)I研發(fā)到應用的全生命周期中的需求都可以滿(mǎn)足。
再說(shuō)“企業(yè)級”,企業(yè)級應用不是個(gè)人應用,不是上傳照片那么簡(jiǎn)單。企業(yè)級應用會(huì )更精細、復雜,需要考慮規?;?、擴展性、實(shí)施成本、穩定健壯等因素。
《財經(jīng)》謝麗容:百度對外稱(chēng),文心千帆大模型平臺有六大特點(diǎn)——易用、安全、全面、高效、開(kāi)放、集成。易用為什么要擺在第一個(gè)?是不是只有好用的技術(shù)才會(huì )被普及?
侯震宇:易用非常重要。自然語(yǔ)言大模型可以給客戶(hù)提供更易用的接口,方便大家和機器來(lái)做交互?!霸浦且惑w,AI普惠”是百度智能云的戰略,“AI普惠”也一直是我們的一個(gè)理想。AI不能只是象牙塔里高高在上的技術(shù),必須要降低AI使用的門(mén)檻,其中包括數據使用門(mén)檻、資源使用門(mén)檻、以及人使用AI的門(mén)檻,所以易用非常關(guān)鍵。
《財經(jīng)》謝麗容:過(guò)去三個(gè)月,公眾已經(jīng)被很好地普及了人工智能大模型。對千行百業(yè)來(lái)說(shuō),大模型的商用時(shí)機是否已經(jīng)到了?好的商用節奏應該是怎樣的?
朱勇:人工智能大模型對研發(fā)和應用范式的變革非常明確。越早擁抱大模型、理解大模型,越會(huì )讓它對業(yè)務(wù)產(chǎn)生作用。這不是Yes or NO的問(wèn)題。談到節奏,不同企業(yè)擁抱大模型的方式不一樣。有的企業(yè)可以從單點(diǎn)應用嘗試開(kāi)始,利用公有云調用服務(wù),這樣可以更低成本地快速驗證做Demo開(kāi)發(fā)。
另外一方面,無(wú)論是大小企業(yè),都要培養AI原生思維。比如一些應用可以通過(guò)漸進(jìn)式的方式進(jìn)行改造升級。另一種做法叫重構,按照百度公司內部的說(shuō)法,未來(lái)所有的產(chǎn)品都會(huì )基于大模型重新做一遍。
大模型市場(chǎng)出現泡沫了嗎?
《財經(jīng)》謝麗容:在面向企業(yè)的B端市場(chǎng)真的需要那么多大模型嗎?
侯震宇:我個(gè)人看法是,基礎大模型其實(shí)不需要那么多。當然,這只是從終局往前看。但在任何一個(gè)行業(yè)發(fā)展早期,市場(chǎng)會(huì )變得繁榮且存在泡沫。從產(chǎn)業(yè)發(fā)展的角度來(lái)看,我們應該允許現在有一定的泡沫。我們也應該正視這一點(diǎn)。但我仍然相信,在大浪淘沙之后,最終提供基礎模型服務(wù)的,仍然是為數不多的幾個(gè)企業(yè)。
朱勇:基礎大模型方向,雖然現在有很多玩家,但是真正能夠保持快速迭代,不斷開(kāi)發(fā)更全面、更完整工具鏈,不斷基于客戶(hù)反饋來(lái)提升產(chǎn)品能力,這是一件挺難的事情。所以大模型雖然現在可能很熱,但這是長(cháng)跑,最后會(huì )像今天的云計算格局一樣,市場(chǎng)會(huì )逐漸收斂。
《財經(jīng)》謝麗容:很多做服務(wù)器硬件的企業(yè)也要做行業(yè)大模型。百度曾經(jīng)是他們的客戶(hù),現在變成互相競爭。我們應該怎樣和平共處?
侯震宇:我覺(jué)得不能直接說(shuō)競爭,我們首先還是合作關(guān)系。雙方的確會(huì )有相近的服務(wù),同時(shí)面對相近的行業(yè),但我們和傳統硬件廠(chǎng)商更多還是互補關(guān)系。百度是一家互聯(lián)網(wǎng)基因的AI公司,積累了大量通用數據,有通用大模型,優(yōu)勢在A(yíng)I、軟件、科技等領(lǐng)域。傳統硬件廠(chǎng)商積累了行業(yè)數據,在傳統政企行業(yè)等垂直領(lǐng)域打磨出了Know-how。雙方在建大模型時(shí)的擅長(cháng)點(diǎn)不一樣。百度和新華三等企業(yè),既是服務(wù)器、交換機采買(mǎi)的合作伙伴,同時(shí)也會(huì )共建大模型。
《財經(jīng)》謝麗容:百度平時(shí)會(huì )關(guān)注競爭對手的大模型在哪些方面的進(jìn)展?
朱勇:第一,技術(shù)和整體效果。第二,配套工具。第三,商業(yè)模式。如果你再回到三四年前,人工智能市場(chǎng)還是比較遙遠,但今天深度學(xué)習的技術(shù)、產(chǎn)品商業(yè)化、投資、開(kāi)源生態(tài),都在加速發(fā)展。
《財經(jīng)》謝麗容:未來(lái)幾年,大模型會(huì )是百度核心的重點(diǎn)方向嗎?為什么?
侯震宇:大模型會(huì )是百度的核心重點(diǎn)方向。百度是一家AI公司,大模型是AI的重要發(fā)展方向。不管是在To C端,還是在To B端,它都將會(huì )給百度的產(chǎn)品、服務(wù)帶來(lái)巨大變化。對于百度來(lái)說(shuō),大模型讓人非常興奮,這既是機遇,也是挑戰。百度對大模型會(huì )持續投入,我相信大模型會(huì )讓云計算加速進(jìn)入AI時(shí)代,會(huì )重塑云計算格局,MaaS(Model as a Service)的地位會(huì )變的越來(lái)越重要,也會(huì )加速實(shí)現百度智能云提出的“云智一體”戰略和“AI普惠”理想。
《財經(jīng)》謝麗容:2016年開(kāi)始的上一輪人工智能商業(yè)化出現了一些問(wèn)題,AI企業(yè)不得不做很多繁瑣細碎的定制化項目。大模型要如何規避上一輪人工智能商業(yè)化遇到的問(wèn)題?
侯震宇:這一輪大模型產(chǎn)業(yè)落地,和十年前以深度學(xué)習為代表的AI產(chǎn)業(yè)落地是不一樣的。這是AI研發(fā)的新范式,和以前的投入不一樣。大模型出現之前,AI最被詬病、落地最難的是,實(shí)際產(chǎn)業(yè)環(huán)境場(chǎng)景碎片化。比如閘機的人臉識別、支付的人臉識別都不一樣。因為光線(xiàn)、環(huán)境不一樣,需要面向不同應用,根據客戶(hù)積累的數據從頭做訓練,再去拿到場(chǎng)景里做適配。這種定制化交付非常煩瑣。
但在基礎大模型下,不需要太多精調數據,不需要訓練太多輪數,就可以獲得非常好的結果?;A大模型解決眾多場(chǎng)景比以前容易很多。大模型的泛化能力比以前強很多。這和上一輪的AI落地不一樣。去年10億參數的模型,就叫大模型,但現在的模型參數動(dòng)輒上千億。在千億參數以上,才會(huì )有智能涌現,才會(huì )有更強的泛化能力,才能在各個(gè)場(chǎng)景下具備通用能力。
《財經(jīng)》謝麗容:當很多人都涌入到一個(gè)行業(yè)里的時(shí)候,泡沫可能不可避免。大模型如果要良性發(fā)展,有哪些建議?
侯震宇:對大模型從業(yè)者的建議是,量力而行。不一定全部都由自己去做。而是考慮AI商業(yè)化落地,找到最適合自身能力的場(chǎng)景和鏈條。我們希望行業(yè)在早期快速發(fā)展時(shí),允許有一定的泡沫。但政策對技術(shù)運用的監管、行業(yè)評價(jià)技術(shù)好壞的標準能達成共識。有標準可循,有規矩可依,這樣才能良性發(fā)展。
朱勇:還要轉變思維方式。大模型是分水嶺式的技術(shù)、顛覆式的技術(shù)。要保持開(kāi)放心態(tài)、持續學(xué)習。
本文作者:吳俊宇,來(lái)源:財經(jīng)十一人,原文標題:《三個(gè)月誕生79個(gè)基礎大模型,中國到底需要什么大模型?》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: