字節的野心:做大模型時(shí)代的“軍火商”
字節跳動(dòng)謹慎邁出了跨入大模型賽道的第一步。
6 月 28 日下午,字節旗下的火山引擎召開(kāi)發(fā)布會(huì ),首次正式公布在大模型領(lǐng)域的研發(fā)布局和合作進(jìn)展,并發(fā)布大模型服務(wù)平臺火山方舟,提供模型訓練、推理、評測、精調等全方位功能與服務(wù)。
【資料圖】
此前,百度、阿里、騰訊、商湯、360 等國內大廠(chǎng)已經(jīng)相繼宣布入局,大部分的做法都是發(fā)布一個(gè)通用大模型或者數個(gè)行業(yè)大模型底座,行業(yè)客戶(hù)可以基于這些基礎模型和自身?yè)碛械男袠I(yè)數據精調,打造一個(gè)服務(wù)自身業(yè)務(wù)的 AI 應用。
但字節的切入方式與其他大廠(chǎng)有明顯的不同。火山?jīng)]有發(fā)布自己的通用大模型或者行業(yè)大模型,火山方舟聚合了一批第三方生產(chǎn)商開(kāi)發(fā)的大模型底座。
火山引擎向大模型生產(chǎn)商提供構建、訓練大模型基座所必須的算力和工具體系,并將這些生產(chǎn)商的大模型聚集到自己的 MaaS 平臺,供應給企業(yè)使用。這與微軟投資算力供給 OpenAI,并基于后者開(kāi)發(fā)的 GPT 模型向企業(yè)提供 Azure AI 云服務(wù),有相似之處。
因此,火山引擎介紹的合作案例也與其他大廠(chǎng)有所差異。這場(chǎng)發(fā)布會(huì )上登臺的合作伙伴,包括英偉達這樣的上游顯卡供應商,以及智譜 AI、百川智能、IDEA 等當下國內第一梯隊的大模型開(kāi)發(fā)商。而其他大廠(chǎng)的發(fā)布會(huì ),介紹的往往主要是金融、文旅、企服等各行各業(yè)的合作伙伴。
火山引擎總裁 譚待
截至今年 5 月,國內已公開(kāi)披露的大模型數量達到 79 個(gè)。按照火山引擎總裁譚待的說(shuō)法,未來(lái)大模型市場(chǎng)一定不會(huì )是一家或者幾個(gè)寡頭壟斷,而是一個(gè)百花齊放的多模型市場(chǎng),會(huì )有少數幾個(gè)超級大模型,多個(gè)通用大模型,和更多行業(yè)/垂直大模型。
企業(yè)使用大模型,未來(lái)也會(huì )呈現「1+N」的模式,除了通過(guò)自研或深度合作,形成 1 個(gè)主力模型;由于成本和場(chǎng)景復雜多元等原因,在這個(gè)主力模型之外,還會(huì )有 N 個(gè)模型同時(shí)應用。
大模型開(kāi)啟了新一輪行業(yè)變革,在這個(gè)淘金時(shí)代,OpenAI、谷歌、MiniMax、百川智能等大模型生產(chǎn)商是時(shí)代浪尖的淘金者。而火山引擎要做的,就是要在大模型時(shí)代「賣(mài)鏟子」。
01?火山引擎大模型?服務(wù)平臺——火山方舟
會(huì )上,火山引擎發(fā)布了自己的 MaaS 平臺——火山方舟。
火山引擎總裁譚待在會(huì )后接受媒體采訪(fǎng)時(shí)強調:火山方舟最終服務(wù)的是模型的應用方;火山引擎是跟大模型的生產(chǎn)方合作,一部分被精選的大模型廠(chǎng)商在火山方舟上部署,然后對外提供服務(wù)。
想讓企業(yè)用戶(hù)和大模型生產(chǎn)商加入到火山方舟的生態(tài)體系,首先要解決的是數據安全的問(wèn)題。
火山引擎總裁譚待認為,企業(yè)使用大模型,最擔心的是數據泄露;如果將大模型私有化部署,企業(yè)將承擔更高的成本,模型生產(chǎn)方也會(huì )擔心知識資產(chǎn)安全?!富鹕椒街邸沟氖滓蝿?wù),就是做好大模型使用者、提供者和云平臺可以互相信任的安全保障。
據火山引擎智能算法負責人吳迪介紹,「火山方舟」已上線(xiàn)了基于安全沙箱的大模型安全互信計算方案,利用計算隔離、存儲隔離、網(wǎng)絡(luò )隔離、流量審計等方式,實(shí)現了模型的機密性、完整性和可用性保證,適用于對訓練和推理延時(shí)要求較低的客戶(hù)。
安全沙箱示意圖
此外,「火山方舟」還在探索基于 NVIDIA 新一代硬件支持的可信計算環(huán)境、基于聯(lián)邦學(xué)習的數據資產(chǎn)分離等多種方式的安全互信計算方案,更全面地滿(mǎn)足大模型在不同業(yè)務(wù)場(chǎng)景的數據安全要求。
第二,想要讓企業(yè)可以更高效地打造AI 大模型應用。一方面要降低企業(yè)用戶(hù)使用大模型打造應用的門(mén)檻,另一方面也要降低用戶(hù)使用大模型服務(wù)的成本。
上文提到,火山引擎認為未來(lái)企業(yè)使用大模型會(huì )呈現「1+N」的模式,也就是 1 個(gè)自研主力模型+N 個(gè)小模型同時(shí)應用。比如一個(gè)對話(huà)式的 AI 服務(wù)產(chǎn)品,對話(huà)功能的基礎是源自企業(yè)自研的大模型,但提供文生圖、文生視頻、特定語(yǔ)種翻譯,或者回答醫療、金融等專(zhuān)業(yè)領(lǐng)域的問(wèn)題時(shí),卻可以調用其他的小模型。
這樣做最大的好處是降低模型的推理成本。吳迪稱(chēng),訓練大模型很昂貴,但是從長(cháng)期來(lái)看,模型的推理開(kāi)銷(xiāo)會(huì )超過(guò)訓練開(kāi)銷(xiāo)。效果和成本的矛盾永遠存在,降低推理成本會(huì )是大模型應用落地的重要因素,「一個(gè)經(jīng)過(guò)良好精調的中小規格模型,在特定工作上的表現可能不亞于通用的、巨大的基座模型,而推理成本可以降低到原來(lái)的十分之一?!?/p>
舉例來(lái)說(shuō),微軟以醫學(xué)文章數據精調了生物領(lǐng)域的 BioGPT-Large 模型,僅有 15 億參數,其在 PubMedQA 基準測試中的準確率卻優(yōu)于有著(zhù)上千億乃至數千億參數的大型通用語(yǔ)言模型。
但對企業(yè)來(lái)說(shuō),「1+N」模式的一大痛點(diǎn)就在于開(kāi)發(fā)應用的過(guò)程中,需要調用各種不同的大模型。而火山方舟提供的第一個(gè)功能就是模型廣場(chǎng),不僅集成了大量的第三方大模型,企業(yè)自身開(kāi)發(fā)的大模型也可以通過(guò)這個(gè)平臺進(jìn)行管理。
吳迪介紹,企業(yè)可以用統一的工作流對接多家大模型,對于復雜需求可設置高級參數、驗證集、測試集等功能,再通過(guò)自動(dòng)化和人工評估直觀(guān)對比模型精調效果,在不同業(yè)務(wù)場(chǎng)景里還可靈活切換不同的模型,實(shí)現最具性?xún)r(jià)比的模型組合。這些自定義指標和評估數據的積累,將成為企業(yè)在大模型時(shí)代寶貴的數據資產(chǎn)。
02火山引擎的大模型「朋友圈」
火山引擎暢想的前景非常理想,但要做到有一個(gè)前提,就是大大小小的大模型開(kāi)發(fā)商需要聚集到火山引擎。數據安全是他們愿意接入火山引擎的必要條件,但顯然不會(huì )是充分條件。火山引擎吸引大模型開(kāi)發(fā)商合作的基礎,在于其掌握的算力資源,也就是過(guò)去囤積的大量GPU。
去年 ChatGPT 發(fā)布后,國內 AI 算力緊張已經(jīng)算是行業(yè)半公開(kāi)的秘密,而字節跳動(dòng)擁有國內最豐富的算力資源。
據《晚點(diǎn) LatePost》報道,字節今年向英偉達訂購了超過(guò) 10 億美元的 GPU(約合 70 億元人民幣),到貨和沒(méi)到貨的 A100 與 H800 總計有 10 萬(wàn)塊。而 2022 年全年,英偉達數據中心 GPU 在中國的銷(xiāo)售總額大約為 100 億元,也就是說(shuō),僅字節一家公司今年的訂單可能已接近英偉達去年在中國銷(xiāo)售的商用 GPU 總和。
大部分團隊沒(méi)有條件購買(mǎi)大量 GPU 訓練大模型,從火山引擎采購算力也就不足為奇。而對火山引擎來(lái)說(shuō),大模型生產(chǎn)商發(fā)展越好,業(yè)務(wù)量越大,反過(guò)來(lái)就需要購買(mǎi)更多的算力。所以在這方面,大模型生產(chǎn)商和火山引擎有著(zhù)相同的訴求。
今年 4 月,火山引擎宣布與國內 70% 的大模型生產(chǎn)商達成合作,原因也在于此。
「火山方舟」首批大模型合作伙伴
會(huì )上,火山引擎重點(diǎn)介紹了第一批加入火山方舟的大模型,包括百川智能、出門(mén)問(wèn)問(wèn)、復旦大學(xué) MOSS、IDEA 研究院、瀾舟科技、MiniMax、智譜等多家 AI 科技公司及科研院所的大模型,并已啟動(dòng)邀測。
而首批邀測的企業(yè),則包括金融、汽車(chē)、消費等眾多行業(yè)的客戶(hù)。北京銀行 CIO 龔偉華表示,大模型與客戶(hù)營(yíng)銷(xiāo)、辦公協(xié)同、數據智能的結合,在金融應用場(chǎng)景有巨大潛力。北京銀行將與「火山方舟」合作,在算力優(yōu)化、模型精調等方面展開(kāi)研究,共同推動(dòng)金融風(fēng)控、營(yíng)銷(xiāo)等模型應用落地。
除了第三方的客戶(hù),吳迪介紹,在火山方舟平臺推向市場(chǎng)之前,已經(jīng)利用眾多的內部產(chǎn)品打磨和改進(jìn)平臺。字節跳動(dòng)有10 余個(gè)業(yè)務(wù)線(xiàn)正在探索接入和試用,在代碼糾錯等研發(fā)提效場(chǎng)景,文本分類(lèi)、總結摘要等知識管理場(chǎng)景,以及數據標注、歸因分析等方面探索,利用大模型能力促進(jìn)降本增效。
但是,對于這些內部嘗試何時(shí)面向用戶(hù),吳迪向極客公園表示:還需要一些時(shí)間,把大模型應用好是一個(gè)需要長(cháng)周期打磨的事。
火山引擎總裁譚待進(jìn)一步補充:有一些應用對用戶(hù)是無(wú)感知的,因為它是在已有的環(huán)境中去提升效率,而不是像 ChatGPT 這種大模型原生應用,用戶(hù)能明顯感知到是一個(gè)大模型來(lái)做這個(gè)事情。比如客服這個(gè)場(chǎng)景,回答時(shí)需要檢索知識庫,但現在通過(guò)大模型去給它一些提示,但跟你對話(huà)的還是那個(gè)對應的客服,只是它的效率高了。
03?字節跳動(dòng)的下一步
目前來(lái)看,字節/火山布局大模型第一階段的思路已經(jīng)非常清晰。
從商業(yè)上看,火山引擎就是賣(mài)水賣(mài)鏟子的思路。憑借火山引擎的技術(shù)體系,加上此前算力資源的積累,做管道和前期的底層服務(wù)應該是沒(méi)有任何問(wèn)題,所以在這個(gè)階段把基礎工具開(kāi)放出來(lái),幫助大家做好大模型,或者更直接說(shuō),從收益上的考量,這個(gè)階段發(fā)布技術(shù)體系工具比發(fā)布大模型的收益值更高。
但有一個(gè)很重要的問(wèn)題是:今天賣(mài)鏟子的字節,未來(lái)會(huì )不會(huì )下場(chǎng)淘金?
答案是肯定的。譚待告訴極客公園,其內部也有團隊在研發(fā)大模型。如果做好了,也會(huì )上到方舟平臺對外提供。此前字節副總裁楊震原也曾向財新回應:字節跳動(dòng)對大模型也在做一些學(xué)習和研究,現在還沒(méi)有什么結果,也沒(méi)有大模型產(chǎn)品落地時(shí)間表。
但這存在一個(gè)問(wèn)題,就是如何平衡自家大模型和其他第三方的關(guān)系。對此,譚待表示,自家的模型只會(huì )是眾多模型中的一個(gè),其余的是客戶(hù)自己的選擇,不需要火山來(lái)平衡,一個(gè)企業(yè)未來(lái)一定會(huì )在多個(gè)場(chǎng)景用多個(gè)模型,因為每個(gè)模型在不同場(chǎng)景的性?xún)r(jià)比是不一樣的,這會(huì )是一個(gè)開(kāi)放的市場(chǎng)。
正式入局后,不少行業(yè)人士看好火山引擎在大模型領(lǐng)域的市場(chǎng)份額會(huì )在接下來(lái)一段時(shí)間快速飆升,原因主要有三個(gè):
第一是因為基礎需求。字節本身在云服務(wù)這個(gè)層面是國內用量排在前三的公司,就算火山引擎,最終只是為了服務(wù)字節這一個(gè)生意而建,它的收益和投入產(chǎn)出比都是相當可觀(guān)的。第二是產(chǎn)品能力。字節這套體系迭代出來(lái)的產(chǎn)品工具向外傳遞,在云服務(wù)里的積累和產(chǎn)品化的能力會(huì )非常的強,從這個(gè)維度來(lái)說(shuō),對于很多中小開(kāi)發(fā)者,甚至有體系的開(kāi)發(fā)者是很有吸引力的。第三是因為生態(tài)系統成熟。字節本身在云服務(wù)這套體系并不是只做了火山引擎,字節在上下游的廣告分發(fā)、基礎設施建設,開(kāi)發(fā)工具等維度都有完善和成熟的生態(tài)鏈,甚至早幾年還收購了開(kāi)發(fā)者社區。有著(zhù)可靠的基礎體系,完整的工作鏈條和生態(tài)社區。過(guò)去字節布局國內云服務(wù)市場(chǎng)的痛點(diǎn),在于起步較晚,飛書(shū)要挑戰已經(jīng)成熟的釘釘、企業(yè)微信,而云服務(wù)的特點(diǎn)就是前期獲客難,但獲客后由于用戶(hù)遷移成本太高,所以輕易不會(huì )更換。
今天的大模型是一條全新的賽道,所有云服務(wù)廠(chǎng)商又回到了同一起跑線(xiàn),對于想要打開(kāi)云服務(wù)市場(chǎng)的字節和火山而言,這也是十年難得一遇的機遇。
本文作者:宛辰,來(lái)源:極客公園,原文標題:《字節的野心:做大模型時(shí)代的「軍火商」》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: