騰訊云正式發(fā)布向量數據庫,已應用于QQ瀏覽器、騰訊游戲等業(yè)務(wù)場(chǎng)景_全球簡(jiǎn)訊
(原標題:騰訊云正式發(fā)布向量數據庫,已應用于QQ瀏覽器、騰訊游戲等業(yè)務(wù)場(chǎng)景)
“每日調用量超千億次。”
【資料圖】
作者:涂鴉君 編輯:tuya 出品:財經(jīng)涂鴉
7月4日,騰訊云正式發(fā)布國內首個(gè)AI原生(AI Native)的自研向量數據庫(Tencent Cloud Vector DB),預計 8月上線(xiàn)騰訊云官網(wǎng)。
據介紹,該數據庫是騰訊自研、基于內部多年運營(yíng)積累的分布式向量數據庫,已經(jīng)過(guò)騰訊海量業(yè)務(wù)場(chǎng)景驗證,日均處理向量檢索千億次,支持標量+向量的混合檢索,具有高性能、大容量等特點(diǎn),支持全內存索引。主要面向大模型訓練,讓企業(yè)原先花一個(gè)月時(shí)間才能完成的大模型接入,縮短到三天時(shí)間。
天眼查App顯示,騰訊科技(深圳)有限公司于近日申請注冊?xún)擅丁癟ENCENT CLOUD VECTORDB”商標,國際分類(lèi)為科學(xué)儀器、網(wǎng)站服務(wù),當前商標狀態(tài)為申請中。
騰訊云數據庫副總經(jīng)理羅云指出,向量數據庫已經(jīng)在QQ瀏覽器、騰訊視頻、騰訊游戲、QQ音樂(lè )、搜狗輸入法等上百個(gè)業(yè)務(wù)場(chǎng)景應用,每日調用量超千億次。其中,支撐QQ音樂(lè )人均聽(tīng)歌時(shí)長(cháng)提升3.2%,QQ瀏覽器成本降低37.9%,騰訊視頻有效曝光人均時(shí)長(cháng)提升1.74%。
其還自研了分布式向量數據庫核心引擎Olama,原ElasticFaiss。據了解,Olama最早于2019年4月進(jìn)行孵化,目前可支持十億級別的單行向量數據索引、查詢(xún)QPS達到百萬(wàn)、響應延遲在20毫秒。
向量數據庫源自騰訊集團每日處理千億次檢索的向量引擎(OLAMA),單索引支持10億級向量規模,更適用于A(yíng)I運算、檢索,數據接入AI的效率也比傳統方案提升10倍。
針對大模型場(chǎng)景,向量數據庫在接入層、計算層、存儲層實(shí)現了全面AI化:在接入層,智能化支持自然語(yǔ)言文本的直接檢索;在計算層,通過(guò)AI算子替代企業(yè)尋找/調優(yōu)AI算法,將接入工期從一個(gè)月縮短到3天;在存儲層,融合智能壓縮算法,把向量存儲成本降低50%。
此外,騰訊云在6月19日首次公布了其行業(yè)大模型研發(fā)進(jìn)展,依托騰訊云TI平臺打造行業(yè)大模型精選商店,為客戶(hù)提供MaaS(Model-as-a-Service)一站式服務(wù),技術(shù)底座來(lái)自騰訊全棧能力,提供高性能計算集群HCC、高性能網(wǎng)絡(luò )、向量數據庫等基礎設施。
4月,騰訊云發(fā)布了專(zhuān)為大模型訓練設計的新一代HCC高性能計算集群,采用最新一代的騰訊云星星海自研服務(wù)器,具備業(yè)界最高的3.2Tbps互聯(lián)帶寬,算力性能提升3倍。
一直以來(lái),騰訊在產(chǎn)業(yè)互聯(lián)網(wǎng)中的定位是做產(chǎn)業(yè)的“數字化助手”,騰訊云作為中國云市場(chǎng)的頭部廠(chǎng)商,目前形成了四級加速框架,為產(chǎn)業(yè)輸出從底層算力支撐到AI開(kāi)發(fā)平臺、到AI產(chǎn)品解決方案、再到頂層數智化轉型方法的四級全鏈條服務(wù),是實(shí)現這一目標的重要動(dòng)力引擎。
展望未來(lái),“向量數據庫+大模型+數據”將產(chǎn)生“飛輪效應”,共同助力企業(yè)步入AI Native(AI原生)時(shí)代。騰訊云也將繼續打磨技術(shù)能力,提供更堅實(shí)的AI基礎設施。
關(guān)鍵詞: