全球速看:BloombergGPT來(lái)了!金融大模型應用加快將帶來(lái)哪些產(chǎn)業(yè)鏈機遇?
近期根據彭博社最新發(fā)布的報告顯示,其構建迄今為止最大的特定領(lǐng)域數據集,并訓練了專(zhuān)門(mén)用于金融領(lǐng)域的LLM,開(kāi)發(fā)了擁有500億參數的語(yǔ)言模型——BloombergGPT。
受到消息影響,金證股份午后漲停,同花順漲超16%,頂點(diǎn)軟件直線(xiàn)拉升觸及漲停,古鰲科技、東方財富、財富趨勢均漲超10%。
這款金融大模型的應用將實(shí)現哪些驚人的功能?相關(guān)金融業(yè)公司是否將受益于大模型的應用而實(shí)現降本增效?產(chǎn)業(yè)鏈機遇有哪些?本文將詳細解析。
(資料圖片僅供參考)
金融大模型開(kāi)發(fā)與應用難度均不大
據《BloombergGPT: A Large Language Model for Finance》一文中所述, BloombergGPT和 OpenAI GPT模式一樣,也是基于 Transformer架構的,采用的是只有譯碼器的技術(shù)路線(xiàn)。通過(guò)比較, BloombergGPT模型參數為500億,在GPT-2 (1.5億)和GPT-3 (1750億)之間。
不同之處在于,為了加強 LLM對金融垂直領(lǐng)域的專(zhuān)業(yè)理解, Bloomberg構建了目前規模最大的金融數據集 FINPILE,通過(guò)對通用文本+金融知識的混合訓練,使得 BloombergGPT在執行金融任務(wù)方面的表現超過(guò)了現有的通用 LLM模型,而在通用場(chǎng)景方面的表現則與現有的通用 LLM模型基本持平。
GPT-3和GPT-4等大型語(yǔ)言模型都是由專(zhuān)業(yè)的人工智能團隊開(kāi)發(fā)出來(lái)的,而且模型的訓練對計算能力的要求很高。BloombergGPT的成功驗證了“開(kāi)放源代碼模型+優(yōu)質(zhì)垂直數據”的思路,為基于垂直數據構建大語(yǔ)言模型提供了可能。
大量的、高質(zhì)量的垂直領(lǐng)域知識可以彌補模型在規模上的不足。通過(guò)對 BloombergGPT和GPT-3的對比,雖然 BloombergGPT的模型參數相對于GPT-3來(lái)說(shuō)是比較小的,但是由于 BloombergGPT的預訓練數據增加了大量的高質(zhì)量的金融數據,并且對預訓練數據進(jìn)行了一系列的清洗和標注,所以 BloombergGPT在通用性和GPT-3基本持平的前提下,實(shí)現了對金融垂直能力的大幅提升。
算法方面,作者也有計劃披露他們訓練BloombergGPT的細節方法;算力方面,約使用512塊40GB的A100 GPU,在訓練過(guò)程中備份了4個(gè)模型,每個(gè)模型分了128塊GPU。從這個(gè)角度出發(fā)來(lái)看,無(wú)論是數據、算法、還是算力,國內頭部金融科技公司都是可復制、可追趕的。
金融GPT投資機遇或蓄勢待發(fā)
在 BloombergGPT的成功案例中,訓練數據是影響大規模語(yǔ)言模型性能的一個(gè)重要因素。
其原因主要有三點(diǎn):第一,在金融垂直領(lǐng)域的數據輸入中, BloombergGPT成功地形成了對金融知識的理解,變得更加專(zhuān)業(yè);二是 BloombergGPT模型的參數雖然有所縮減,但其通用性和垂直性依然很強,這說(shuō)明當參數尺度一定時(shí),高質(zhì)量的數據才是決定模型性能的關(guān)鍵因素;三是 Bloomberg在文章中明確表示,為了避免數據泄露, Bloomberg GPT將采用和 OpenAI一樣的封閉源碼,這也從側面證明了 Bloomberg GPT所擁有的原始源碼是各大模型爭奪的關(guān)鍵。
作為一家不以人工智能為核心的金融垂直領(lǐng)域企業(yè),Bloomberg為金融 GPT的發(fā)展提供了一個(gè)可借鑒的范例。金融 IT廠(chǎng)商擁有豐富的金融垂直知識和現有的人工智能產(chǎn)品布局,以高質(zhì)量的金融數據和開(kāi)源的大語(yǔ)言模型為基礎,同樣有機會(huì )打造出一個(gè)專(zhuān)屬于金融場(chǎng)景的大語(yǔ)言模型,從而實(shí)現大語(yǔ)言模型在金融場(chǎng)景中的有效賦能,讓大語(yǔ)言模型成為底層的人工智能操作系統。
在應用中,金融GPT落地場(chǎng)景有:
1)新聞的情緒傾向性分析和內容創(chuàng )造。它能幫助金融機構判斷市場(chǎng)對某一事件的看法,并幫助他們進(jìn)行量化策略、投資決策;
2)財務(wù)類(lèi)知識問(wèn)答和股票代碼配對。能夠輔助金融機構進(jìn)行信用評估,輔助投資人篩選新聞相關(guān)概念股,輔助分析師進(jìn)行領(lǐng)域知識學(xué)習,提升資料閱讀效率等。
3)財務(wù)報表分析和會(huì )計稽核的幫助.能夠輔助金融機構生成基礎的財務(wù)分析報告和招股書(shū),輔助投研人員報表配平,輔助會(huì )計和審計方面的工作。
很多中國的金融科技公司已經(jīng)在落地大模型的應用。
同花順在2015年前后便推出人工智能應用,在2019年更是選擇“All in AI”,公司目前的AI技術(shù)涵蓋自然語(yǔ)言處理技術(shù)、知識圖譜技術(shù)和虛擬人等六大技術(shù)。
恒生電子在公開(kāi)平臺上表示將充分挖掘對話(huà)式語(yǔ)言模型技術(shù)在金融業(yè)務(wù)場(chǎng)景中的應用潛力,通過(guò)集成“文心一言”的技術(shù)能力,在投研、投顧、營(yíng)銷(xiāo)、客服、運營(yíng)、風(fēng)控等金融各類(lèi)業(yè)務(wù)場(chǎng)景開(kāi)展人工智能大模型技術(shù)應用,為金融機構提供全場(chǎng)景人工智能解決方案及服務(wù),持續提升國內金融機構數智化發(fā)展水平。
國金證券建議關(guān)注同花順、恒生電子、財富趨勢、頂點(diǎn)軟件和凌志軟件等有金融大模型基礎的公司。
關(guān)鍵詞: