全球快消息!金融人又慌了?ChatGPT解鎖新用法:破解美聯(lián)儲“謎語(yǔ)”,預測股票走勢
生成式AI風(fēng)暴來(lái)襲,ChatGPT會(huì )搶走金融分析師的飯碗嗎?
好消息是,像ChatGPT這樣的產(chǎn)品很可能無(wú)法通過(guò)CFA考試,敲開(kāi)通往大型金融機構的大門(mén),但壞消息是,它們能取得經(jīng)濟學(xué)和法學(xué)學(xué)位,在一定程度上可以取代初級賣(mài)方分析師。
【資料圖】
最新證據來(lái)自最近公布的兩篇學(xué)術(shù)論文,研究人員用ChatGPT解讀美聯(lián)儲聲明中的“鷹鴿”含量,以及新聞對于股票是利好還是利空。
結果顯示,ChatGPT表現得相當不錯,不僅超越了傳統分析方法,還打敗了其他現有生成式AI模型對手。?
破解美聯(lián)儲“謎語(yǔ)”,ChatGPT遙遙領(lǐng)先
4月10日,里士滿(mǎn)聯(lián)儲量化監督和研究小組的兩位成員發(fā)表了題為《ChatGPT能否破譯美聯(lián)儲講話(huà)》的論文,測試GPT-3模型從美聯(lián)儲講話(huà)中判斷其態(tài)度的能力。
兩位研究人員隨機抽取FOMC公告中的500 個(gè)句子,然后由人類(lèi)判斷是“鴿派”“基本鴿派”“中性”“基本鷹派”還是“鷹派”,對應數字分別為-1、-0.5、0、0.5和1。
這里值得一提的是,研究人員使用五個(gè)分類(lèi)而非三個(gè)(“鴿派”中性“鷹派”),是為了測試GPT能否辨別美聯(lián)儲表態(tài)中的細微差別。
為提高人類(lèi)參照組的精確度,這些句子由三名人類(lèi)審核員獨立打標簽,計算每個(gè)標簽下對應句子的數量,再取三個(gè)結果的平均值。
與ChatGPT一起參加考試的還有其他神經(jīng)網(wǎng)絡(luò )語(yǔ)言模型(NLP),包括谷歌Bert大模型,金融情緒詞典Loughran & McDonald(LM)、 Henry以及日常語(yǔ)言情緒詞典Mohammad和Turney。
測試分成兩部分。研究人員先是讓機器考生在不進(jìn)行樣本學(xué)習的情況下參加測試,然后,又讓它們學(xué)習400個(gè)句子的分類(lèi)之后再處理剩下的100個(gè)句子。
結果顯示,無(wú)論是否“裸考”,ChatGPT對美聯(lián)儲講話(huà)的態(tài)度解讀在所有機器考生中是最貼近人類(lèi)的。
先來(lái)看“裸考”的結果。
GPT-3打出的標簽與人類(lèi)最為匹配,尤其是“鴿派”、“基本鷹派”和“鷹派”標簽。
Bert大大高估了“鴿派”句子的數量,情緒詞典則大大低估了“鴿派”或“基本鷹派”“鴿派”句子的數量。
為縮小研究結果的誤差,研究人員又計算了結果的平均絕對誤差(MAE)、均方根誤差(RMSE),比較準確度和Kappa系數(用于一致性檢驗的指標)。
研究人員還采用了F1分數和均衡準確率(均為機器學(xué)習模型評估指標)來(lái)進(jìn)一步提高研究的準確度。
結果顯示,GPT-3成績(jì)遙遙領(lǐng)先其他機器。
它產(chǎn)生的MAE和RMSE誤差值最小,準確度和Kappa系數最高,就連F1分數和均衡準確率也大多高于其他機器。
Bert模型雖然表現不及GPT-3,但好于情緒詞典。
接下來(lái)再看充分學(xué)習后的考試成績(jì)。
不出所料,GPT-3又是第一名,且成績(jì)明顯提高。
其中最亮眼的是,MAE誤差值幾乎是“裸考”成績(jì)的一半,精確度提高了近 1.5 倍,Kappa系數增加了一倍以上。
GPT-3的表現確實(shí)驚艷。
以美聯(lián)儲2013年5月的一份聲明中的措辭為例。
美聯(lián)儲表示:“總的來(lái)說(shuō),最近幾個(gè)月勞動(dòng)力市場(chǎng)狀況有所改善,但失業(yè)率仍然居高不下?!?/p>
ChatGPT的分類(lèi)是“基本鴿派”,與分析師的結果完全一致。
研究人員驚嘆道:
撇開(kāi)分類(lèi)不談,GPT模型能夠解釋為什么某個(gè)句子要以某種方式被標記,這是一種超越任何現有NLP模型的能力,對研究人員來(lái)說(shuō)意義非凡。
報告最后,研究人員將GPT-4與GPT-3進(jìn)行了比較,發(fā)現在多數情況下,前者在“破譯”美聯(lián)儲講話(huà)方面有著(zhù)更強的能力。
以下面的句子為例,美聯(lián)儲說(shuō):
鑒于目前通脹率低于2%,委員會(huì )將仔細監測實(shí)現通脹目標的進(jìn)展。
GPT-3將其判為“中性”,而GPT-4則判為“基本鴿派”,更接近分析師給予的“鴿派”分類(lèi)。
還能預測股價(jià)?
來(lái)自佛羅里達大學(xué)的兩位研究人員近期公布了一篇題為《ChatGPT可以預測股價(jià)走勢嗎?回報的可預測性和大型語(yǔ)言模型》的論文。
這項研究基本上就是,讓ChatGPT去判斷新聞對于公司股價(jià)是利好、利空還是無(wú)關(guān),研究人員根據ChatGPT解讀出的結果,來(lái)預測公司股票價(jià)格的走勢。
這實(shí)際上與解碼美聯(lián)儲聲明的研究大同小異。
研究人員提示ChatGPT:
假裝你是金融專(zhuān)家,是具有股票推薦經(jīng)驗的金融專(zhuān)家。如果以下新聞是好消息,請回答“是”,如果是壞消息,請回答“否”,如果不確定,請回答“未知”。
然后,研究人員要求ChatGPT用一句話(huà)簡(jiǎn)要說(shuō)明該消息在短期/長(cháng)期對于某公司的股價(jià)是好還是壞。
研究人員將ChatGPT的回答轉化為相應的數字,“是”“否”和“未知”分別對應1、-1和0。如果某家公司某一天有多條大新聞,研究人員將把這些數字進(jìn)行平均計算。
最后,研究人員通過(guò)ChatGPT打出的分數分析第二天的股票回報,并對其打分進(jìn)行線(xiàn)性回歸分析。
注意,研究使用的數據是2021年晚些時(shí)候之后的,因為這段時(shí)間的數據是ChatGPT大數據訓練中不包括的。
以甲骨文的一條新聞為例:
Rimini Street(企業(yè)軟件產(chǎn)品和服務(wù)提供商)在甲骨文的案件中被罰款63萬(wàn)美元。
這一新聞是利好還是利空甲骨文?
ChatGPT的回應:
是(對應的數字為1),對Rimini Street的罰款可能會(huì )增強投資者對甲骨文保護其知識產(chǎn)權的信心,并增加對其產(chǎn)品和服務(wù)的需求。
因此,ChatGPT認為這一消息對甲骨文股價(jià)有利。
相比之下,Ravenpack 給出的負面情緒評分為-0.52,表明該新聞被認為是利空的。
研究最終發(fā)現,ChatGPT打出的情緒分數與股票走勢在統計意義上具有較強的相關(guān)性。不過(guò),GPT-1、GPT-2 和Bert等更基礎的模型則無(wú)法準確預測。
結果還表明,ChatGPT 模型在預測股市回報方面優(yōu)于RavenPack等現有的情緒分析方法。
基于這一結果,研究人員認為,未來(lái)的研究應關(guān)注理解大語(yǔ)言模型(LLM)獲得預測能力的機制。
通過(guò)確定像ChatGPT這樣的模型成功預測股票回報的因素,研究人員可以開(kāi)發(fā)更有針對性的策略來(lái)改善這些模型,并最大化它們在金融領(lǐng)域的效用。
【4.22上海線(xiàn)下大師課報名】人工智能科學(xué)家劉志毅深度解讀邁向AGI時(shí)代的生產(chǎn)力革命和產(chǎn)業(yè)級投資!
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: