中文字幕日韩欧美一区二区三区_AI時(shí)代數據就是金山銀山! 富達等機構的專(zhuān)有數據變得無(wú)比搶手

国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

隨著(zhù)世界各地的科技公司競相創(chuàng )建類(lèi)似ChatGPT的生成式人工智能服務(wù)，構建它們所需的“基礎原材料”——數據，突然間變得前所未有地搶手。

智通財經(jīng)APP了解到，富達投資(Fidelity Investments)就是這一趨勢的最新例子:這家全球財富管理巨頭的首席信息官Mihir Shah近日在接受媒體采訪(fǎng)時(shí)表示，科技初創(chuàng )企業(yè)和一些企業(yè)集團都在向這家財富管理巨頭示好，希望獲得其金融服務(wù)數據庫。

(資料圖)

對于那些尋求為金融服務(wù)行業(yè)構建生成式人工智能系統的科技公司來(lái)說(shuō)，富達數十年的線(xiàn)上交易記錄、客戶(hù)通話(huà)記錄以及面對面的客戶(hù)互動(dòng)報告將是一個(gè)巨大的寶藏。據悉，富達擁有大約8PB級別的數據——相當于數萬(wàn)億頁(yè)的印刷文本。

Mihir Shah表示，這家美國投資管理巨頭管理著(zhù)超過(guò)11萬(wàn)億美元的資金，擁有數千萬(wàn)級別的客戶(hù)，但該機構尚未與任何一家追求者接洽。Shah正在領(lǐng)導一項從富達數據中獲取價(jià)值的工作，他表示，該機構已經(jīng)在考慮建立自己的人工智能模型，盡管還沒(méi)有正式?jīng)Q定是否走這條路。他表示，該公司共享的任何數據都將被匿名化，并按照最佳安全級別措施去除個(gè)人信息。

ChatGPT等生成式AI提供的堪稱(chēng)全能的服務(wù)基于大語(yǔ)言模型或人工智能系統，這些模型或系統搜集和分析來(lái)自互聯(lián)網(wǎng)和其他來(lái)源的大量數據以及文字，以最終確定如何生成聽(tīng)起來(lái)像人類(lèi)寫(xiě)出的文本。隨著(zhù)企業(yè)紛紛尋求降低成本、更好地服務(wù)客戶(hù)的方法，這項技術(shù)在全球范圍內的各行各業(yè)引發(fā)了興奮情緒——從摩根大通到摩根士丹利等華爾街大型商業(yè)銀行都走在了AI科技前列，紛紛將生成式AI用于輔助業(yè)務(wù)。

ChatGPT的創(chuàng )造者OpenAI、谷歌母公司Alphabet Inc.和Meta Platforms Inc.都是該領(lǐng)域的技術(shù)領(lǐng)導者，其中OpenAI得到了微軟(Microsoft Corp.)的支持。他們大多使用幾乎相同的公開(kāi)數據來(lái)訓練他們的AI系統，最終以類(lèi)似人類(lèi)的方式理解文本，以及生成人類(lèi)通用的文本或代碼。

專(zhuān)屬于金融服務(wù)行業(yè)的LLM模型離問(wèn)世不遠了

但是，像富達所擁有的超大容量專(zhuān)項數據將使他們的人工智能服務(wù)在競爭中脫穎而出，Shah表示，他29年前開(kāi)始在富達工作，并監督其網(wǎng)站的建設，這是一家大型金融服務(wù)公司的第一個(gè)網(wǎng)站。他現在正在指導富達全公司范圍內的云數據倉庫的全面創(chuàng )建，以更好地利用這些數據。

Shah通過(guò)視頻表示:“區別在于將第一方數據與公共數據結合起來(lái)，為金融服務(wù)行業(yè)建立一個(gè)垂直的大語(yǔ)言模型?！薄拔覀円呀?jīng)看到，在科學(xué)研究和醫療保健行業(yè)出現了垂直的大語(yǔ)言模型?！?/p>

一般來(lái)說(shuō)，一個(gè)大語(yǔ)言模型的價(jià)值很大程度上取決于它所訓練的數據的數量和質(zhì)量。人工智能系統需要大量的文本、圖像、聲音和其他信息來(lái)學(xué)習人類(lèi)的模式和人類(lèi)世界的關(guān)系，從而可以基于它們生成內容。

開(kāi)發(fā)大語(yǔ)言模型的過(guò)程是比較復雜且技術(shù)極為密集。通常意義上的常用步驟包括：數據收集、數據預處理、模型選擇、訓練模型、微調模型、測試模型以及部署模型?？傊?，大語(yǔ)言模型的開(kāi)發(fā)需要開(kāi)發(fā)者具備一定的機器學(xué)習/深度學(xué)習、自然語(yǔ)言處理等相關(guān)技能和經(jīng)驗。同時(shí)，需要有大量的數據和計算資源作為支撐，才能開(kāi)發(fā)出高質(zhì)量、高效的模型。

Shah表示，富達的數據被認為非常有吸引力，以至于一些追求者提議為該公司免費建立一個(gè)人工智能系統，以換取合作。他表示，富達的很多數據都是相對最新的，是根據最新的合規要求在過(guò)去7年里所保存下來(lái)。據悉，富達擁有超過(guò)4,200萬(wàn)客戶(hù)，并且為數萬(wàn)家企業(yè)管理退休計劃和其他福利項目。

Shah還表示，在決定如何部署數據時(shí)，富達需要考慮到人工智能系統面臨的一些挑戰，如可靠性、信息偏見(jiàn)以及如何處理個(gè)人身份信息。他表示，與此同時(shí)，該公司正在采取措施加強其安全基礎設施，并進(jìn)一步限制具體哪些名單可以訪(fǎng)問(wèn)這些數據。

Shah還強調:“我們對這些新工具非常謹慎?！薄皩τ谏墒饺斯ぶ悄?，你不能完全相信其結果?！?/p>

邁入AI時(shí)代，數據就是“金山銀山”

隨著(zhù)OpenAI推出的ChatGPT和谷歌推出的Bard等以消費者應用為中心的生成式人工智能(AI)工具接連問(wèn)世，全球開(kāi)始邁入AI時(shí)代，現代化的人工智能程序開(kāi)始使用大語(yǔ)言模型(LLM模型)，在海量的數據基礎上訓練人工智能系統，其中的數據內容包括富達龐大的金融數據庫，推特和Reddit等網(wǎng)站上用戶(hù)生成的帖子等等。因此，如今掌握大量的數據資源，意味著(zhù)掌握開(kāi)發(fā)LLM模型的“原材料”。

隨著(zhù)全球開(kāi)始邁入AI時(shí)代，推特和Reddit顯然已嗅到數據庫帶來(lái)的巨大商機，已經(jīng)開(kāi)始收費，只有付費的客戶(hù)才有資格訪(fǎng)問(wèn)他們的數據內容。

在6月初，據媒體報道，有著(zhù)“美版貼吧”之稱(chēng)的社交媒體和新聞聚合網(wǎng)站Reddit要求開(kāi)發(fā)者支付數千美元才能直接訪(fǎng)問(wèn)該公司的數據和內容，此舉可能有助于該公司構建更多元化的營(yíng)收來(lái)源。根據一款名為Apollo的流行第三方應用程序的開(kāi)發(fā)者披露的帖子，該公司要求開(kāi)發(fā)者每5000萬(wàn)次請求支付1.2萬(wàn)美元。

特斯拉CEO埃隆·馬斯克私有化的推特于在2月份結束了免費的API系統，并引入了付費使用系統。推特在3月宣布對5000萬(wàn)次請求收取4.2萬(wàn)美元時(shí)，用戶(hù)和開(kāi)發(fā)者都感到憤怒。推特提供了三種套餐，其中最便宜的為：每月支付4.2萬(wàn)美元可以訪(fǎng)問(wèn)5000萬(wàn)條推文。套餐等級越高，研究人員或企業(yè)獲得的推文數量就越多：每月支付12.5萬(wàn)美元可以獲得1億條、每個(gè)月支付21萬(wàn)美元可以獲得2億條;每年最高等級收費高達250萬(wàn)美元。

關(guān)鍵詞：