国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

天天最新:黃仁勛:英偉達的 AI 算力,已經(jīng)「1 折」出售

身穿皮夾克的黃仁勛,站在藍色沖浪板上,擺了幾個(gè)沖浪的姿勢。

這不是美國「網(wǎng)紅節」VidCon,而是美國知名數據平臺 Snowflake 的開(kāi)發(fā)者大會(huì )上的一景。

當地時(shí)間 6 月 26 日,英偉達創(chuàng )始人黃仁勛和 Snowflake 公司 CEO Frank Slootman 就「如何把生成式 AI 帶給企業(yè)用戶(hù)」展開(kāi)探討。主持人則是前 Greylock 的 GP,現在是投資機構 Conviction 的創(chuàng )始人。


【資料圖】

在會(huì )上,相較于「東道主」Frank 職業(yè)經(jīng)理人式的老成持重,「皮衣教父」一如既往地語(yǔ)出驚人,不僅稱(chēng)雙方的合作是「要相愛(ài),不要戰斗」(We are Lovers,not Fighters),更開(kāi)玩笑說(shuō),為 Snowflake 提供的經(jīng)過(guò)訓練的模型,相當于給客戶(hù)「打了 1 折」。

當天,英偉達與 Snowflake 又共同放出大招:世界第一芯片公司與風(fēng)頭最勁的云數據平臺合作,推出共同合作。Snowflake 的用戶(hù)可以在數據不離開(kāi)平臺的前提下,直接利用英偉達的預訓練 AI 模型,在云平臺上對自己公司的數據進(jìn)行分析,開(kāi)發(fā)針對自己數據的「AI 應用」。

「目前的重大變革來(lái)自數據+AI 算法+計算引擎。通過(guò)我們的合作,我們的能夠將這三點(diǎn)帶到一起?!裹S仁勛講道。

Talking Points:

大語(yǔ)言模型+企業(yè)專(zhuān)屬數據庫=針對特定問(wèn)題的 AI 應用;以前是 Data going to Work,現在是 Work going to Data,讓計算去到數據所在之地,避免數據孤島;英偉達提供的預訓練模型,已經(jīng)是花費數千萬(wàn)美元、在英偉達 AI 工廠(chǎng)中訓練出來(lái)的,所以在 Snowflake 上調用計算引擎已經(jīng)「打了 0.5 折」;軟件 3.0 時(shí)代,基于模型、數據庫,企業(yè)能夠在幾天內搭建自己的專(zhuān)屬應用;未來(lái)企業(yè)能夠生產(chǎn)許多智能代理,并運行它們;對于企業(yè)來(lái)說(shuō),真正的難題是混合結構的、非結構化的數據,如何被調動(dòng)。這或許能夠帶來(lái)商業(yè)模式的更新。

以下為雙方對話(huà)主要內容,經(jīng)極客公園整理編輯:

01 談合作:把最好的計算引擎,帶給最有價(jià)值的數據

Frank:

NVIDIA 目前在歷史上發(fā)揮著(zhù)重要的作用。對于我們來(lái)說(shuō),能夠帶來(lái)數據和大型企業(yè)的關(guān)系。我們需要啟用這項技術(shù),以及讓整個(gè)服務(wù)堆棧來(lái)有效地使用它。我不想使用「天作之合」來(lái)形容,但是對于一個(gè)門(mén)外漢,是一個(gè)很好的機會(huì ),進(jìn)入到這扇機會(huì )的大門(mén)里。

黃仁勛:

我們是 lovers,而不是對手。我們要把世界上最好的計算引擎帶到世界上最有價(jià)值的數據?;叵脒^(guò)去,我已經(jīng)工作了很長(cháng)時(shí)間,但是還沒(méi)有那么老。Frank,你更老一些(笑)。

最近,由于眾所周知的原因,數據是巨大的,數據是寶貴的。它必須是安全的。移動(dòng)數據很困難,數據的引力真實(shí)存在。因此,對我們來(lái)說(shuō),把我們的計算引擎帶到 Snowflake 上要容易得多。我們的伙伴關(guān)系是加速 Snowflake,但它也是關(guān)于將人工智能帶到 Snowflake。

最核心的是,數據+人工智能算法+計算引擎的組合,我們的伙伴關(guān)系將所有這三件事結合在一起。令人難以置信的有價(jià)值的數據,令人難以置信的偉大的人工智能,令人難以置信的偉大的計算引擎。

我們可以一起做的事情,是幫助客戶(hù)使用他們的專(zhuān)有數據,并用它來(lái)編寫(xiě) AI 應用程序。你知道,這里的重大突破是,你第一次可以開(kāi)發(fā)一個(gè)大型語(yǔ)言模型。你把它放在你的數據前面,然后你與你的數據交談,就像你與一個(gè)人交談一樣,而這些數據將被增強到一個(gè)大型語(yǔ)言模型中。

大型語(yǔ)言模型加知識庫的組合等于一個(gè)人工智能應用。這一點(diǎn)很簡(jiǎn)單,一個(gè)大型的語(yǔ)言模型將任何數據知識庫變成一個(gè)應用程序。

想想人們所寫(xiě)的一切驚人的應用程序。它的核心始終是一些有價(jià)值的數據?,F在你有一個(gè)查詢(xún)引擎通用查詢(xún)引擎在前面,它超級智能,你可以讓它回應你,但你也可以把它連接到一個(gè)代理,這是 Langchain 和向量數據庫帶來(lái)的突破。將數據和大語(yǔ)言模型疊加的突破性的東西正在到處發(fā)生,每個(gè)人都想做。而 Frank 和我將幫助大家做到這一點(diǎn)。

02 軟件 3.0:建立 AI 應用,解決一個(gè)特定問(wèn)題

主持人:

作為投資者來(lái)看這種變化,軟件 1.0 是非常確定的代碼,由工程師按照功能寫(xiě)出來(lái);軟件 2.0 是用仔細收集的標記的訓練數據優(yōu)化一個(gè)神經(jīng)網(wǎng)絡(luò )。

你們在幫助人們撬動(dòng)軟件 3.0,這套基礎模型本身有令人難以置信的能力,但它們仍然需要與企業(yè)數據和自定義數據集合作。只是針對它們去開(kāi)發(fā)那些應用程序要便宜得多。

對于那些深入關(guān)注這個(gè)領(lǐng)域的人來(lái)說(shuō)有一個(gè)問(wèn)題,基礎模型是非常泛化,它可以做所有事情嗎?為什么我們需要自定義模型和企業(yè)數據呢?

Frank:

所以我們有非常泛化的模型,可以做詩(shī),處理《了不起的蓋茨比》的做摘要,做數學(xué)問(wèn)題。

但是在商業(yè)中,我們不需要這些,我們需要的是一個(gè) Copilot,在一個(gè)非常狹窄,但是非常復雜的數據集上獲得非凡的洞見(jiàn)。

我們需要了解商業(yè)模式和商業(yè)動(dòng)態(tài)。這樣的計算上不需要那么昂貴,因為一個(gè)模型并不需要在一百萬(wàn)件事情上接受訓練,只需要知道非常少的、但很深入的主題。

舉個(gè)例子。我是 Instacart 的董事會(huì )成員,我們一個(gè)大客戶(hù),像 DoorDash 和所有其他企業(yè)常面臨的問(wèn)題是,他們不斷增加營(yíng)銷(xiāo)費用,來(lái)了一個(gè)客戶(hù),客戶(hù)下了一個(gè)訂單,客戶(hù)要么不回來(lái),要么 90 天后回來(lái),這非常不穩定。他們把這稱(chēng)為流失客戶(hù)。

這是復雜問(wèn)題的分析,因為客戶(hù)不回來(lái)的原因可能有很多。人們想找到這些問(wèn)題的答案,它在數據中,不在一般的互聯(lián)網(wǎng)中,而且可以通過(guò)人工智能找出來(lái)。這就是可能產(chǎn)生巨大價(jià)值的例子。

主持人:

這些模型應該如何與企業(yè)數據互動(dòng)?

黃仁勛:

我們的戰略和產(chǎn)品是各種尺寸、最先進(jìn)的預訓練模型,有時(shí)你需要創(chuàng )建一個(gè)非常大的預訓練模型,以便它可以產(chǎn)生 prompt,來(lái)教更小的模型。

而較小的模型幾乎可以在任何設備運行,也許延遲非常低。然而它的泛化能力并不高,zero shot(零樣本學(xué)習)能力可能更有限。

因此,你可能有幾種不同類(lèi)型不同大小的模型,但在每一種情況下,你必須做監督的微調,你必須做 RLHF(人類(lèi)反饋的強化學(xué)習),以便它與你的目標和原則保持一致,你需要用矢量數據庫之類(lèi)的東西來(lái)增強它,所以所有這些都匯集在一個(gè)平臺上。我們有技能、知識和基本平臺,幫助他們創(chuàng )建自己的人工智能,然后將其與 Snowflake 中的數據連接起來(lái)。

現在,每個(gè)企業(yè)客戶(hù)的目標不應該是思考我如何建立一個(gè)大型的語(yǔ)言模型,他們的目標應該是,我如何建立一個(gè)人工智能應用程序來(lái)解決特定的問(wèn)題?那個(gè)應用可能需要 17 個(gè)問(wèn)題來(lái)做 prompt,最終得出正確的答案。然后你可能會(huì )說(shuō),我想寫(xiě)一個(gè)程序,它可能是一個(gè) SQL 程序,可能是一個(gè) Python 程序,這樣我就可以在未來(lái)自動(dòng)做這個(gè)。

你還是要引導這個(gè)人工智能,讓他最終能給你正確的答案。但在那之后,你可以創(chuàng )建一個(gè)應用程序,可以作為一個(gè)代理(Agent)24/7 不間斷地運行,尋找相關(guān)情況,并提前向你匯報。所以我們的工作就是幫助客戶(hù)建立這些人工智能的應用,這些應用是有安全護欄的、具體的、定制的。

最終,我們在未來(lái)都將成為智能制造商,當然雇用員工,但我們將創(chuàng )建一大堆代理,它們可以用 Lang Chain 類(lèi)似的東西來(lái)創(chuàng )建,連接模型、知識庫、其他 API,在云中部署,并將其連接到所有的 Snowflake 數據。

你可以規?;夭僮鬟@些 AI,并不斷地完善這些 AI。因此,我們每個(gè)人都將制造 AI、運行 AI 工廠(chǎng)。我們將把基礎設施放在 Snowflake 的數據庫,客戶(hù)可以在那里使用他們的數據,訓練和開(kāi)發(fā)他們的模型,操作他們的 AI,因此,Snowflake 將是你的數據存儲庫和銀行。

有了自己的數據金礦,所有人都將在 Snowflake 上運行 AI 工廠(chǎng)。這是目標。

03 「核彈」雖貴,直接用模型相當于「打 1 折」

黃仁勛:

我們在 NVIDIA 建立了有五個(gè) AI 工廠(chǎng),其中四個(gè)是世界前 500 名的超級計算機,另一個(gè)正在上線(xiàn)。我們使用這些超級計算機來(lái)做預訓練模型。因此,當你在 Snowflake 中使用我們的 Nemo AI 基礎服務(wù)時(shí),你將得到一個(gè)最先進(jìn)的預訓練模型,已經(jīng)有幾千萬(wàn)美元的費用投入其中,更不用說(shuō)研發(fā)投入了。所以它是預先訓練好的。

然后有一大堆其他的模型圍繞著(zhù)它,這些模型用于微調、RLHF。所有這些模型的訓練成本都要高得多。

因此,現在你已經(jīng)將預訓練模型適應于你的功能,適應于你的護欄,優(yōu)化你希望它具有的技能或功能類(lèi)型,用你的數據增強。因此,這將是一個(gè)更具成本效益的方法。

更重要的是,在幾天內,而不是幾個(gè)月。你可以在 Snowflake 開(kāi)發(fā)與你的數據連接的人工智能應用程序。

你應該能夠在未來(lái)快速建立人工智能應用程序。

因為我們現在看到它正在實(shí)時(shí)發(fā)生。已經(jīng)有一些應用能夠讓你和數據聊天,比如 ChatPDF。

主持人:

是的,在軟件 3.0 時(shí)代,95% 的培訓費用已經(jīng)由別人承擔了。

黃仁勛:

(笑)是的,95% 的折扣,我無(wú)法想象一個(gè)更好的交易。

主持人:

這是真正的動(dòng)力,作為投資人,我看到在分析、自動(dòng)化、法律等領(lǐng)域的非常年輕的公司,他們的應用已經(jīng)在六個(gè)月或更短的時(shí)間內實(shí)現了真正的商業(yè)價(jià)值。其中一部分原因是他們從這些預先訓練好的模型開(kāi)始,這對企業(yè)來(lái)說(shuō)是一個(gè)巨大的機會(huì )。

黃仁勛:

每家公司都會(huì )有數百個(gè),甚至 1000 個(gè)人工智能應用程序,只是與你公司的各種數據相連。所以,我們所有人都必須善于構建這些東西。

04 原來(lái)是數據找業(yè)務(wù),現在是業(yè)務(wù)找數據

主持人:

我一直從大企業(yè)參與者聽(tīng)到的一個(gè)問(wèn)題是,我們必須去投資人工智能,我們需要一個(gè)新的堆棧(Stack)嗎?應該如何考慮與我們現有的數據堆棧相連?

Frank:

我認為它在不斷發(fā)展。模型們正逐漸變得更簡(jiǎn)潔、安全、更好地被管理。所以,我們沒(méi)有一個(gè)真正明確的觀(guān)點(diǎn),這就是每個(gè)人都會(huì )使用的參考架構?有些人將有一些中央服務(wù)的設置。微軟有 Azure 中的人工智能版本,它們的很多客戶(hù)正在與 Azure 進(jìn)行互動(dòng)。

但我們不清楚什么模型將主導,我們認為市場(chǎng)將在使用難易、成本這些事上進(jìn)行自我排序?,F在僅僅是開(kāi)始,不是最終的狀態(tài)。

安全部門(mén)也會(huì )參與進(jìn)來(lái),關(guān)于版權的問(wèn)題會(huì )被革新?,F在我們對技術(shù)很著(zhù)迷,現實(shí)中的問(wèn)題也會(huì )被同時(shí)處理。

黃仁勛:

我們現在正經(jīng)歷 60 年來(lái)第一次根本性的計算平臺變革。如果你剛剛讀了 IBM System 360 的新聞稿,你會(huì )聽(tīng)到關(guān)于中央處理單元、IO 子系統、DMA 控制器、虛擬內存、多任務(wù)、可擴展計算向前和向后端兼容,而這些概念,實(shí)際都是 1964 年的東西,而這些概念幫助我們在過(guò)去六十年來(lái),不斷進(jìn)行 CPU 擴展。

這樣的擴展已經(jīng)進(jìn)行了 60 年了,但這已經(jīng)走到了盡頭?,F在大家都明白,我們無(wú)法再擴展 CPU 了,突然之間,軟件變化了。軟件的編寫(xiě)方式,軟件的操作方式,以及軟件能做的事情都與以前有很大的不同。我們稱(chēng)之前的軟件為軟件 2.0?,F在是軟件 3.0。

事實(shí)就是,計算已經(jīng)從根本上改變了。我們看到兩個(gè)基本的動(dòng)力在同時(shí)發(fā)生,這也是為什么現在事情正在發(fā)生劇烈震蕩。

一方面,你不能再不斷地購買(mǎi) CPU。如果你明年再買(mǎi)一大堆 CPU,你的計算吞吐量將不會(huì )增加。因為 CPU 擴展的終點(diǎn)已經(jīng)到來(lái)了。你會(huì )多花一大堆錢(qián),你不會(huì )得到更多的吞吐量。因此,答案是你必須去加速(英偉達加速計算平臺)。圖靈獎獲得者談到了加速,英偉達開(kāi)創(chuàng )了加速,加速計算現在已經(jīng)到來(lái)。

另一方面是,計算機的整個(gè)操作系統發(fā)生了深刻的改變。我們有一個(gè)叫 NVIDIA AI Enterprise 的層,而其中的數據處理、訓練、推理部署,整個(gè)現在已經(jīng)整合到或正在整合到 Snowflake 中,因此,從開(kāi)始數據處理,一直到最后的大模型部署,整個(gè)背后的計算引擎都被加速了。我們將賦能 Snowflake,在這里你將能夠做得更多,而且你將能夠用更少的資源做到更多。

如果你去任何一個(gè)云,你會(huì )看到 NVIDIA GPU 是其中最昂貴的計算實(shí)體。但是,如果你把一個(gè)工作負載放在上面,你會(huì )發(fā)現我們做得非???。就好像你得到了一個(gè) 95% 的折扣。我們是最昂貴的計算實(shí)體,但我們是最具成本效益的 TCO。

所以,如果你的工作是運行工作負載,可能是訓練大型語(yǔ)言模型,可能是微調大型語(yǔ)言模型,如果你想這樣做,一定要進(jìn)行加速。

加速每一個(gè)工作負載,這就是整個(gè)棧的重塑。處理器因此發(fā)生變化,操作系統因此不同,大的語(yǔ)言模型是不同的,你寫(xiě) AI 應用程序的方式是不同的。

未來(lái),我們都要寫(xiě)應用。我們都要把我們的 prompt 和我們的上下文,和少數幾個(gè) Python 命令連接起來(lái),連接到大語(yǔ)言模型和自己的數據庫或者公司的數據庫中,開(kāi)發(fā)自己的應用程序。每個(gè)人都將成為一個(gè)應用程序的開(kāi)發(fā)者。

主持人:

但不變的是,它仍然是你的數據。你仍然需要對它進(jìn)行微調。

Frank:

原來(lái)我們都覺(jué)得更快的總是更貴的。實(shí)際上突然之間,更快的是更便宜的,這是一種反直覺(jué)的東西。因此,有時(shí)人們想減少供應,以為這樣更便宜,結果卻更貴。

另一個(gè)與之前矛盾的是,原來(lái)都是數據去找業(yè)務(wù)(data going to work),而現在,業(yè)務(wù)去找數據 (work going to data)。過(guò)去的六十年,或者更多年,我們一直在讓數據去找業(yè)務(wù),這導致了大規模的信息孤島。而如果你想擁有一個(gè) AI 工廠(chǎng),用之前的做法將是非常困難的。我們必須把計算帶到數據所在的地方。我認為我們現在正在做的就是正確的方式。

05 企業(yè)如何獲得最快和最大的價(jià)值

Frank:

最快和獲得最大價(jià)值其實(shí)是兩個(gè)很不一樣的問(wèn)題。

最快的話(huà),你很快能夠看到,數據庫各處都上線(xiàn)了人工智能增強的搜索方式,因為這是最容易增加的功能?,F在,甚至一個(gè)文盲都能從數據中獲取有價(jià)值的信息,這真非常不可思議,這是終極的交互民主化。搜索功能極大增強,你就向主界面提一個(gè)問(wèn)題,它們可以把這些問(wèn)題帶到數據自己進(jìn)行查詢(xún)。這是掛在低處的果實(shí),最容易的,我們認為這是階段一。

接下來(lái),我們就開(kāi)始真正關(guān)注真正的難題,就是專(zhuān)有的企業(yè)數據,混合結構化的、非結構化的,所有這些,我們如何調動(dòng)這些數據?

我前面已經(jīng)提到了 to C 企業(yè)面臨的流失率問(wèn)題,供應鏈管理方面的問(wèn)題。當供應鏈特別復雜的時(shí)候,如果有一個(gè)事件發(fā)生了,我們如何重新調整一個(gè)供應鏈,使其運轉?我現在該怎么做?供應鏈是由很多不同的實(shí)體組成的,不是單一的企業(yè)。歷史上,這是一個(gè)從未被計算解決過(guò)的問(wèn)題。供應鏈管理從來(lái)沒(méi)有形成過(guò)一個(gè)平臺,它幾乎是一個(gè)電子郵件,電子表格形成的體系,除了一些小的例外。因此,這是極其令人興奮的。

或者我們可以重新計算大型的呼叫中心的投資,優(yōu)化零售的定價(jià),像我說(shuō)的,這是一個(gè)大企業(yè)的 CEO 們一直期待的重新定義商業(yè)模式,是真正的潛力。

06 對企業(yè)的建議:

黃仁勛:

我會(huì )問(wèn)自己,第一,什么是我唯一最有價(jià)值的數據庫?第二件事,我會(huì )問(wèn)自己,如果我有一個(gè)超級、超級、超級聰明的人,而企業(yè)的一切數據都經(jīng)過(guò)那個(gè)超級智能,我會(huì )問(wèn)那個(gè)人什么?

根據每個(gè)人的公司,這是不同的。Frank 的公司客戶(hù)數據庫非常重要,因為他有很多客戶(hù)。而我自己的公司,沒(méi)有那么多客戶(hù),但對我的公司而言,我的供應鏈超級復雜,而且我的設計數據庫也超級復雜。

對 NVIDIA 來(lái)說(shuō),沒(méi)有人工智能我們已經(jīng)無(wú)法建造出GPU。因為我們的工程師都不可能像AI那樣,為我們進(jìn)行大量的迭代和探索。因此,當我們提出人工智能的時(shí)候,第一個(gè)應用在我們自己的公司。而且,所以 Hopper(英偉達超算產(chǎn)品)不可能沒(méi)有人工智能的設計。

我們也會(huì )將我們自己的 AI 應用于我們自己的數據中。我們的錯誤數據庫就是一個(gè)完美的應用場(chǎng)景。如果你看一下 NVIDIA AI 的代碼量,我們有幾百個(gè)軟件包,結合在一起,支持一個(gè)應用程序能夠跑起來(lái)。我們現在正在努力的一些事情,就是如何使用 AI 去弄清楚如何給它打安全補丁,如何最好地維護它,這樣我們就可以不必干擾整個(gè)上層應用層的同時(shí),能夠向后端兼容。

這都是 AI 能夠為你提供答案的。我們可以用一個(gè)大語(yǔ)言模型去回答這些問(wèn)題,為我們找到答案,或者向我們揭示一些問(wèn)題,然后工程師就可以再將其修好?;蛘?AI 可以推薦一個(gè)修復方法,人類(lèi)工程師再去確認這是不是一個(gè)好的修復方法。

我覺(jué)得不是所有人都認識到了他們每天都在處理的數據里面,其實(shí)蘊含著(zhù)多少智能、洞見(jiàn)和影響力沒(méi)有被發(fā)掘。這就是為什么我們所有人都要參與進(jìn)來(lái),幫助帶來(lái)這樣的未來(lái)。

現在,你儲存在數據倉庫的數據,第一次可以被連接進(jìn)人工智能工廠(chǎng)。你將能夠生產(chǎn)信息情報,這是世界上最有價(jià)值的商品。你坐在一個(gè)自然資源的金礦上——你公司的專(zhuān)有數據,而我們現在把它連接到一個(gè)人工智能引擎上,另一端每天直接產(chǎn)生信息情報,以難以置信的情報量從另一端涌出,甚至在你睡覺(jué)時(shí)也在源源不斷地產(chǎn)出。這是有史以來(lái)最好的事情。

本文作者凌梓郡、Li Yuan,來(lái)自極客公園,原文標題:《黃仁勛:英偉達的 AI 算力,已經(jīng)「1 折」出售》

風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

關(guān)鍵詞: