国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

阿里版ChatGPT突然上線(xiàn)邀測!大模型熱戰正劇開(kāi)始,這是第一手體驗實(shí)錄

阿里正式加入ChatGPT戰局!

就在剛剛,阿里版類(lèi)ChatGPT突然官宣正式對外開(kāi)放企業(yè)邀測。


(資料圖片)

它叫通義千問(wèn),由達摩院開(kāi)發(fā)。

嗯,是大模型版十萬(wàn)個(gè)為什么那個(gè)味兒了。

事實(shí)上,早在這個(gè)月初,就傳出過(guò)不少阿里要推出類(lèi)ChatGPT的消息,不過(guò)普遍預期在11號左右。

而前幾天率先流出的天貓精靈“鳥(niǎo)鳥(niǎo)分?zhù)B”脫口秀版GPT,就是基于大模型的“壓縮版”,已經(jīng)以其驚艷表現把網(wǎng)友的胃口吊了起來(lái),讓眾人將目光投向阿里。

如今“正菜”提前上桌,自然一點(diǎn)即著(zhù),引爆輿論關(guān)注。

所以,這個(gè)阿里版ChatGPT“通義千問(wèn)”,究竟實(shí)力幾何?

咱們實(shí)測見(jiàn)真章。

調戲阿里版ChatGPT實(shí)錄

先來(lái)看看通義千問(wèn)的主要功能。

作為一個(gè)大語(yǔ)言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一樣“問(wèn)啥答啥”:

這里我們試一下官方給的撰寫(xiě)短文,看起來(lái)連語(yǔ)文老師常用的“總分總”也能理解:

又一個(gè)中文寫(xiě)作業(yè)神器(doge)

除了對話(huà)外,它還具備一個(gè)“百寶袋”功能,里面相當于一個(gè)工具箱,能快速生成各種指定類(lèi)型的文案:

話(huà)不多說(shuō),先從語(yǔ)言能力、上下文理解能力、代碼能力和數學(xué)能力四個(gè)方向,來(lái)測測模型的對話(huà)能力。

一、對話(huà)能力

語(yǔ)言能力

先來(lái)個(gè)最基礎的:“能穿多少穿多少”是什么意思?

不錯,解釋得比較清楚,還順便聊了一下自己對這句話(huà)的看法:

續寫(xiě)類(lèi)的創(chuàng )意寫(xiě)作,不但能模仿語(yǔ)氣,甚至還能創(chuàng )造懸疑,有點(diǎn)厲害喲~

接下來(lái)就輪到新一代AI benchmark弱智吧問(wèn)題了:怎么才能把夢(mèng)里的錢(qián)取到銀行卡里?

“在夢(mèng)里取錢(qián)是一種幻覺(jué)或想象”,謝謝你清醒俠。

還有更扎心的……“如果您經(jīng)常做夢(mèng)夢(mèng)到錢(qián),建議您睡前回顧一下自己的財務(wù)狀況,看看有什么不足之處”

雖然阿里的朋友稱(chēng),通義千問(wèn)主要是中文不錯,但我們叛逆一點(diǎn),看看這個(gè)中文大語(yǔ)言模型的其他語(yǔ)言水平怎么樣。

先不走尋常路,試試通義千問(wèn)的日語(yǔ)能力,給花澤香菜寫(xiě)一封情書(shū)。

看中文機翻似乎還不錯,這就把它寄給香菜,應該沒(méi)問(wèn)題吧?

再來(lái)試試英語(yǔ)。剛好前段時(shí)間有網(wǎng)友PK了一下Bard和GPT-4的Rap,我們也來(lái)看看通義千問(wèn)的說(shuō)唱能力。

這top,這stop,還給押上了!就是不知道姆爺認不認可

這個(gè)時(shí)候,通義千問(wèn)的回答就顯得有點(diǎn)嚴肅了。

當我們給出答案的時(shí)候,雖然通義千問(wèn)看出了這是個(gè)笑話(huà),但它并不覺(jué)得好笑,還很?chē)烂C地指正我們:這并不意味著(zhù)松下懼怕索尼。

不過(guò)我們發(fā)現,ChatGPT同樣一本正經(jīng)……這年頭的AI都這么正義么……

好,下一個(gè)試試它的上下文理解能力。

上下文理解能力

這部分說(shuō)白了就是多輪對話(huà)能力,考查通義千問(wèn)能不能準確提取上文的信息,用于下輪問(wèn)題的回答。

來(lái)聽(tīng)題:山東一縣一酒是真的嗎?

模糊掉山東試試?讓它列舉“這個(gè)省”幾個(gè)經(jīng)典的白酒牌子:

不錯。再試著(zhù)從最新的回答中追問(wèn)一下:

等等,“據史書(shū)記載”不會(huì )是編的資料吧?追問(wèn)×2:

代碼能力

接著(zhù),來(lái)試試它的代碼能力。整個(gè)計算器程序試試?

還不錯,實(shí)現了簡(jiǎn)單的四則運算。完整版代碼如下,感興趣的胖友們可以試試:

再讓它解釋一下自己寫(xiě)過(guò)的每一段代碼:

基礎編程能力,似乎問(wèn)題不大?

不過(guò),如果要讓通義千問(wèn)將解釋改寫(xiě)成注釋?zhuān)蜁?huì )出現一點(diǎn)神奇的bug。

雖然它給“Python”代碼標好了注釋?zhuān)鹊?,這不是最初的C++版代碼嘛!

(這何嘗不是一種NTR)

數學(xué)能力

最后來(lái)看看數學(xué)問(wèn)題。雞兔同籠,還不錯:

普通的計算題也沒(méi)什么問(wèn)題,還能精確到小數點(diǎn)后幾位:

巴特,高數題就不太行了,雖然它發(fā)現了這道題需要求導,但求解方法卻出了錯……

不過(guò)通義千問(wèn)也明確表示,無(wú)法保證在所有情況下給出正確的答案:

嗯…和GPT們一樣,大模型的數學(xué)能力都比較初級。

對話(huà)能力測得差不多,接下來(lái)再看看它的“場(chǎng)景能力”。

二、場(chǎng)景能力

雖然通義千問(wèn)“百寶袋”給出了不少功能,不過(guò)寫(xiě)提綱、描述商品這些都很常見(jiàn)了,我們就挑了三個(gè)比較有意思的來(lái)試試:菜譜生成、彩虹屁生成器和免費代寫(xiě)情書(shū)。

會(huì )放飛的菜譜

眾所周知,寫(xiě)菜譜是個(gè)技術(shù)活兒,既考驗上下文能力(說(shuō)過(guò)的材料都得用到),還得考考AI的理解菜名能力,做菜的步驟還不能太離譜。

示例的“清蒸鱸魚(yú)”,對AI來(lái)說(shuō)顯然太簡(jiǎn)單了。這不得整點(diǎn)游戲里奇怪的菜名給它試試?

先來(lái)一份《原神》里的飽腹感凝膠。

好家伙,竟然想到用現實(shí)中的魔芋粉來(lái)模仿飽腹感凝膠,這創(chuàng )意不錯。(不過(guò)卡路里粉是什么鬼,蛋白粉嗎?)

那么,同樣的菜再試試讓ChatGPT做一遍,你感覺(jué)哪個(gè)更好吃?

再給通義千問(wèn)來(lái)道加試題,讓它試試《星露谷物語(yǔ)》里面,用虛空蛋做的奇怪的小面包?

等等,真把虛空蛋放進(jìn)食譜了?而且還真的做了份面包出來(lái)!就是不知道口感如何……

照這樣看,游戲中的食譜都能給通義千問(wèn)還原一遍了,直接打破次元壁。

彩虹屁生成器

接下來(lái),再試試讓它生成一份彩虹屁。

硬生生把衣服上的油漬夸成了藝術(shù)品……

免費代寫(xiě)情書(shū)

最后,我們的測試以給野獸先輩寫(xiě)一份情書(shū)做結尾。

你感覺(jué)怎么樣?

好了,看了這么多五(奇)花(奇)八(怪)門(mén)(怪)的測評,你是不是也有點(diǎn)好奇通義千問(wèn)是怎么來(lái)的了?

通義千問(wèn)從何而來(lái)?

關(guān)于通義千問(wèn)的技術(shù)細節,阿里達摩院官方?jīng)]有透露詳細信息。

而通義千問(wèn)自己,是這么回答的:

訓練資料來(lái)自阿里巴巴達摩院,截止到2023年2月。訓練資料包括大量語(yǔ)言和文本數據,包括中英日法西班牙語(yǔ)多語(yǔ)種文本數據。

還提到自己是個(gè)能聯(lián)網(wǎng)的大語(yǔ)言模型。

不過(guò),我們實(shí)測了一下,發(fā)現千問(wèn)只是虛晃一槍?zhuān)傺b自己會(huì )上網(wǎng)(doge)。

實(shí)際上,當你單獨問(wèn)它今天天氣如何時(shí),通義千問(wèn)會(huì )承認它不能訪(fǎng)問(wèn)實(shí)時(shí)數據。

但如果你拋給它一個(gè)查詢(xún)天氣的網(wǎng)站,它就會(huì )假裝自己看到了網(wǎng)頁(yè)內容,然后一本正經(jīng)地胡謅一番。

此處應喊話(huà)阿里程序員:你家大模型是真的想上網(wǎng)了。

書(shū)歸正傳,盡管官方口徑低調,但正如ChatGPT脫胎于OpenAI的GPT系列,百度文心一言是自Ernie大模型發(fā)展而來(lái),阿里也是國內最早開(kāi)始研發(fā)大模型的技術(shù)大廠(chǎng)之一。

公開(kāi)資料顯示,2019年,阿里就已經(jīng)啟動(dòng)了中文大模型研發(fā)。當時(shí)阿里發(fā)布的語(yǔ)言大模型StructBERT超越谷歌、微軟、Facebook,登頂了CLUE榜單。

2021年,阿里先后發(fā)布了國內首個(gè)超百億參數多模態(tài)大模型M6,以及被稱(chēng)為“中文版GPT-3”的語(yǔ)言大模型PLUG。

其中,M6在多次迭代之后,實(shí)現了十萬(wàn)億級別的參數規模,并且M6和支付寶、淘寶的業(yè)務(wù)需求相結合,首個(gè)在國內實(shí)現了商業(yè)化落地。

PLUG的參數規模則為270億,是基于達摩院的兩種自研模型——語(yǔ)言理解模型StructBERT和語(yǔ)言生成模型PALM打造。

這一大模型初登場(chǎng),就以80.614分刷新了權威中文語(yǔ)言理解基準CLUE分類(lèi)任務(wù)榜單記錄。

在去年的WAIC(世界人工智能大會(huì ))上,阿里還發(fā)布了通義大模型系列。其中核心模型均已開(kāi)源開(kāi)放。

大模型時(shí)代,中國力量加速競逐

那么,你會(huì )給這個(gè)阿里版ChatGPT打幾分?

需要承認的是,相比于現在的業(yè)界標桿ChatGPT(GPT-4),通義千問(wèn)還有不少進(jìn)步空間。阿里方面也透露,根據內測反饋,這一大模型正在飛速迭代中。

此前,微軟被曝曾專(zhuān)門(mén)為ChatGPT砸下數億美元,打造由上萬(wàn)張英偉達A100組成的專(zhuān)用超算。而綜合各方消息來(lái)看,目前國內擁有這一數量級高性能顯卡的企業(yè)屈指可數,阿里是其中之一。

大模型時(shí)代,已經(jīng)形成行業(yè)共識的一點(diǎn)是,打造大模型,AI和云計算缺一不可。

而阿里,是全球少數在算法和算力上都有領(lǐng)先布局的公司之一。

除了本身在人工智能和大模型方面長(cháng)期的技術(shù)積累,背靠國內第一、亞洲第三的云廠(chǎng)商,阿里在算力方面也具備天然的優(yōu)勢。

ChatGPT這把火燒到如今,國內對具備足夠競爭力的國產(chǎn)生成式大模型的需求,正在與日俱增。

ChatGPT類(lèi)產(chǎn)品提升生產(chǎn)效率的潛力,已經(jīng)被不斷驗證。但與此同時(shí),前有ChatGPT大規模封號、亞洲成重災區,后有OpenAI因算力問(wèn)題停售ChatGPT Plus……

種種不確定因素,再一次凸顯了技術(shù)自研的價(jià)值。

所幸這次,我們的起跑線(xiàn),并沒(méi)有相差那么遠。

游戲不會(huì )在一夜間結束,而現在,競逐真正開(kāi)始。

本文來(lái)源:量子位,原文標題:《阿里版ChatGPT突然上線(xiàn)邀測!大模型熱戰正劇開(kāi)始,這是第一手體驗實(shí)錄》

風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

關(guān)鍵詞: