国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

熱推薦:ChatGPT也會(huì )餓肚子?浪潮信息、拓爾思、博彥科技:我們來(lái)喂飯

前些天ChatGPT的崩潰,著(zhù)實(shí)讓廣大用戶(hù)體驗了一把AI軟件的“算力危機”。而事實(shí)上,除了算力危機外,ChatGPT一類(lèi)的人工智能聊天軟件,竟然也會(huì )有“餓肚子危機”,一旦陷入該危機,將出現有算力也給不出合適答案的情況。


【資料圖】

ChatGPT盡管并非生命體,不需要進(jìn)行生物學(xué)意義上的進(jìn)食以獲得營(yíng)養,但是其需要大量的數據來(lái)訓練,特別是語(yǔ)料,即一定數量的文本資源集合。有了這些語(yǔ)料的訓練,類(lèi)似于ChatGPT的人工智能軟件才能對用戶(hù)的信息做出正確的反應,并給出正確且語(yǔ)句通順的回復信息。

事實(shí)上,這些軟件吃得越飽,吃得越好,工作的效果一般也會(huì )越好。

大致明白了這類(lèi)軟件要吃的是什么之后,在我們的A股市場(chǎng),又有哪些公司,可以參與這項“做飯”的工作呢?

人民網(wǎng)、浪潮信息:食材提供者

“高端的食材,往往只需要最簡(jiǎn)單的烹飪方式”——《舌尖上的中國》第一季。

對于ChatGPT來(lái)說(shuō),什么是高端的食材?來(lái)看下面這個(gè)例子。

假如向ChatGPT提問(wèn):2022年,中央網(wǎng)信辦舉報中心指導全國各級網(wǎng)信舉報工作部門(mén)、主要網(wǎng)站平臺受理網(wǎng)民舉報色情、賭博、侵權、謠言等違法和不良信息1.72億件,如何看待這一數據?

食材1:不良網(wǎng)絡(luò )給人們的生活帶來(lái)的危害是多方面的。虛假信息往往使人上當受騙,不僅造成經(jīng)濟上的損失,而且還會(huì )給受害人帶來(lái)精神上的傷害。造謠傳[遙]會(huì )混淆是非,使人真假難辨,易引起思想混亂,影響社會(huì )和諧??傊?,不良網(wǎng)絡(luò )其社會(huì )危害性不可小覷。因此凈化網(wǎng)絡(luò )空間除了相關(guān)部門(mén)加大督察整治和打擊的力度外,對于各網(wǎng)站及我們每個(gè)人來(lái)說(shuō)也是責無(wú)旁[帶]的。

食材2:網(wǎng)絡(luò )違法和不良信息的出現與存在,是“冰凍三尺非一日之寒”,清除有害信息、根治頑瘴痼疾也很難一蹴而就。這就需要找準治理的重點(diǎn),平臺需要加大優(yōu)質(zhì)信息供給,多平臺、多渠道、多形態(tài)提供群眾需要的網(wǎng)絡(luò )內容及信息服務(wù),做到用正能量驅散負能量。使網(wǎng)絡(luò )空間清朗起來(lái),不是一時(shí)的事,而是一直的事,需要網(wǎng)上網(wǎng)下集眾智、匯合力,為文明辦網(wǎng)、文明用網(wǎng)、文明上網(wǎng)、文明興網(wǎng)保駕護航。

無(wú)論網(wǎng)上還是網(wǎng)下,無(wú)論大屏還是小屏,都沒(méi)有法外之地、輿論飛地。綜合運用法律、監管、平臺、技術(shù)等手段,堅決遏制各類(lèi)違法違規問(wèn)題,不斷提升網(wǎng)絡(luò )空間治理效能,做到利刃出鞘、精準打擊、發(fā)力增效、久久為功,讓網(wǎng)絡(luò )不良信息無(wú)處遁形,讓清風(fēng)正氣分外充盈。

是的,第一份食材出自一段普通的針對網(wǎng)絡(luò )有害信息的問(wèn)答,里面還有兩個(gè)明顯的錯別字,而第二份食材,則是出自人民網(wǎng)針對網(wǎng)絡(luò )有害信息的時(shí)評。而這,正是中央級別大型媒體的優(yōu)勢:盡管這些文字顯然還不能作為聊天機器人最終的答案,但如果語(yǔ)料更為優(yōu)質(zhì),后續加工出來(lái)的食糧需要的加工程序也會(huì )更少,輸出效果也會(huì )更佳。

不過(guò),中央級的媒體,也并非只有人民網(wǎng)一家,為何人民網(wǎng)會(huì )成為語(yǔ)料提供者的排頭兵呢?

答案就在人民網(wǎng),對于數字經(jīng)濟的布局。其中,特別是人民數據已經(jīng)布局了新型數據中心和新型算力中心,進(jìn)而人民網(wǎng)可以輕松地基于知識圖譜、自然語(yǔ)言處理和人工智能等技術(shù),深度挖掘自由的核心數據資源(優(yōu)質(zhì)語(yǔ)料等)。

圖片來(lái)源:人民網(wǎng)2022年半年報

自己擁有大量?jì)?yōu)質(zhì)語(yǔ)料,又有著(zhù)數據提供的布局,那自然而然,論優(yōu)質(zhì)語(yǔ)料,人民網(wǎng)是當仁不讓的食材提供商。

除了人民網(wǎng)之外,浪潮信息的源1.0,同樣是食材的寶庫,只不過(guò)相比于人民網(wǎng)來(lái)說(shuō),浪潮信息是以量取勝。

2021年9月28日,浪潮人工智能研究院在京發(fā)布全球最大規模人工智能巨量模型“源1.0”。“源”的單體模型參數量達2457億,超越美國OpenAI組織研發(fā)的GPT-3,成為全球最大規模的AI巨量模型。

這個(gè)模型的數據量大,并非是他適合作為原材料的理由,更重要的是,這款“源”是中文巨量模型,其蘊含的中文語(yǔ)料極為豐富,浪潮信息基于源1.0發(fā)布了4個(gè)技能大模型,對話(huà)模型源曉問(wèn)、問(wèn)答模型源曉搜、翻譯模型源曉譯、古文模型源曉文。這些模型,特別是有中文特色的對話(huà)、古文等模型,對于發(fā)展國內對標ChatGPT的智能聊天產(chǎn)品有著(zhù)至關(guān)重要的作用。

去年,浪潮“源1.0”大模型登頂CUGE(一款清華北大領(lǐng)銜的中文機器語(yǔ)言能力評測基準)總榜榜首,并獲得語(yǔ)言理解(篇章級)、語(yǔ)言生成、對話(huà)交互、多語(yǔ)言、數學(xué)推理等5項評測最佳成績(jì)。足見(jiàn)這款模型在中文語(yǔ)料領(lǐng)域強大的優(yōu)勢。

拓爾思、博彥科技:我們來(lái)做飯、喂飯

和做飯類(lèi)似,有了原材料,還需要一定的加工烹飪,才能成為真正的數據食糧,讓AI系統能夠學(xué)習、消化。

事實(shí)上,有專(zhuān)門(mén)的學(xué)科去做這塊的業(yè)務(wù)。自然語(yǔ)言處理(NLP,Natural Language Processing)是研究人與計算機交互的語(yǔ)言問(wèn)題的一門(mén)學(xué)科。按照技術(shù)實(shí)現難度的不同,這類(lèi)系統可以分成簡(jiǎn)單匹配式、模糊匹配式和段落理解式三種類(lèi)型

在A(yíng)股市場(chǎng),有不少公司擁有語(yǔ)料加工相關(guān)的業(yè)務(wù),而拓爾思正是其中之一。

2022年12月,拓爾思在接受券商調研時(shí)曾表示,公司作為國內最早從事自然語(yǔ)言處理(NLP)研發(fā)的企業(yè)之一,在NLP、知識圖譜、OCR、圖像視頻結構化領(lǐng)域都具備自主可控的底層技術(shù)。在A(yíng)IGC方面,公司圍繞傳媒、政府等垂直領(lǐng)域的語(yǔ)料庫積累已非常全面,在智能問(wèn)答、自動(dòng)寫(xiě)作或智能寫(xiě)稿、內容播報、創(chuàng )作智能輔助等方面亦有成熟應用場(chǎng)景。

更為重要的是,拓爾思已經(jīng)有專(zhuān)門(mén)的平臺,去做語(yǔ)義處理這個(gè)事情了,公司旗下“數家”平臺,已經(jīng)可以對語(yǔ)料數據進(jìn)行結構化分類(lèi)整合,而緊隨其后的“智語(yǔ)”平臺,則吸收了拓爾思在自然語(yǔ)言處理和信息檢索領(lǐng)域多年的技術(shù)積累,其已經(jīng)可以進(jìn)行分詞和詞性標注、語(yǔ)言分類(lèi)和語(yǔ)言聚類(lèi)等內容,可以說(shuō),拓爾思這些平臺已經(jīng)成為語(yǔ)言的加工廠(chǎng),經(jīng)過(guò)這些平臺的加工后,機器就可以通過(guò)這些機器人適配的語(yǔ)言進(jìn)行認知、學(xué)習了。

除了拓爾思,博彥科技在語(yǔ)言加工領(lǐng)域,也同樣有著(zhù)自己的業(yè)務(wù)。2月10日,博彥科技在投資者互動(dòng)平臺上稱(chēng),公司有智能聊天機器人方面的解決方案,有能力為機器提供語(yǔ)音訓練相關(guān)服務(wù)。

這句話(huà)也可以翻譯成:我可以,也很會(huì )給機器喂飯。

事實(shí)上,博彥科技在語(yǔ)料這條產(chǎn)業(yè)鏈中的地位,有點(diǎn)像醫藥中的CXO,客戶(hù)在研發(fā)過(guò)程中,可以將需要加工的語(yǔ)音、雜亂的語(yǔ)言文字等部分交給博彥科技,博彥科技憑借其經(jīng)驗和專(zhuān)業(yè)能力,進(jìn)行標注、歸類(lèi)。如果客戶(hù)有需要,公司也可以協(xié)助公司完成相關(guān)的機器語(yǔ)義訓練。

作為這一領(lǐng)域的老牌企業(yè),此前,博彥科技已與微軟合作了長(cháng)達二十多年,這也意味著(zhù)在機器訓練領(lǐng)域,博彥科技已積累了長(cháng)時(shí)間的經(jīng)驗,隨著(zhù)聊天機器人時(shí)代的到來(lái),博彥科技的相關(guān)訂單或將迎來(lái)爆發(fā)。

當然,筆者所列舉的食材提供者、加工者相關(guān)公司并不完全,實(shí)際上,除了這些公司,漢王科技、海天瑞聲、科大訊飛等公司在語(yǔ)料加工領(lǐng)域也有著(zhù)多年的技術(shù)積淀,但這些公司或前期漲幅過(guò)大,或總市值過(guò)大、涉及領(lǐng)域實(shí)在過(guò)多,在這里就不做重點(diǎn)介紹了。其實(shí)在語(yǔ)料加工領(lǐng)域,這些公司的業(yè)務(wù)也多集中于數據標注、模式化、訓練等內容,本質(zhì)上也是一個(gè)做飯的活。忽略二級市場(chǎng)因素的話(huà),事實(shí)上未來(lái)這些公司在語(yǔ)料加工領(lǐng)域,也有望有所作為。

可以看到的是,單單文字領(lǐng)域的機器學(xué)習,就需要一系列的基礎數據積累、加工、訓練等工序,這部分的市場(chǎng),隨著(zhù)類(lèi)ChatGPT軟件的不斷開(kāi)發(fā),將在未來(lái)幾年呈持續爆發(fā)之勢。想象空間十分廣闊。機器吃飯,產(chǎn)業(yè)鏈喂飯并享受豐厚回報的時(shí)代,或許真的要到來(lái)了。

關(guān)鍵詞: 博彥科技 浪潮信息