美團收購光年之外,能否留住AI人才是關(guān)鍵 當前速讀
(原標題:美團收購光年之外,能否留住AI人才是關(guān)鍵)
【資料圖】
近日,美團宣布以20.65億元人民幣的價(jià)格,收購AI公司光年之外,引發(fā)了業(yè)界的廣泛關(guān)注。
王慧文與美團創(chuàng )始人王興是清華大學(xué)的同學(xué)兼室友,曾經(jīng)在創(chuàng )業(yè)道路上數度并肩作戰,被譽(yù)為互聯(lián)網(wǎng)圈的一段佳話(huà)。
此前,王慧文因健康原因,不得不中止了對光年之外AI事業(yè)的領(lǐng)導。
這次的收購,被很多人看成是王興對這位上鋪兄弟的“出手相救”。
來(lái)源:罐頭圖庫
不過(guò),除了個(gè)人情誼之外,光年之外本身在A(yíng)I領(lǐng)域的價(jià)值,自然也是美團此次收購的重要原因。
光年之外成立于2023年2月,由王慧文個(gè)人出資5000萬(wàn)美元,估值2億美元,王慧文曾表示,“個(gè)人肉身不占股份,75% 的股份用于邀請頂級研發(fā)人才”。并發(fā)布了“英雄帖”,聲稱(chēng)要打造“中國的OpenAI”。
那么,如此高調進(jìn)軍AI領(lǐng)域的光年之外,其真正技術(shù)實(shí)力究竟如何?被收購之后,其與美團又將在A(yíng)IGC領(lǐng)域,打開(kāi)怎樣的局面呢?。
01 收購下的收購
按照常理推斷,今年2月才成立的光年之外,注定在A(yíng)I技術(shù)上不會(huì )有太深厚的積累。
既然如此,決意向AGI進(jìn)軍的王慧文,就只能通過(guò)最“速成”的方式——收購,來(lái)增強自身團隊的技術(shù)實(shí)力。
王慧文在兩個(gè)月內完成技術(shù)人才團隊搭建,吸引了包括多名人工智能領(lǐng)域頂級專(zhuān)家和創(chuàng )業(yè)者的加入。其中最引人注目的是收購了有著(zhù)40多人規模的AI框架公司“一流科技”。
一流科技是一家專(zhuān)注于人工智能基礎設施軟件的研發(fā)工作的創(chuàng )新企業(yè),由清華袁進(jìn)輝博士于2017年創(chuàng )立。
師從清華人工智能研究院院長(cháng)張鈸的袁進(jìn)輝,不僅曾任微軟亞洲研究院主管研究員,獲得過(guò)多項國際專(zhuān)利,還提出了當時(shí)世界上最快的主題模型訓練算法系統LightLDA。
今年4月,光年之外完成收購一流科技,持有約46.52%股權,袁進(jìn)輝及輝煌合伙持有約34.63%及18.84%權益,到被美團收購時(shí),光年之外整個(gè)團隊規模已經(jīng)達到了70多人。
可以說(shuō),目前光年之外最主要的AI技術(shù),就是來(lái)自一流科技。
而要衡量一流科技在A(yíng)I領(lǐng)域的技術(shù)水平,我們不妨看看其親自研發(fā)的核心產(chǎn)品——OneFlow,這是一個(gè)對標TensorFlow、PyTorch及百度飛槳的深度學(xué)習框架。
如果要用一句話(huà),概括OneFlow對大模型的意義,那就是它可以使用更多的計算資源,加快訓練速度,提高模型性能,同時(shí)不受內存容量的限制。
這樣的特點(diǎn),主要歸功于OneFlow,靜態(tài)編譯和流式并行的核心理念和架構。
這樣的架構,簡(jiǎn)單來(lái)說(shuō),就是在運行前就會(huì )構建好一個(gè)完整的計算圖和數據流的表示,包括計算節點(diǎn)、數據節點(diǎn)、通信節點(diǎn)等,而非在運行時(shí)才根據輸入這些信息。
如此一來(lái),就可以有效地減少運行時(shí)的開(kāi)銷(xiāo),提高計算效率,降低大模型訓練所需的設備數量和通信量。
雖然,在當下的大模型競爭中,降低模型的訓練難度和成本,早已不是什么新穎的技術(shù),但OneFlow的獨特之處就在于:其不僅讓大模型訓練得更快,而且還讓大模型具備了更高的“易用性”。
而這樣的“易用性”,說(shuō)白了就是能讓?xiě)酶菀椎芈涞?,并支持更多的?chǎng)景,例如大規模人臉識別、廣告推薦大規模訓練等。
為實(shí)現這點(diǎn),OneFlow采用了數據并行與模型并行相結合的技術(shù)。
簡(jiǎn)單地說(shuō),就是可以將一個(gè)大的數據集切分到多個(gè)設備上,每個(gè)設備使用相同的模型參數進(jìn)行訓練,然后通過(guò)通信同步梯度,提高訓練速度和效率。
這樣的技術(shù),不僅解決了解決模型過(guò)大,無(wú)法放入單個(gè)設備的問(wèn)題,還能根據不同的用戶(hù)和場(chǎng)景,靈活地選擇最合適的并行方式,實(shí)現更高效的分布式訓練。
了解了這一切之后,我們再從整體上分析這次美團的收購事件,就可以從中窺見(jiàn),這樣的技術(shù),在美團目前的AI布局中,為何顯得至關(guān)重要。
02 并行訓練
要理解光年之外對美團的意義,我們就得先看看美團想用AI來(lái)做什么。
早在2020年的世界人工智能大會(huì )上,美團首席科學(xué)家、AI平臺部總經(jīng)理夏華夏首次公布了美團在A(yíng)I科技領(lǐng)域的布局和愿景。
夏華夏表示:“美團AI將以‘幫大家吃得更好,生活更好’為核心目標,致力于在實(shí)際業(yè)務(wù)場(chǎng)景需求上探索前沿的人工智能技術(shù),并將之迅速落地在實(shí)際生活服務(wù)場(chǎng)景中,完成線(xiàn)下經(jīng)濟的數字化?!?/p>
說(shuō)白了,就是以AI技術(shù)+海量真實(shí)數據,形成以美團AI為核心的智能化生活服務(wù)閉環(huán)。
來(lái)源:罐頭圖庫
但問(wèn)題是,“實(shí)際生活服務(wù)場(chǎng)景”,是一個(gè)涵蓋面很廣的概念,它包括了餐飲、外賣(mài)、酒店、旅游、電影、打車(chē)等。
這么多的場(chǎng)景,怎么用AI一攬子拿下?
美團給出的策略是“以場(chǎng)景驅動(dòng)技術(shù)”。
換句話(huà)說(shuō),美團有很多種不同的服務(wù),包括線(xiàn)下生活里的各種方面,有這些場(chǎng)景就有大量的數據,這些大量的數據可以反過(guò)來(lái)幫助美團人工智能算法不斷迭代、優(yōu)化,這些算法再幫助用戶(hù)在場(chǎng)景中得到更好的服務(wù)。
這實(shí)際上是一種以專(zhuān)有數據形成正循環(huán)的思路。
在這樣的整體布局中,一個(gè)能夠根據不同的用戶(hù)和場(chǎng)景,實(shí)現高效的分布式訓練的算法框架,就顯得尤為重要。
而這正是之前提到的OneFlow的并行訓練所具備的優(yōu)勢。
舉例來(lái)說(shuō),在美團外賣(mài)場(chǎng)景下,需求是與情境依存的,在不同的時(shí)間、空間以及其他更廣義的環(huán)境下,用戶(hù)需求、商家供給等都有顯著(zhù)區別。
這樣的情況,造成了外賣(mài)場(chǎng)景具有很強的地理位置和就餐文化約束,
比如工作日多為單人餐,以飯類(lèi)套餐、輕食、米線(xiàn)為主;而在周末,用戶(hù)會(huì )適當犒勞自己、兼顧家人,傾向于選擇更適合多人就餐的燒烤、韓國料理、火鍋。
某地區高消費用戶(hù)在工作日和周末的差異性就餐習慣
面對這種情況,以往的模型設計,比如用戶(hù)興趣建模,或者樸素的多層神經(jīng)網(wǎng)絡(luò ),都無(wú)法應對這些復雜的用戶(hù)、時(shí)間和地理環(huán)境糾纏在一起的情況。
雖然美團對此提出了“情境細分+統一模型”的思路,將用戶(hù)的行為序列按照不同的情境進(jìn)行劃分,然后用一個(gè)統一的模型,來(lái)對每個(gè)情境下的用戶(hù)行為進(jìn)行預測。
但這種大參數的統一模型,往往會(huì )導致訓練和預測的開(kāi)銷(xiāo)較大,影響推薦的效率和穩定性。
而OneFlow的框架,正好解決了這一痛點(diǎn)。
得益于數據并行與模型并行的技術(shù),OneFlow可以把一個(gè)大的模型切分成多個(gè)小的模型,分配到多個(gè)設備上,每個(gè)設備負責一部分模型的計算,然后通過(guò)通信傳遞中間結果,完成整個(gè)模型的計算。
如此一來(lái),OneFlow就不需要一個(gè)統一的模型,而是可以使用多個(gè)子模型來(lái)對不同細分群體的用戶(hù)行為進(jìn)行預測,并通過(guò)多任務(wù)學(xué)習和遷移學(xué)習,來(lái)實(shí)現不同情境間的知識共享和遷移,提高推薦的精準度和個(gè)性化程度。
從這個(gè)角度上說(shuō),OneFlow的技術(shù)對美團而言,無(wú)疑是一塊用在刀刃上的“好鋼”。
03 留住人才才是關(guān)鍵
盡管光年之外的加入,在技術(shù)層面上,為美團的AI生態(tài)注入了新的活力,然而,每一個(gè)技術(shù)的背后,其實(shí)都是人才的競爭。
可以說(shuō),正是這些人才的存在,才讓此次的收購真正具有了“價(jià)值”,而非僅僅是買(mǎi)來(lái)了一個(gè)徒有口號和情懷的空殼公司。
在此次的收購中,光年之外對美團最大的意義,就是帶來(lái)了原先一流科技頂尖的AI人才。
除了在深度學(xué)習有著(zhù)頗深造詣的袁進(jìn)輝博士外,一流科技的首席科學(xué)家張鈸,不僅是清華大學(xué)人工智能智能研究院院長(cháng)、而且還是中國計算機學(xué)會(huì )CCF終身成就獎獲得者,堪稱(chēng)中國人工智能領(lǐng)域的學(xué)界泰斗。
從這點(diǎn)來(lái)看,美團的科研隊伍正不斷壯大。
然而,在繁盛的表象之下,如何留住這些頂尖的人才,將是王興接下來(lái)的一個(gè)重大難題。
在這方面,百度與辛頓之間的往事,也許是一個(gè)很有啟發(fā)意義的例子。
弗里·辛頓(Geoffrey Hinton),在業(yè)內有“人工智能教父”之稱(chēng)
2012年,百度曾斥資4400萬(wàn)美元,試圖收購辛頓(人工智能三大泰斗之一)的初創(chuàng )公司——DNNresearch,想將這位學(xué)界泰斗納入自己麾下。
結果辛頓最終還是選擇了谷歌。
雖然錢(qián)是少了點(diǎn),但辛頓選擇了遵從內心——谷歌才是他想要的環(huán)境。
這樣的例子說(shuō)明了,對于A(yíng)I人才,尤其是頂尖的AI人才來(lái)說(shuō),錢(qián)永遠不是唯一考慮的因素。
能否為人才提供一個(gè)施展自身才華、理想的空間,能否使之認同企業(yè)的價(jià)值觀(guān),這都是能否留住人才的重要的因素。
在這點(diǎn)上,美團是否會(huì )表現得比其他企業(yè)更好?恐怕只有時(shí)間才能給出答案了。
關(guān)鍵詞: