国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

您的位置：首頁(yè) > 產(chǎn)經(jīng) >

文字生成音樂(lè )！Meta剛剛發(fā)布了“音樂(lè )界的ChatGPT”，還是“開(kāi)源的”！-今日視點(diǎn)

來(lái)源：華爾街見(jiàn)聞 ? 2023-06-13 15:04:14

從AI孫燕姿到MusicGen，從演唱到創(chuàng )作，AI已經(jīng)全面入侵音樂(lè )領(lǐng)域。

近日，Meta在Github上開(kāi)源了AI模型MusicGen，引發(fā)外界關(guān)注。

顧名思義，MusicGen是有一個(gè)音樂(lè )生成AI模型，可以根據文本和旋律提示創(chuàng )作音樂(lè )。

(資料圖)

該模型基于谷歌2017年推出的Transformer模型，并采用Meta的EnCodec編譯器將音頻數據分解為小單元處理。

上周晚些時(shí)候，Meta人工智能研究工程師Felix Kreuk在Twitter上展示了MusicGen的功能。

在視頻演示中，MusicGen分別將兩個(gè)古典音樂(lè )片段改編成80年代的流行音樂(lè )和現代嘻哈音樂(lè )，它還根據提示加入了樂(lè )器、電子音等元素。

根據Meta的介紹，MusicGen接受了20000小時(shí)的音樂(lè )訓練，相當于人不吃不喝不睡覺(jué)訓練833天。

該模型還使用了來(lái)自媒體內容服務(wù)商ShutterStock和Pond5 10000首“高質(zhì)量”授權音樂(lè )和390000首純音樂(lè )。

那么，練習時(shí)長(cháng)兩年半的MusicGen，夠格出道嗎？

Meta自己將MusicGen與市面上已有的音樂(lè )創(chuàng )作軟件MusicLM（谷歌旗下）、Riffusion以及Mousai進(jìn)行了比較。

對此，華爾街見(jiàn)聞挑選了其中三個(gè)例子：

提示1. 創(chuàng )作一首流行舞曲，要求旋律朗朗上口，加入熱帶打擊樂(lè )因素，節奏歡快，適合沙灘場(chǎng)景。

提示2. 編一首氣勢宏偉的管線(xiàn)交響樂(lè )曲，加入雷鳴般的打擊樂(lè )器、有史詩(shī)感的銅管樂(lè )和高昂的弦樂(lè )，創(chuàng )造一個(gè)適合英雄戰斗的電影背景音樂(lè )。

提示3. 創(chuàng )作一首經(jīng)典雷鬼音樂(lè )，加入電吉他獨奏。

不難聽(tīng)出，MusicGen的表現似乎更加驚艷。

據Meta稱(chēng)，無(wú)論在與文本的匹配度上，還是在作曲的可信度上，MusicGen在四者之間的表現都更勝一籌。

為了驗證MusicGen是不是真有那么好，科技媒體Techcrunch記者Kyle Wiggers親身試用了MusicGen和MusicLM，對比兩位AI音樂(lè )家的作品。

先說(shuō)他的結論：

我得說(shuō)，（MusicGen ）還不至于讓人類(lèi)音樂(lè )家丟了工作，但它創(chuàng )作的音樂(lè )相當優(yōu)美，至少對于“環(huán)境音樂(lè )”這樣的基本提示語(yǔ)來(lái)說(shuō)是這樣，而且在我聽(tīng)來(lái)，它與谷歌的AI音樂(lè )生成器MusicLM相比，不分伯仲（如果不是稍微好一點(diǎn)的話(huà)）。

Wiggers先是拋出了一個(gè)簡(jiǎn)單的提示語(yǔ)：爵士、電梯音樂(lè )。

MusicGen和MusicLM拿出了以下作品：

MusicGen

然后，Wiggers增加考試難度，讓AI創(chuàng )作一首低保真、慢節奏的Electro Chill（一種融合了電子音樂(lè )和放松氛圍的音樂(lè )風(fēng)格）音樂(lè )，要求使用自然、真實(shí)的聲音。

兩大模型作品如下：

對于第二個(gè)提示，Wiggers發(fā)現，MusicGen在音樂(lè )連貫性方面出人意料地勝過(guò)MusicLM，其作品很容易在YouTube上的一個(gè)音樂(lè )全天直播頻道Lofi Girl上找到來(lái)源。

最后，Wiggers嘗試讓MusicGen和MusicLM創(chuàng )作具有知名作曲家George Gershwin風(fēng)格的鋼琴小曲。

他發(fā)現，谷歌在MusicLM的公開(kāi)版本中嵌入了一個(gè)過(guò)濾器，阻止用戶(hù)提示特定藝術(shù)家，以保護作者版權。

相比之下，MusicGen就沒(méi)有這樣的過(guò)濾器，最終創(chuàng )作出了所謂George Gershwin風(fēng)格的鋼琴曲。

但在Wiggers看來(lái)，這首曲子并沒(méi)有那么好。

值得一提的是，目前市面上存在許多文本、語(yǔ)音、圖片甚至是視頻生成模型，但優(yōu)質(zhì)的音樂(lè )生成模型少之又少。

根據在線(xiàn)科學(xué)預印本存儲庫arXiv中找到的研究文件，音樂(lè )生成的主要挑戰之一是需要運行全頻譜，這需要更密集的采樣，更不用說(shuō)復刻音樂(lè )的復雜結構和樂(lè )器的配合了。

MusicGen能否成為一款優(yōu)秀的音樂(lè )生成模型，還有待更多用戶(hù)的驗證。

用戶(hù)可以通過(guò)Hugging Face的API體驗MusicGen，但生成音樂(lè )可能需要一些時(shí)間，具體取決于同時(shí)在線(xiàn)的用戶(hù)數量。

目前，Meta尚未提供用于訓練模型的代碼，但提供了預訓練模型。

風(fēng)險提示及免責條款市場(chǎng)有風(fēng)險，投資需謹慎。本文不構成個(gè)人投資建議，也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資，責任自負。

關(guān)鍵詞：