国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

文字生成音樂(lè )!Meta剛剛發(fā)布了“音樂(lè )界的ChatGPT”,還是“開(kāi)源的”!-今日視點(diǎn)

從AI孫燕姿到MusicGen,從演唱到創(chuàng )作,AI已經(jīng)全面入侵音樂(lè )領(lǐng)域。

近日,Meta在Github上開(kāi)源了AI模型MusicGen,引發(fā)外界關(guān)注。

顧名思義,MusicGen是有一個(gè)音樂(lè )生成AI模型,可以根據文本和旋律提示創(chuàng )作音樂(lè )。


(資料圖)

該模型基于谷歌2017年推出的Transformer模型,并采用Meta的EnCodec編譯器將音頻數據分解為小單元處理。

上周晚些時(shí)候,Meta人工智能研究工程師Felix Kreuk在Twitter上展示了MusicGen的功能。

在視頻演示中,MusicGen分別將兩個(gè)古典音樂(lè )片段改編成80年代的流行音樂(lè )和現代嘻哈音樂(lè ),它還根據提示加入了樂(lè )器、電子音等元素。

根據Meta的介紹,MusicGen接受了20000小時(shí)的音樂(lè )訓練,相當于人不吃不喝不睡覺(jué)訓練833天。

該模型還使用了來(lái)自媒體內容服務(wù)商ShutterStock和Pond5 10000首“高質(zhì)量”授權音樂(lè )和390000首純音樂(lè )。

那么,練習時(shí)長(cháng)兩年半的MusicGen,夠格出道嗎?

Meta自己將MusicGen與市面上已有的音樂(lè )創(chuàng )作軟件MusicLM(谷歌旗下)、Riffusion以及Mousai進(jìn)行了比較。

對此,華爾街見(jiàn)聞挑選了其中三個(gè)例子:

提示1. 創(chuàng )作一首流行舞曲,要求旋律朗朗上口,加入熱帶打擊樂(lè )因素,節奏歡快,適合沙灘場(chǎng)景。

提示2. 編一首氣勢宏偉的管線(xiàn)交響樂(lè )曲,加入雷鳴般的打擊樂(lè )器、有史詩(shī)感的銅管樂(lè )和高昂的弦樂(lè ),創(chuàng )造一個(gè)適合英雄戰斗的電影背景音樂(lè )。

提示3. 創(chuàng )作一首經(jīng)典雷鬼音樂(lè ),加入電吉他獨奏。

不難聽(tīng)出,MusicGen的表現似乎更加驚艷。

據Meta稱(chēng),無(wú)論在與文本的匹配度上,還是在作曲的可信度上,MusicGen在四者之間的表現都更勝一籌。

為了驗證MusicGen是不是真有那么好,科技媒體Techcrunch記者Kyle Wiggers親身試用了MusicGen和MusicLM,對比兩位AI音樂(lè )家的作品。

先說(shuō)他的結論:

我得說(shuō),(MusicGen )還不至于讓人類(lèi)音樂(lè )家丟了工作,但它創(chuàng )作的音樂(lè )相當優(yōu)美,至少對于“環(huán)境音樂(lè )”這樣的基本提示語(yǔ)來(lái)說(shuō)是這樣,而且在我聽(tīng)來(lái),它與谷歌的AI音樂(lè )生成器MusicLM相比,不分伯仲(如果不是稍微好一點(diǎn)的話(huà))。

Wiggers先是拋出了一個(gè)簡(jiǎn)單的提示語(yǔ):爵士、電梯音樂(lè )。

MusicGen和MusicLM拿出了以下作品:

MusicGen

然后,Wiggers增加考試難度,AI創(chuàng )作一首低保真、慢節奏的Electro Chill(一種融合了電子音樂(lè )和放松氛圍的音樂(lè )風(fēng)格)音樂(lè ),要求使用自然、真實(shí)的聲音。

兩大模型作品如下:

對于第二個(gè)提示,Wiggers發(fā)現,MusicGen在音樂(lè )連貫性方面出人意料地勝過(guò)MusicLM,其作品很容易在YouTube上的一個(gè)音樂(lè )全天直播頻道Lofi Girl上找到來(lái)源。

最后,Wiggers嘗試讓MusicGen和MusicLM創(chuàng )作具有知名作曲家George Gershwin風(fēng)格的鋼琴小曲。

他發(fā)現,谷歌在MusicLM的公開(kāi)版本中嵌入了一個(gè)過(guò)濾器,阻止用戶(hù)提示特定藝術(shù)家,以保護作者版權。

相比之下,MusicGen就沒(méi)有這樣的過(guò)濾器,最終創(chuàng )作出了所謂George Gershwin風(fēng)格的鋼琴曲。

但在Wiggers看來(lái),這首曲子并沒(méi)有那么好。

值得一提的是,目前市面上存在許多文本、語(yǔ)音、圖片甚至是視頻生成模型,但優(yōu)質(zhì)的音樂(lè )生成模型少之又少。

根據在線(xiàn)科學(xué)預印本存儲庫arXiv中找到的研究文件,音樂(lè )生成的主要挑戰之一是需要運行全頻譜,這需要更密集的采樣,更不用說(shuō)復刻音樂(lè )的復雜結構和樂(lè )器的配合了。

MusicGen能否成為一款優(yōu)秀的音樂(lè )生成模型,還有待更多用戶(hù)的驗證。

用戶(hù)可以通過(guò)Hugging Face的API體驗MusicGen,但生成音樂(lè )可能需要一些時(shí)間,具體取決于同時(shí)在線(xiàn)的用戶(hù)數量。

目前,Meta尚未提供用于訓練模型的代碼,但提供了預訓練模型。

風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

關(guān)鍵詞: