在A(yíng)I領(lǐng)域更進(jìn)一步!Meta推出新款音頻和音樂(lè )生成式AI工具AudioCraft
8月2日周三,Meta推出一款新的面向音頻和音樂(lè )的名為AudioCraft的生成式AI工具,該工具可以幫助用戶(hù)根據文本提示創(chuàng )作音樂(lè )和音頻。
(資料圖片)
這款AI工具將AudioGen、EnCodec和MusicGen三種模型或技術(shù)融為一體,可用文本內容生成高質(zhì)量、近乎真人創(chuàng )作的音頻和音樂(lè )。
其中,MusicGen接受過(guò)Meta擁有的和特別授權的音樂(lè )訓練,可以從文本提示生成音樂(lè );AudioGen接受過(guò)公共音效訓練,可從文本提示生成音頻,比如模擬狗叫或腳步聲;再加上EnCodec編解碼器的改進(jìn)版本,用戶(hù)可以更高效率地生成更高質(zhì)量的音樂(lè )。
Meta稱(chēng),AudioCraft系列模型能夠產(chǎn)生具有長(cháng)期一致性的高質(zhì)量音頻,并且易于使用:
與該領(lǐng)域之前的工作相比,通過(guò)AudioCraft,我們簡(jiǎn)化了音頻生成模型的整體設計——為人們提供了使用Meta在過(guò)去幾年中開(kāi)發(fā)的現有模型的完整方法,同時(shí)也使他們能夠突破極限 并開(kāi)發(fā)自己的模型。
Meta指出,AudioCraft適用于音樂(lè )、聲音、音頻文件的壓縮和生成。因為它很容易構建和重用,所以想要構建更好的聲音生成器、壓縮算法或音樂(lè )生成器的人可以在同一個(gè)代碼庫中完成這一切,并在其他人所做的基礎上進(jìn)行構建。
Meta稱(chēng):
擁有堅實(shí)的開(kāi)源基礎將促進(jìn)創(chuàng )新并補充我們未來(lái)制作和聆聽(tīng)音頻和音樂(lè )的方式。通過(guò)更多的控制,我們認為MusicGen可以變成一種新型樂(lè )器——就像合成器首次出現時(shí)一樣。
所有Facebook用戶(hù)都可以安裝AudioCraft,Meta特別邀請研究人員和音樂(lè )專(zhuān)業(yè)人士使用這一工具:
我們將AudioCraft系列模型視為音樂(lè )家和聲音設計師提供靈感的工具,幫助人們快速集思廣益并以新的方式迭代他們的作品。 我們迫不及待地想看看人們用Audiocraft創(chuàng )造了什么。
Meta于2022年10月推出了其第一個(gè)版本的EnCodec,作為一種AI工具,用于在不損失音質(zhì)的情況下壓縮和解壓縮音頻文件,以便用戶(hù)快速輕松地共享音頻文檔。其目的是提高所有音頻文件的質(zhì)量,而不僅僅是音樂(lè )文件。當時(shí),它特別針對提高語(yǔ)音通話(huà)和語(yǔ)音消息的質(zhì)量,特別是在網(wǎng)絡(luò )連接不佳等不利情況下。此后該模型不斷發(fā)展,如今與AudioGen和SoundGen一起推出,作為一種工具,幫助合成聲音和音樂(lè )在實(shí)際播放時(shí)顯得更為真實(shí)。
雖然一些藝術(shù)家已經(jīng)采用人工智能生成工具來(lái)獲得更多創(chuàng )造力,但其他藝術(shù)家卻對侵犯版權持批評態(tài)度。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: