Meta推出一款新的面向音频和音乐的名为AudioCraft的生成式AI工具,该工具可以帮助用户根据文本提示创作音乐和音频,这款AI工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一体,可用文本内容生成高质量、近乎真人创作的音频和音乐。
8月2日周三,$Meta Platforms(META.US)$推出一款新的面向音频和音乐的名为AudioCraft的生成式AI工具,该工具可以帮助用户根据文本提示创作音乐和音频。
这款AI工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一体,可用文本内容生成高质量、近乎真人创作的音频和音乐。
(资料图)
其中,MusicGen接受过Meta拥有的和特别授权的音乐训练,可以从文本提示生成音乐;AudioGen接受过公共音效训练,可从文本提示生成音频,比如模拟狗叫或脚步声;再加上EnCodec编解码器的改进版本,用户可以更高效率地生成更高质量的音乐。
Meta称,AudioCraft系列模型能够产生具有长期一致性的高质量音频,并且易于使用:
与该领域之前的工作相比,通过AudioCraft,我们简化了音频生成模型的整体设计——为人们提供了使用Meta在过去几年中开发的现有模型的完整方法,同时也使他们能够突破极限 并开发自己的模型。
Meta指出,AudioCraft适用于音乐、声音、音频文件的压缩和生成。因为它很容易构建和重用,所以想要构建更好的声音生成器、压缩算法或音乐生成器的人可以在同一个代码库中完成这一切,并在其他人所做的基础上进行构建。
Meta称:
拥有坚实的开源基础将促进创新并补充我们未来制作和聆听音频和音乐的方式。通过更多的控制,我们认为MusicGen可以变成一种新型乐器——就像合成器首次出现时一样。
所有Facebook用户都可以安装AudioCraft,Meta特别邀请研究人员和音乐专业人士使用这一工具:
我们将AudioCraft系列模型视为音乐家和声音设计师提供灵感的工具,帮助人们快速集思广益并以新的方式迭代他们的作品。 我们迫不及待地想看看人们用Audiocraft创造了什么。
Meta于2022年10月推出了其第一个版本的EnCodec,作为一种AI工具,用于在不损失音质的情况下压缩和解压缩音频文件,以便用户快速轻松地共享音频文档。其目的是提高所有音频文件的质量,而不仅仅是音乐文件。当时,它特别针对提高语音通话和语音消息的质量,特别是在网络连接不佳等不利情况下。此后该模型不断发展,如今与AudioGen和SoundGen一起推出,作为一种工具,帮助合成声音和音乐在实际播放时显得更为真实。
虽然一些艺术家已经采用人工智能生成工具来获得更多创造力,但其他艺术家却对侵犯版权持批评态度。
编辑/Somer