首页 >> 要闻 >

Meta宣布推出新的人工智能可通过文本生成逼真的音乐和声音

2023-08-25 11:10:07 来源: 用户:宗政昭晴 

Meta发布了AudioCraft,这是一个全新的开源人工智能系统,允许用户通过文本提示生成原创音乐、音效和其他音频内容。

该系统由三个不同的人工智能模型组成,经过数千小时的音频数据训练。这些组件包括用于音乐生成的MusicGen、用于生成音效的AudioGen以及帮助训练模型的EnCodec。

MusicGen 可以根据描述情绪、乐器、节奏和其他品质的文本提示创建各种流派的器乐音乐。AudioGen 根据文本描述生成动物噪音、天气、机械声音等声音效果。

关键点是 EnCodec,它学习离散音频标记来为模型创建“固定词汇”。这简化了音频生成人工智能设计。

AudioCraft 系列模型能够产生具有长期一致性的高质量音频,并且易于使用。与该领域之前的工作相比,通过 AudioCraft,我们简化了音频生成模型的整体设计。

这些模型可以帮助游戏开发人员创建声音效果,并帮助营销团队制作商业配乐或效果。

尽管如此,随着人工智能使用他人作品生成的内容激增,围绕版权和补偿的问题仍然存在。

到目前为止,大多数模型都仅限于研究,例如 Google 的 MusicLM。Meta 认为,轻松访问创意音频 AI 将催生新的艺术形式和用例。该框架和模型可用于非商业研究和教育目的。

另一方面,Meta 通过这个项目继续在 AI 领域发展。6 月初,该公司发布了 Voicebox,旨在帮助创作者执行音频编辑、采样和风格化等语音生成任务,即使它没有经过专门的上下文学习训练。

此外,我们报道称,这家科技巨头正在开发各种类人聊天机器人,很快就能与用户交谈。这些聊天机器人可以使用角色来模拟与不同个体的对话。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章