您现在的位置是:首页 > 互联网 > 正文
Meta推出语音生成人工智能模型Voicebox
发布时间:2023-07-11 10:58:26编辑:聂会山来源:
Meta开发了一种尖端的生成人工智能模型“Voicebox”,旨在彻底改变语音生成领域。
“我们开发了 Voicebox,这是第一个可以泛化到语音生成任务的模型,它没有经过专门训练来以最先进的性能完成,”Meta 在一篇博文中说。
据该公司称,Voicebox 可以生成各种样式的图像和文本,并且可以从头开始创建输出或修改提供给它的样本。
然而,Voicebox 不是创建图片或一段文本,而是生成高质量的音频剪辑。
该模型支持英语、法语、德语、西班牙语、波兰语和葡萄牙语等六种语言的语音合成,并执行噪声去除、内容编辑、风格转换和多样化样本生成。
此外,Meta 表示 Voicebox 使用一种新方法仅从原始音频和随附的转录中学习。
与音频生成的自回归模型不同,Voicebox 可以修改给定样本的任何部分,而不仅仅是给定音频剪辑的末尾。
此外,这家科技巨头表示,Voicebox 经过训练,可以在给定周围语音和片段的文字记录的情况下预测语音片段。
一旦模型学会了从上下文中填充语音,它就可以应用于广泛的语音生成任务,包括生成录音的部分内容,而无需重新创建整个录音。
这种多功能性使 Voicebox 能够在各种任务中表现良好,包括上下文文本到语音合成、跨语言风格转换、语音去噪和编辑以及多样化的语音采样。
标签:
猜你喜欢
- 竞技格斗游戏社区对其控制器的偏好非常挑剔
- 配备WATCH ULTRA造型的AIRPODS是最不寻常的苹果耳塞
- VIVO V29 5G手机评测
- Windows 11用户很快将能够卸载更多内置应用程序
- 三星 TV Plus 更新带来新设计 更多频道和音乐播放列表
- Artisight与合作伙伴Guthrie Clinic荣获著名的CHIME创新奖
- 3Dconnexion发布全新SpaceMouse Pro无线蓝牙版
- 您何时可以购买新款PlayStation 5 Slim
- Openserve今年推出了住宅光纤套餐可提供1Gbps的下载速度
- Airtel爱立信在5G网络上测试首个RedCap技术
- 摩托罗拉Edge 2023作为一款具有高级美感的中端设备上市
- Galaxy A52s 获得第二次 One UI 6.0 Beta 更新
- 苹果为AirPods提供高达50%的折扣但有一个问题
- Instagram现在允许你隐藏私信中的阅读状态
- Anker最新电池组首次发售内置USBC线
- 谷歌的新优惠查找器可帮助您在搜索和Chrome中获得超值折扣
- Windows 11 build 25977允许您在初始设置期间安装网络驱动程序
- 分析公司称明年全球IT支出将增长8%
- Finals公开Beta测试有一个临时登录队列同时会添加更多服务器
- 微软Teams很快将为公告帖子添加基于生成人工智能的自定义背景