英伟达称Fugatto AI模型可生成“前所未闻的声音”
更新时间:2024-11-27 00:15 浏览量:6
Fugatto(或“基础生成音频转换器Opus 1”)是一种人工智能工具,可以使用任何文本和音频文件组合来生成或转换任何声音、音乐和语音组合。
英伟达博文表示:“例如,Fugatto可以根据文本提示创建音乐片段,从现有歌曲中删除或添加乐器,改变声音的口音或情感——甚至让人发出以前从未听过的声音。”
英伟达认为,Fugatto支持多种音频生成和转换任务,是第一个展示出新兴特性(源于各种训练相互作用的能力)以及融合自由形式指令能力的基础生成式AI模型。
英伟达应用音频研究经理Rafael Valle表示:“Fugatto是我们迈向未来的第一步,未来音频合成和转换的无监督多任务学习将源于数据和模型规模。”
Valle指出,音乐制作人可以使用Fugatto快速制作歌曲原型或编辑歌曲创意,测试不同的风格、声音和乐器,或者添加效果并改善现有曲目的整体音质。
英伟达表示,该工具的用途不仅限于音乐。广告公司可以使用Fugatto针对性开展广告活动,在画外音中加入各种不同的口音和情绪。而游戏公司可以使用该工具修改预先录制的音频,以便随着玩家的游戏进程改变动作。
Fugatto的发布是在英伟达发布季度收益显示收入增长94%的几天后,黄仁勋在财报电话会议上表示:“许多人工智能服务将像工厂一样,全天候运行。”
“我们将看到这种新型系统上线。我将其 [公司的数据中心] 称为 AI 工厂,因为它与现在的AI工厂非常接近。它与过去的数据中心不同,这些基本趋势才刚刚开始。我们预计这种增长、这种现代化和新行业的创建将持续数年。”