英伟达称Fugatto AI模型可生成“前所未闻的声音”

更新时间：2024-11-27 00:15 浏览量：29

Fugatto（或“基础生成音频转换器Opus 1”）是一种人工智能工具，可以使用任何文本和音频文件组合来生成或转换任何声音、音乐和语音组合。

英伟达博文表示：“例如，Fugatto可以根据文本提示创建音乐片段，从现有歌曲中删除或添加乐器，改变声音的口音或情感——甚至让人发出以前从未听过的声音。”

英伟达认为，Fugatto支持多种音频生成和转换任务，是第一个展示出新兴特性（源于各种训练相互作用的能力）以及融合自由形式指令能力的基础生成式AI模型。

英伟达应用音频研究经理Rafael Valle表示：“Fugatto是我们迈向未来的第一步，未来音频合成和转换的无监督多任务学习将源于数据和模型规模。”

Valle指出，音乐制作人可以使用Fugatto快速制作歌曲原型或编辑歌曲创意，测试不同的风格、声音和乐器，或者添加效果并改善现有曲目的整体音质。

英伟达表示，该工具的用途不仅限于音乐。广告公司可以使用Fugatto针对性开展广告活动，在画外音中加入各种不同的口音和情绪。而游戏公司可以使用该工具修改预先录制的音频，以便随着玩家的游戏进程改变动作。

Fugatto的发布是在英伟达发布季度收益显示收入增长94%的几天后，黄仁勋在财报电话会议上表示：“许多人工智能服务将像工厂一样，全天候运行。”

“我们将看到这种新型系统上线。我将其 [公司的数据中心] 称为 AI 工厂，因为它与现在的AI工厂非常接近。它与过去的数据中心不同，这些基本趋势才刚刚开始。我们预计这种增长、这种现代化和新行业的创建将持续数年。”