Nvidia展示可修改并生成声音的AI模型Fugatto

HILOVEYOUTU · 发表于 2024-11-26 16:52:52

马上注册，结交更多好友，享用更多功能，更可下载纽约情报站APP哦！

您需要登录才可以下载或查看，没有帐号？立即注册

x

辉达（NVIDIA）。(欧新社)

辉达（NVIDIA）周一展示一款用于生成音乐和声音的新型人工智能（AI）模型，此模型以音乐、电影和影像游戏制作者为诉求对象，可以借此修改声音并生成新的声音。

辉达表示，目前还没有公开发表这项技术的计划。这项技术称为 Fugatto，是Foundational Generative Audio Transformer Opus 1的缩写。这技术与Runway等新创公司和Meta Platforms 等大公司展示的技术一样，可以根据文本提示来生成声音或影片。

Nvidia的技术可以根据文本描述生成音效和音乐，包括新奇的声音，例如让小号发出狗叫声。

和其他AI技术的不同之处在于，它能够接收和修改现有的声音，例如将钢琴弹奏的一段旋律转换成人声唱出的旋律，或者改变语语录音的口音和情绪。