开启左侧

[视频] Nvidia展示可修改并生成声音的AI模型Fugatto

[复制链接]
HILOVEYOUTU 发表于 2024-11-26 16:52:52 | 显示全部楼层 |阅读模式 来自: 美国

马上注册,结交更多好友,享用更多功能,更可下载纽约情报站APP哦!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
 辉达(NVIDIA)。(欧新社)
辉达(NVIDIA)。(欧新社)

辉达(NVIDIA)周一展示一款用于生成音乐和声音的新型人工智能AI)模型,此模型以音乐、电影和影像游戏制作者为诉求对象,可以借此修改声音并生成新的声音。

辉达表示,目前还没有公开发表这项技术的计划。这项技术称为 Fugatto,是Foundational Generative Audio Transformer Opus 1的缩写。这技术与Runway等新创公司和Meta Platforms 等大公司展示的技术一样,可以根据文本提示来生成声音或影片。

Nvidia的技术可以根据文本描述生成音效和音乐,包括新奇的声音,例如让小号发出狗叫声。

和其他AI技术的不同之处在于,它能够接收和修改现有的声音,例如将钢琴弹奏的一段旋律转换成人声唱出的旋律,或者改变语语录音的口音和情绪。

辉达应用深度学习研究副总裁 Bryan Catanzaro说:「若回顾过去50年的合成音频,会发现现在的音乐听起来已经不同了,因为有了电脑和合成器,我认为生成式AI将为音乐、影像游戏和想要创造事物的普通人带来新的功能。」

辉达的新模型是基于开放数据训练而成,该公司表示仍在讨论是否且以什么方式公开发表这项技术。

点击下面文字可快速查看发布对应的便民信息!
纽约情报站让您的生活变的更简单

简介:纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动,更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作,或者想邀请我们去探店,请联系主编微信: nyinfor

回复

使用道具 举报

全部回复0 显示全部楼层

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

楼主

情报站神秘人
联系客服 关注微信 下载APP 返回顶部 返回列表