当前位置: 首页 > 资讯 > 科技 > Stable Audio Open:创新开源AI模型,驾驭48.6万音乐样本,编织47秒音频魔法
  • 0
  • 0
  • 分享

Stable Audio Open:创新开源AI模型,驾驭48.6万音乐样本,编织47秒音频魔法

Stability AI 2024-06-06 17:23:42 爱吃爆米花

6月6日消息,Stability AI在稳固其Stable Diffusion文生图模型的领先地位后,持续探索技术边界,现已进军音频领域。他们震撼发布了Stable Audio Open,这一突破性的工具能根据用户提供的关键词提示,神奇地生成高保真度的音频片段,开创了音频创作的新纪元。

Stable Audio Open 最长可以创建 47 秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。

Stable Audio Open 目前已经开源,据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。

Stability AI 公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。

Stable Audio Open 和 Stable Audio 2.0 不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长 3 分钟的完整音频。

来源:it之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/52612.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热榜
热门游戏
换一换
热门软件
换一换