当前位置：首页 > 资讯 > 科技 > Stable Audio Open：创新开源AI模型，驾驭48.6万音乐样本，编织47秒音频魔法

Stable Audio Open：创新开源AI模型，驾驭48.6万音乐样本，编织47秒音频魔法

Stability AI 2024-06-06 17:23:42 爱吃爆米花

6月6日消息，Stability AI在稳固其Stable Diffusion文生图模型的领先地位后，持续探索技术边界，现已进军音频领域。他们震撼发布了Stable Audio Open，这一突破性的工具能根据用户提供的关键词提示，神奇地生成高保真度的音频片段，开创了音频创作的新纪元。

Stable Audio Open 最长可以创建 47 秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于 transforms 扩散模型（DiT），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。

Stable Audio Open 目前已经开源，据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。

Stability AI 公司表示：“虽然它可以生成简短的音乐片段，但并不适合完整的歌曲、旋律或人声”。

Stable Audio Open 和 Stable Audio 2.0 不同是，前者为开源模型，专注于短音频片段和音效，而后者能够生成最长 3 分钟的完整音频。

扩展阅读

Stability AI放宽Stable Diffusion3版权许可条款，推进AI创作自由

Stability AI 07-09 17:42

来源：it之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/52612.html

文章标签

Stability AI

文明上网，理性发言，共同做网络文明传播者

提交