订阅
加入社区
订阅邮件,第一时间获取最新资讯与更新
Riffusion 是一款突破性的实时音乐生成工具,它利用基于图像的 AI 力量来创造声音。与传统的基于 MIDI 或波形的生成器不同,Riffusion 将音频视为一种视觉媒介。它利用经过微调的 Stable Diffusion 版本来生成频谱图——即声音随时间变化的频率和幅度的视觉表示。随后,这些图像通过逆傅里叶变换处理,生成高质量的音频片段。
该平台解决了快速、创意音频原型设计的挑战。无论您是需要视频背景音乐、游戏中的独特循环音效,还是仅仅想尝试声音设计,Riffusion 都提供了一个易于使用的界面进行即时创作。通过弥合计算机视觉与音频工程之间的鸿沟,它提供了一种独特的“无限”音乐流,可以在不同的风格和情绪之间平滑过渡。
核心能力包括实时插值(AI 可以将一种音乐风格演变为另一种风格)以及社区驱动的模式(用户可以分享和重混提示词)。它代表了我们对生成式媒体思考方式的转变,证明了为图像设计的模型同样可以……
通过使用微调后的 Stable Diffusion 模型创建并解析频谱图来生成音乐。
实时生成音频,让用户几乎能即刻听到文字提示词转化为现实。
无缝融合不同的音乐流派和提示词,创造平滑的过渡和无限循环。
定价模式
支持的平台
支持的语言