
开篇寄语
伯衡君之前研究AI音乐生成,一般是选择 Suno,如果要商用需要交10美元,最近突然看到一个开源项目,名字叫ACE-Step UI。本着「摸鱼也要有技术含量」的原则,我点进去了。然后…免费!本地运行!开源!界面像Spotify!
快乐,且想大喊一声。
说真的,我之前用Suno,每个月交10美元,感觉还行。但看到这个项目之后,我直接愣住了。
这玩意儿,居然能替代Suno?而且完全免费?
坦率的讲,我有点兴奋。
前情提要
其实伯衡君之前也聊过AI音乐相关的内容:
- 《有了音乐 AI,让你比歌手/作曲家/音乐家更专业,我全都要》
但这次不一样。
这次是开源的,本地运行的,完全免费的。
而且界面做得像Spotify一样漂亮。
我真的被震撼到了。
体验地址
想试试的朋友,可以直接用Pinokio一键安装:
或者手动安装,下面我会详细说。
项目地址
GitHub开源地址:
MIT协议,完全开源,随便用。
内容详情
这玩意儿到底是什么?
ACE-Step UI是一个开源的AI音乐生成界面,底层用的是ACE-Step 1.5模型。
说白了,就是给你一个漂亮的界面,让你在本地电脑上生成AI音乐。
不需要API Key,不需要订阅,不需要联网。
你的GPU,你的音乐,你的版权。
为什么说它是Suno杀手?
我给你列个对比表,你自己看:
| 功能 | Suno/Udio | ACE-Step UI |
|---|---|---|
| 费用 | 10-50美元/月 | 永久免费 |
| 隐私 | 云端处理 | 100%本地 |
| 版权 | 有许可限制 | 你全权拥有 |
| 自定义 | 受限 | 完全可控 |
| 生成限制 | 有排队 | 无限生成 |
| 商用 | 高级订阅才行 | 无任何限制 |
看完这个对比,我寻思了一下——
这差距,有点大啊。
核心功能有哪些?
基础生成
- 完整歌曲生成,带人声和歌词,最长4分钟以上
- 纯音乐模式,不带人声
- 自定义模式,可以调BPM、调式、时长
高级功能
- 参考音频,用任何音频文件作为风格参考
- 音频封面,把现有音频换成新风格
- 重绘功能,重新生成歌曲的特定段落
- 种子控制,精确复现之前的生成结果
歌词编辑器
- 写歌词,带结构标签(Verse、Chorus等)
- AI辅助格式化
- 快速模板,一键加载风格预设
界面体验

- Spotify风格的UI,深色/浅色模式
- 底部播放器,带波形和进度条
- 库管理,浏览、搜索、整理所有曲目
- 喜欢和播放列表功能
- 实时生成进度,显示排队位置
- 局域网访问,其他设备也能用
技术栈是什么?
这项目技术选型挺有意思:
- 前端:React 18 + TypeScript + TailwindCSS + Vite
- 后端:Express.js + SQLite
- AI引擎:ACE-Step 1.5(Gradio API)
- 音频工具:AudioMass、Demucs、FFmpeg
说到底,就是现代前端 + 轻量后端 + 本地AI模型。
架构清晰,代码干净。
需要什么配置?
最低要求
- Node.js 18+
- Python 3.10+(推荐3.11)
- NVIDIA显卡,4GB显存(不用LLM模式)
- CUDA 12.8(Windows便携版)
- FFmpeg(音频处理)
推荐配置
- 12GB+显存(启用LLM功能)
- 更好的GPU = 更快的生成
我自己的感受是,4GB显存也能跑,就是慢一点。
12GB显存的话,可以开Thinking Mode,效果更好。
怎么安装?
最简单的方式:Pinokio
如果你不想折腾,直接用Pinokio:
https://beta.pinokio.co/apps/github-com-cocktailpeanut-ace-step-ui-pinokio
一键安装,自动处理Python、Node.js、依赖、模型下载。
点击安装,开始做音乐。
Windows便携版
如果你是Windows用户,还有一个便携版:
- 下载ACE-Step-1.5.7z(约5GB)
- 解压到C:\ACE-Step-1.5
- 完成!自带Python环境
这个便携版:
- 4GB显卡就能用,不需要LLM
- CUDA 12.8已包含
- 零配置,直接跑
手动安装(Linux/macOS)
如果你喜欢折腾,手动安装也不难:
# 克隆ACE-Step 1.5模型
git clone https://github.com/ace-step/ACE-Step-1.5
cd ACE-Step-1.5
# 创建虚拟环境并安装
uv venv
uv pip install -e .
# 模型会在首次运行时自动下载(约5GB)
cd ..
# 克隆UI
git clone https://github.com/fspecii/ace-step-ui
cd ace-step-ui
# 运行安装脚本
./setup.sh
启动方式
Windows一键启动:
cd ace-step-ui
start-all.bat
Linux/macOS一键启动:
cd ace-step-ui
./start-all.sh
默认会在localhost:3000打开界面。
使用体验怎么样?
我实际用了一下,感觉挺顺手的。
简单模式
直接描述你想要的歌:
「一首欢快的流行歌,关于夏日冒险,有抓耳的旋律」
点击生成,等一会儿,歌就出来了。
自定义模式
如果你想精确控制:
- 歌词:完整歌词,带Verse、Chorus标签
- 风格:流派、情绪、乐器、节奏
- 时长:30-240秒
- BPM:60-200
- 调式:C大调、A小调等

和 SUNO 一样,在风格和歌词提示词放进去就可以了,之后就可以生成了。
AI增强模式
有个AI Enhance开关,挺有意思:
- 关掉:直接用你的风格标签生成,最快
- 开开:LLM会丰富你的标签,生成更准确的BPM、调式、拍号
我发现如果风格标签太简单(比如只写「流行、摇滚」),生成出来的歌容易像民谣。
这时候开AI Enhance,效果明显好很多。
批量生成
- Batch Size:一次生成几个变体(1-4)
- Bulk Generate:排队多个独立任务(1-10)
8GB显卡的话,Batch Size保持1比较稳。
有什么坑吗?
说实话,我也踩了一些坑,给你们避雷:
坑1:ACE-Step连不上
确保Gradio服务器启动时带了–enable-api参数。
坑2:显存不够
用PT backend(默认),Batch Size设成1,关掉Thinking Mode。
4GB显卡也能跑,就是慢一点。
坑3:风格总是像民谣
开AI Enhance开关,LLM会帮你丰富标签。
坑4:歌曲时长显示0:00
安装FFmpeg:
- Linux:sudo apt install ffmpeg
- Windows:从ffmpeg.org下载
坑5:局域网访问不了
检查防火墙,确保3000和3001端口开放。
额外工具
ACE-Step UI还集成了一些实用工具:
- 🎚️ 音频编辑器:剪切、淡入淡出、效果
- 🎤 分轨提取:分离人声、鼓、贝斯、其他
- 🎬 视频生成器:用Pexels素材做音乐视频
- 🎨 专辑封面:自动生成渐变封面(不需要联网)
这些工具让整个创作流程更完整。
为什么我觉得这项目厉害?
说真的,我觉得这项目厉害,有几个原因:
第一,开源且免费
不是那种「基础功能免费,高级功能收费」的套路。
是真正的开源,MIT协议,随便用。
第二,本地运行
你的音乐,你的版权。
不用担心云端服务突然关停,不用担心订阅涨价。
第三,界面做得好
很多开源项目,功能很强,界面很丑。
但ACE-Step UI的界面,真的像Spotify一样漂亮。
用起来很舒服。
第四,社区活跃
项目还在持续更新,有问题可以在GitHub提issue。
开发者也在YouTube和Twitter分享教程和更新。
适合什么人用?
我觉得这几类人特别适合:
- 不想给Suno交钱的(省钱党)
- 想本地运行的(隐私党)
- 想完全控制生成过程的(技术党)
- 想商用音乐的(创作者)
- 有GPU资源的(硬件党)
如果你显卡不够,或者不想折腾,那可能还是Suno更方便。
但如果你愿意折腾一下,这项目真的值得试。
我的实际感受
我试着生成了几首歌,效果挺惊艳的。
人声、歌词、旋律,都很完整。
虽然和Suno的最新版本比,可能还有差距。
但考虑到它是开源的、免费的、本地的,我觉得已经很厉害了。
而且项目还在持续更新,未来会更好。
篇后寄语
好了,今天的安利就到这里。
这个工具,我已经替你们试过了——
好用不好用,你们自己试试就知道。
反正又不要钱。
万一好用呢?
而且开源项目,用的人越多,发展越快。
如果你觉得有意思,去GitHub点个Star,支持一下开发者。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
谢谢你看我的文章,我们,下次再见。
- 我的微信
- 微信扫一扫加好友
-
- 我的微信公众号
- 扫描关注公众号
-





