2026 年 4 月,MiniMax 发布 Music 2.6——这不是一次”音质又好了一点”的常规迭代,而是 AI 音乐生成第一次拥有了 Cover 翻唱能力。你可以给一段旋律换一种唱法、换一种音色、换一种风格,而不仅仅是让 AI 凭空生成一首新歌。
MiniMax 官方对 Music 2.6 的描述是”Cover 翻唱、器乐提升、Agent 集成,让每个人都能成为音乐创作者”,英文版更直白——“Bring any melody back to life with Cover, powered by deeper bass and richer instrumentation”。deeper bass(更深的低频)和 richer instrumentation(更丰富的器乐编排)点出了这代两个最核心的改进方向。
Cover 的行业意义在于:AI 音乐第一次从”生成器”变成了”创作工具”。 此前所有 AI 音乐模型都只能文生曲,用户每次都从零开始;Cover 让用户可以基于已有旋律二次创作,这更接近真实音乐人的工作方式。
Music 2.6 已上线 MiniMax API 和海螺 AI 产品线。
核心升级
Music 2.6 的三大新能力:
| 能力 | 说明 | 行业首创 |
|---|---|---|
| Cover 翻唱 | 基于已有旋律进行风格化翻唱 | ✅ 目前唯一 |
| 器乐提升 | 低频更饱满,器乐编排更丰富 | 官方强调核心改进 |
| Agent 集成 | 音乐生成可通过 Agent 自动调用 | ✅ 目前唯一 |
Cover 翻唱:从生成到再创作
Cover 模式允许用户基于一段旋律,选择不同的演唱风格和编曲方向进行翻唱。这不是简单的”变声”或”风格迁移”,而是模型对旋律的完整重新诠释——从声线、咬字、情感表达到编曲配器全部重做。
目前 AI 音乐模型中,Suno、Udio、Stable Audio 均不支持翻唱功能。Music 2.6 是第一个也是目前唯一一个提供 Cover 能力的 AI 音乐模型。
翻唱能力的加入改变了 AI 音乐的使用逻辑:此前是”生成→不满意→换 prompt 再生成”的线性循环,Cover 则允许”生成→基于好的部分翻唱→继续迭代”的螺旋上升——这和真实音乐创作中”先写旋律再编曲”的流程更接近。
器乐提升:deeper bass, richer instrumentation
官方对器乐提升的描述是”deeper bass and richer instrumentation”——更深的低频和更丰富的器乐编排。这意味着 Music 2.6 在两个方面做了改进:
低频表现。 此前 AI 音乐模型的普遍短板是贝斯和鼓组单薄、合成感强。MiniMax 官方将”deeper bass”作为 Music 2.6 的核心卖点之一,说明低频质量是这代重点攻克的方向。
器乐编排。 “richer instrumentation”指向的不是单一音色的提升,而是编曲层面更多声部、更丰富配器的组合。这对于影视配乐和游戏音效等需要复杂编曲的场景尤为重要。
客观评价:目前 MiniMax 未公布 Music 2.6 的量化基准数据,低频和器乐的提升幅度有待第三方独立验证。
新增 8 种音乐风格
| 新增风格 | 适用场景 |
|---|---|
| Hyperpop | 实验流行、网络音乐 |
| Club | 夜店、电子舞曲 |
| Electronic | 电子音乐、氛围 |
| Drive | 运动、驾驶 |
| Sports | 运动集锦、广告 |
| Trap | 说唱、街头 |
| Video Scoring | 影视配乐、游戏 |
| Epic | 史诗、游戏、大片 |
加上原有的 Pop、Melody、Dance、EDM、Game 等风格,Music 2.6 共覆盖 14 种音乐风格。其中 Video Scoring 和 Epic 是面向专业场景的重要补充——影视配乐是 AI 音乐尚未真正攻破的领域,这两个新风格说明 MiniMax 在向专业创作场景扩展。
技术机制
翻唱的技术难点
Cover 翻唱的技术难度远高于文生曲。文生曲只需”从 prompt 到音频”的一步生成,Cover 则需要模型同时理解源旋律的音乐结构和目标风格的编曲规则:
- 旋律保持:翻唱版本必须保留原曲的核心旋律线
- 风格迁移:演唱方式、编曲配器、混音风格全部切换到目标风格
- 情感适配:同一句旋律在不同风格中的情感表达完全不同
目前 MiniMax 未公开 Cover 功能的具体技术架构(如是否使用双条件生成、旋律提取和重编曲的具体流程等),有待后续技术报告补充。
器乐提升的实现路径
MiniMax 同样未公开器乐提升的具体技术细节。从”deeper bass and richer instrumentation”的描述推测,改进可能涉及低频段建模精度和编曲生成策略的调整,但具体实现方式官方尚未披露。
AI 音乐领域的技术报告普遍滞后于产品发布。Suno 和 Udio 至今也未公开其核心架构,Music 2.6 的情况并不特殊,但对于希望深入理解技术机制的开发者来说,信息仍然有限。
基准表现
MiniMax 目前未公布 Music 2.6 的任何量化基准数据。 这是目前文章中最薄弱的部分——没有 A/B 测试偏好率、没有风格匹配准确率、没有生成速度对比、没有翻唱一致性指标。
AI 音乐领域的客观评估体系本身仍在发展中,但 Suno 和 Udio 在发布新版本时通常会提供对比样例供用户试听。Music 2.6 目前在官网提供了 Cover 和各风格的试听 demo,但缺少系统性的评估数据。
建议关注:第三方独立评测和社区用户反馈将是验证 Music 2.6 实际表现的主要依据。
竞品对比
| 维度 | Music 2.6 | Suno v5.5 | Udio 1.5 | Stable Audio 2.0 |
|---|---|---|---|---|
| Cover 翻唱 | ✅ | ❌ | ❌ | ❌ |
| Agent 集成 | ✅ | ❌ | ❌ | ❌ |
| 器乐质量 | 官方强调提升 | 成熟 | 强 | 一般 |
| 风格覆盖 | 14 种 | 10+ | 8+ | 5+ |
| API 可用 | ✅ | ✅ | 有限 | 开源 |
| 本地部署 | ❌ | ❌ | ❌ | ✅ |
Music 2.6 的差异化优势很明确:Cover 翻唱 + Agent 集成,两项都是目前独有能力。
但需要注意:
- Suno 的优势在社交生态和用户基数,它是目前 AI 音乐领域用户量最大的平台
- Udio 在专业编曲的细节上口碑更好,尤其是在复杂和声和层次感方面
- Stable Audio 2.0 是唯一可本地部署的选项,对隐私敏感的用户是唯一选择
- Music 2.6 目前不支持本地部署,必须通过 API 或海螺 AI 使用
定价与可用性
| 项目 | 说明 |
|---|---|
| API | platform.minimaxi.com |
| 产品体验 | 海螺 AI / MiniMax Agent |
| 计费方式 | Token Plan 包月 + 按量计费 |
| MCP Server | 支持 MiniMax MCP 调用 |
Music 2.6 通过 MiniMax Token Plan 计费,和文本、语音、视频模型共享同一套 token 体系。具体的每首生成价格官方定价页面未单独列出,纳入全模态统一计费。
行业影响 + 写在最后
Music 2.6 的发布在三方面值得行业关注:
1. 翻唱能力改变了 AI 音乐的产品逻辑。 此前 AI 音乐是”一次性消费”——生成一首听一首,不满意就换 prompt 重来。Cover 模式让用户可以基于已有作品迭代,AI 音乐从”随机生成器”变成了”创作工具”。但翻唱本身就是一个版权敏感的领域,AI 翻唱的法律边界尚未厘清,Music 2.6 的发布将加速这个讨论。
2. Agent 集成让音乐成为多模态工作流的组件。 当音乐生成可以被 Agent 自动调用,它就不再是独立的创作环节,而是视频配乐、游戏音效、广告 BGM 等场景中的自动化流水线节点。MiniMax 同时拥有视频(Hailuo 2.3)和语音(Speech 2.8)模型,多模态联动是它的独特优势——“一键配乐+出片”在技术上已经成为可能。
3. AI 音乐的评估透明度亟待提升。 Music 2.6 是目前唯一支持翻唱的模型,但零基准数据让用户无法量化评估其表现。AI 音乐领域整体缺乏标准化评测体系,这是一个比单个模型更重要的问题。
Music 2.6 的意义不在于 AI 又能生成更好听的音乐了,而在于它第一次让 AI 音乐拥有了”二次创作”的能力——当翻唱成为可能,AI 音乐就从生成工具变成了创作伙伴。但”能翻唱”和”翻唱得好”之间还有差距,这个差距需要数据来衡量。