站点出售QQ:1298774350
你现在的位置:首页 > 演出资讯  > 歌剧话剧

对标Suno和格莱美?中国公司攻克了AI音乐生成两大难题

发布时间:2026-01-30 20:47:00  浏览量:3

(文/万肇生 编辑/张广凯)

站在2026年的起点上,中国已在全球AI音乐竞赛中站稳脚跟。

1月28、29日,昆仑万维的天工智能与稀宇科技的MiniMax分别对外发布了重磅产品——Mureka V8和MiniMax Music 2.5。随着这两款面向专业音乐制作场景的AI大模型相继亮相,标志着中国在全球AI音乐竞赛中实现了从技术跟跑到并跑、乃至局部领跑的质变。如今,中国AI音乐生成技术,正全面进军"专业级"商用市场。

MiniMax Music 2.5:格莱美级的精准控制

长期以来,AI音乐生成面临双重瓶颈:一是可控性差,用户无法精准干预歌曲结构,AI想到哪里写到哪里;二是音质失真,尤其是中文演唱常见的"吞字、糊音"现象难以解决。而按照MiniMax的说法,此次发布的Music 2.5 相较于上一代模型,在“段落级强控制”与“物理级高保真”,两大技术难题上均实现了突破。

其中,Music 2.5 开放全段落标签控制,精准支持了包括 Intro(前奏)、Bridge(桥段)、Interlude(间奏)、Build-up(情绪铺垫)及 Hook(副歌)在内的 14 种结构变体。并通过对人声生成、风格建模、混音处理的系统性优化,让AI音乐作品在听感上达到专业制作水准。尤其是针对华语流行音乐,Music 2.5还进行了深度优化,覆盖从慢歌到说唱、从纯中文到中英文混搭的各类场景。

根据MiniMax官方发布的一段宣传切片,其中可以明显听出类似《Feeling Good》的段落感,以及Billie Eilish和Ariana Grande等歌手的风格,作品中的转音、颤音,以及胸腔与头腔共鸣切换令人深刻,已无法通过耳朵来分辨是AI还是人。

Music 2.5 此次还将音色库扩充至 100+ 种乐器,并优化了混音处理,可以清晰分离人声与伴奏,解决了 AI 音乐中常见的声音混叠问题。

对此,MiniMax直言不讳地表示,Music 2.5 深度适配专业工作流,在多个场景下均能胜任专业交付标准。过去需要录音棚、设备和训练才能做到的事,现在只需要想法就可以实现。

Mureka V8:全面领先Suno V5

如果说MinMAX是通过精准的结构标签、乐器名称以及提示词来控制段落生成,那昆仑天工的Mureka V8就属于另辟蹊径。最新的V8模型能力建立在 MusiCoT(Music Chain-of-Thought) 技术体系的持续演进之上,通过对音乐结构、段落逻辑与表达意图的更深层建模,以接近人类创作逻辑的方式,先构建音乐动机,再发展旋律,最终实现情绪铺陈与结构收束。

对此,昆仑天工利用Mureka V8生成了一支官方女团“M:RA”,并发布歌曲《MCE》。歌曲本身虽有些老派,但结构完成度已达到非常高的水平。有趣的是女团其成员形象也很国际化,除了亚裔外,还包括了印度裔、非洲裔和白人面孔的成员,而组建这种跨越文化、种族的女团形式,AI相对于人类显然有着巨大优势。

而在中文歌曲方面,根据Mureka发布的数据显示,Mureka V8与Suno在中文歌曲生成中的主观评分中,音乐旋律性、人声表现力、编曲/结构和情绪表达与渲染共4个选项,均已全面超越Suno V5。

尤其是人声表现力方面优化,得以让人声音色、性别匹配与唱法选择上更加贴合提示词,整体表现更具“主唱存在感”。

与此同时,昆仑天工特别提到,Mureka是一款面向创作者的AI音乐产品,不只是生成一首歌,而是支持完整的创作过程。用户可以用自然语言描述想要的音乐,结合歌词、人声和参考歌曲反复调整。未来,Mureka还将推出AI Studio,将支持更深度的编辑、结构调整和创作管理,让 AI 融入专业创作流程。

AI不会取代音乐人,但音乐生产分工结构正在被重构

现象级音乐AI产品出现在中国,并非偶然,而是技术积累、市场需求与产业变革共同作用的必然结果。

根据国际权威的动态市场研究平台“Research and Markets”《直至2034年生成式人工智能(AI)在音乐市场的机遇与策略》报告所公布的数据,2024年全球音乐产业中生成式AI的市场价值已达4.1985亿美元,并以53.34%的年增长率迅猛发展。报告预测,全球音乐市场上的AI价值将会在2029年飙升至43亿美元,并在2034年达到225.7亿美元。

而在中国市场,据统计2025年第一季度独立发行的新歌作品中,AI生成作品占比56.9%;网易云音乐AI创作平台“天音”,已累计产出原创音乐达4万余首;以AI技术为支撑的中国数字音乐基地成绩亮眼,近5年累计实现营业收入656亿元。

如今一个普通用户通过借助AI工具,即可独立完成编曲、混音、演唱全流程,传统"词曲编录混"的流水线分工面临重构。音乐创作从专业壁垒森严的小众技能,转变为大众可及的基础表达工具。未来,"一人乐队"将成为常态,更趋多元化的创作主体将带来内容与审美的爆炸式繁荣。

当然,目前AI生成还存在版权争议等诸多问题,技术的狂奔仍需要制度的护航。未来产业能否持续健康发展,关键在于能否在激励技术创新、构建清晰版权规则与守护人类艺术灵性之间找到精妙平衡。唯有如此,AI才能真正成为金色乐器,而非取代人类创造力的冰冷机器。