中国AI音乐，悄悄把全球第一拿走了

发布时间：2026-03-25 14:33:59 浏览量：2

一水闻乐发自凹非寺

中国AI音乐，悄悄把全球第一拿走了——

昆仑万维Mureka V8

，最新登顶Artificial Analysis音乐模型榜，一举超越Suno V4.5、Udio v1.5 Allegro等国际主流模型。

而且还是

人声（vocal）、器乐（instrument）双料第一

那种。

那么问题来了，这个新鲜出炉的“双料第一”到底有多能打？

咱直接实测说话。

先看最直观的人声

。

这块儿我们先给出了一个极简提示词，不加复杂的结构和参数，就看Mureka V8最原始的理解和生成能力：

晚风民谣，温柔女声，黄昏乡间的慢时光。

视频链接：https://mp.weixin.qq.com/s/tw18swYdQYE2oxyuMWikEg

怎么说？AI唱歌是不是太有真人感了！！

吐字清晰咱就不提了，关键在细节。

第四句开头能听到一个明显的换气声，再往后，几处歌词结尾也明显能听出气息的上扬or下落处理。

这种呼吸起伏恰到好处地在曲子里穿插衔接，非常自然，而不是那种生硬堆砌。

还有温柔这个标签，不只是贴在声音上，在段落的推进上也贯穿始终。

主歌更克制、更贴耳、气息更轻；副歌才稍微把声带打开，情绪抬起来，不过这种情绪依然是收着的，没有用力过猛。

木吉他带入，人声一出，田间、黄昏、晚风……这惬意感简直扑面而来。

听完民谣，我们又甩给Mureka V8一个极其刁钻的指令。

“曲风要Pop Rock和R&B混着来，节奏要卡死在72BPM的慢板，人声还得在几个段落里来回切换：

第一段气声唱法是那种沙沙的、带点破碎感的声音；

副歌直接切摇滚嗓，带嘶吼的那种；

间奏再来一段R&B转音，最后用假声慢慢收尾。”

没想到这反复横跳的刁钻需求，还真被Mureka V8给跑出来了，听上去完成得不错（doge）。

几种状态截然不同的丝滑转声，中间切换还不断档、不卡顿。

好吧我承认V8你的唱商在我之上……

再让AI试试玩乐器

。

一提到乐器，英式摇滚乐队The Kinks的《You Really Got Me》简直不要太出名——

这首歌的前奏，是一段1960年代最具标志性的失真吉他riff。

所谓riff就是一段简短、重复、极具辨识度的乐器乐句，通常是吉他或贝斯演奏，构成整首歌的记忆点。

而Mureka V8在学到这种技巧后，为我们生成了一首纯器乐演奏曲《Got Me Going》：

就问有谁不想边听边摇头抖腿呢（笑.jpg）。

开头的riff味道非常正，一下子就把记忆点拉满，然后整个器乐编排也十分有画面感——

一听就知道人已经坐在酒馆或Livehouse台下了，而此时台上正有一支帅气逼人的乐队在演奏，还是边演边跳舞那种。

u1s1，AI生成的器乐演奏如今能到这个水平，确实给了人很大惊喜。

听完之后，你会很明显感受到它对不同乐器特性、歌曲意境的理解等，都往前迈出了一大步。

而当这种器乐演奏能力和人声能力相结合之后，Mureka V8曾被反复提及的一点，也愈发清晰——

它所生成的，已经不再是一段“AI音频片段”，而是一首结构完整、情感连贯、制作精良的“歌”

。

换句话说，它知道什么时候该唱、情绪怎么推进、用什么乐器以及该怎么用。

这种近乎专业音乐人的创作能力，让它真正跨越了一条从“可生成”到“可直接发布”的线。

因为懂音乐，所以可以直接生成“歌”。

而能够生成一首完整的“歌”，则意味着普通人无需专业训练也能拥有属于自己的作品——

人人都能参与创作发表的时代，真的来了。

至此，靠着“双料第一”实力打底的Mureka V8，也把AI音乐直接卷到了新的高度。

不过实测一圈下来，我就想知道：它这股子暴力进化感是咋做到的？

答案大概藏在那条密密麻麻的时间线里——

昆仑万维这家公司在AI音乐的赛道上简直卷疯了。

2024年2月SkyMusic 1.0内测起步，到了2026年1月，Mureka V8正式发布，满打满算不到两年时间，硬生生迭代了8个大版本。

什么概念？平均三个月一更？！

能这么玩，到底是在烧钱还是真憋着一口气要把这事儿干成？

从结果来看，昆仑万维应该是后者。

回看Mureka这不到两年的进化史，其实就是一个把“AI音乐好听”从玄学变成可量化、可复现的工业化生产能力的迭代过程。

第一阶段是从不能用到能用

。

SkyMusic 1.0当时还只是个能跑通的内测版本，那时候团队就盯着一件事，先把端到端“能用”这件事做出来，跑通训练到评测的基础闭环。

紧接着两个月后，2.0版本就直接把中英文版本上线到天工，这时候的AI音乐勉强算是迈过了“能出声、不鬼畜”的门槛。

第二阶段是从能用到好用

。

到了2024年8月，产品迎来3.0到4.0大版本跃迁，解决了规模化的问题。

昆仑万维这次不仅落地了Mureka首个超大规模版本，构建起稳定的规模化基模能力，还在听感和音质方面还实现了“肉耳可听”的级数跃迁。

独立产品也借此杀出重围，正式切入市场。

到了5.0/5.5版本，多语种工程化能力补齐，Mureka开始在全球市场刷脸。

进入2025年，随着

MusiCoT

和更系统化的强化学习跑成闭环，

模型开始具备主动思考的能力

。

这时候的Mureka就不是盲目撞大运了，拥有了先规划音乐框架、敲定配器细节和情绪，再按逻辑推进创作的主动能力。

第三阶段是从好用到直接生产可发布内容

。

到了V8，量变终于引起了质变。

人声的呼吸感、乐器的空间感、混音的专业度让它在AA榜单双料登顶，直接干翻了Suno和Udio。

这一步跨了两年，但昆仑万维是真跨过去了。

所以那套看似“超速”的迭代节奏，好像也没那么“疯”了——

不这么卷，怎么在两年内把一个从零开始的模型做到全球第一？

说它卷它还真没完！！

V8发布刚刚过去两个月，基于MusiCoT进一步深化的

Mureka V9

就要来了……

Mureka V8解决了AI音乐“能写出来”这件事，至于V9卷成了什么样嘛——

咱只能说，它琢磨的是

“能按你想的方式写出来”

。

不懂？3月27日看发布会估计你就懂了。

当然了，即使不谈Mureka V9，仅从V8的两次登顶，我们也已经能看到一个更清晰的变化：

“东升西落”正在AI音乐这个垂类赛道上演

。

之所以这样说，是因为过去很长一段时间，AI音乐基本是太平洋那头的主场，出名的模型也就那几家。

包括这次提到的Suno、Udio等，基本有一个算一个。

但是现在，以昆仑万维Mureka V8为代表的国产模型，却悄然间拿回了主动权。

说到这里有人或许就好奇了，为什么会出现这种反转？

答案，其实早就已经浮出水面了。

一旦把这件事放在一个更大的背景下来看，你会发现，“东升西落”几乎已经成了各个AI赛道必然会出现的一幕景象。

从引爆这轮AI革命的大语言模型，到最近掀起热潮的“龙虾”，剧本基本都一样——

前期由海外公司完成技术引爆，后期则由国产团队实现追赶，甚至反超

。

到现在，国产开源已经成了比肩闭源的重要力量、国产模型被海外公司“友好借鉴”拿去玩“龙虾”……人们总是后知后觉发现，很多原本以为的“追赶”，其实早就变了。

而这一切背后的逻辑，其实大家也都心知肚明。

放在制造业领域，大家会说这是因为有“中国制造”；而放在互联网科技、放在AI领域，答案则是“中国速度”“中国规模”“中国场景”。

一方面，国内这批AI玩家基本都经历过互联网从诞生到发展的完整时期，所以他们很熟悉那套“小步快跑、不断根据用户反馈进行迭代”的打法。

可以说，相比从0到1，我们尤为擅长从1到100。

另一方面，在内容、场景和用户规模上，国内也拥有得天独厚的“练兵场”——

无论是庞大的互联网用户群体、丰富多元的应用场景，还是足够复杂的内容生态，都给国产模型提供了快速试错、持续优化的土壤。相应地，国产AI也能更快形成“飞轮效应”。

而这些，也同样正在支撑着AI音乐赛道的发展。

所以，此时国产玩家里有人能“站出来、站起来”，也就不足为奇了。

至于为什么会是昆仑万维，上一部分也已经说了很多了——

围绕把“好听”变成可复现的系统能力这个目标，他们对AI音乐这个垂类赛道进行了长期持续投入

。

俗话说，水滴石穿、绳锯木断。所以如今能有这个结果，也算是水到渠成的事情。

再加上昆仑万维还是

北京市人工智能产业的科技创新代表

，所以登顶这件事本身也多了另一层象征意义：

AI音乐，往后高地就是北京了。

据说，昆仑万维还会在

3.27（本周五）举办的中关村论坛开专场发布会

。

届时Mureka V9，应该会有更多详情和介绍。

酷～

体验地址：

国内版：https://www.mureka.cn/

海外版：https://www.mureka.ai/

榜单地址：

人声：https://artificialanalysis.ai/music/leaderboard/vocals

器乐：https://artificialanalysis.ai/music/leaderboard/instrumental

— 完 —

中国AI音乐，悄悄把全球第一拿走了

相似文章