站点出售QQ:1298774350
你现在的位置:首页 > 演出资讯  > 歌剧话剧

中国AI音乐,悄悄把全球第一拿走了

发布时间:2026-03-25 14:33:59  浏览量:2

一水 闻乐 发自 凹非寺

中国AI音乐,悄悄把全球第一拿走了——

昆仑万维Mureka V8

,最新登顶Artificial Analysis音乐模型榜,一举超越Suno V4.5、Udio v1.5 Allegro等国际主流模型。

而且还是

人声(vocal)、器乐(instrument)双料第一

那种。

那么问题来了,这个新鲜出炉的“双料第一”到底有多能打?

咱直接实测说话。

先看最直观的人声

这块儿我们先给出了一个极简提示词,不加复杂的结构和参数,就看Mureka V8最原始的理解和生成能力:

晚风民谣,温柔女声,黄昏乡间的慢时光。

视频链接:https://mp.weixin.qq.com/s/tw18swYdQYE2oxyuMWikEg

怎么说?AI唱歌是不是太有真人感了!!

吐字清晰咱就不提了,关键在细节。

第四句开头能听到一个明显的换气声,再往后,几处歌词结尾也明显能听出气息的上扬or下落处理。

这种呼吸起伏恰到好处地在曲子里穿插衔接,非常自然,而不是那种生硬堆砌。

还有温柔这个标签,不只是贴在声音上,在段落的推进上也贯穿始终。

主歌更克制、更贴耳、气息更轻;副歌才稍微把声带打开,情绪抬起来,不过这种情绪依然是收着的,没有用力过猛。

木吉他带入,人声一出,田间、黄昏、晚风……这惬意感简直扑面而来。

听完民谣,我们又甩给Mureka V8一个极其刁钻的指令。

“曲风要Pop Rock和R&B混着来,节奏要卡死在72BPM的慢板,人声还得在几个段落里来回切换:

第一段气声唱法是那种沙沙的、带点破碎感的声音;

副歌直接切摇滚嗓,带嘶吼的那种;

间奏再来一段R&B转音,最后用假声慢慢收尾。”

没想到这反复横跳的刁钻需求,还真被Mureka V8给跑出来了,听上去完成得不错(doge)。

几种状态截然不同的丝滑转声,中间切换还不断档、不卡顿。

好吧我承认V8你的唱商在我之上……

再让AI试试玩乐器

一提到乐器,英式摇滚乐队The Kinks的《You Really Got Me》简直不要太出名——

这首歌的前奏,是一段1960年代最具标志性的失真吉他riff。

所谓riff就是一段简短、重复、极具辨识度的乐器乐句,通常是吉他或贝斯演奏,构成整首歌的记忆点。

而Mureka V8在学到这种技巧后,为我们生成了一首纯器乐演奏曲《Got Me Going》:

就问有谁不想边听边摇头抖腿呢(笑.jpg)。

开头的riff味道非常正,一下子就把记忆点拉满,然后整个器乐编排也十分有画面感——

一听就知道人已经坐在酒馆或Livehouse台下了,而此时台上正有一支帅气逼人的乐队在演奏,还是边演边跳舞那种。

u1s1,AI生成的器乐演奏如今能到这个水平,确实给了人很大惊喜。

听完之后,你会很明显感受到它对不同乐器特性、歌曲意境的理解等,都往前迈出了一大步。

而当这种器乐演奏能力和人声能力相结合之后,Mureka V8曾被反复提及的一点,也愈发清晰——

它所生成的,已经不再是一段“AI音频片段”,而是一首结构完整、情感连贯、制作精良的“歌”

换句话说,它知道什么时候该唱、情绪怎么推进、用什么乐器以及该怎么用。

这种近乎专业音乐人的创作能力,让它真正跨越了一条从“可生成”到“可直接发布”的线。

因为懂音乐,所以可以直接生成“歌”。

而能够生成一首完整的“歌”,则意味着普通人无需专业训练也能拥有属于自己的作品——

人人都能参与创作发表的时代,真的来了。

至此,靠着“双料第一”实力打底的Mureka V8,也把AI音乐直接卷到了新的高度。

不过实测一圈下来,我就想知道:它这股子暴力进化感是咋做到的?

答案大概藏在那条密密麻麻的时间线里——

昆仑万维这家公司在AI音乐的赛道上简直卷疯了。

2024年2月SkyMusic 1.0内测起步,到了2026年1月,Mureka V8正式发布,满打满算不到两年时间,硬生生迭代了8个大版本。

什么概念?平均三个月一更?!

能这么玩,到底是在烧钱还是真憋着一口气要把这事儿干成?

从结果来看,昆仑万维应该是后者。

回看Mureka这不到两年的进化史,其实就是一个把“AI音乐好听”从玄学变成可量化、可复现的工业化生产能力的迭代过程。

第一阶段是从不能用到能用

SkyMusic 1.0当时还只是个能跑通的内测版本,那时候团队就盯着一件事,先把端到端“能用”这件事做出来,跑通训练到评测的基础闭环。

紧接着两个月后,2.0版本就直接把中英文版本上线到天工,这时候的AI音乐勉强算是迈过了“能出声、不鬼畜”的门槛。

第二阶段是从能用到好用

到了2024年8月,产品迎来3.0到4.0大版本跃迁,解决了规模化的问题。

昆仑万维这次不仅落地了Mureka首个超大规模版本,构建起稳定的规模化基模能力,还在听感和音质方面还实现了“肉耳可听”的级数跃迁。

独立产品也借此杀出重围,正式切入市场。

到了5.0/5.5版本,多语种工程化能力补齐,Mureka开始在全球市场刷脸。

进入2025年,随着

MusiCoT

和更系统化的强化学习跑成闭环,

模型开始具备主动思考的能力

这时候的Mureka就不是盲目撞大运了,拥有了先规划音乐框架、敲定配器细节和情绪,再按逻辑推进创作的主动能力。

第三阶段是从好用到直接生产可发布内容

到了V8,量变终于引起了质变。

人声的呼吸感、乐器的空间感、混音的专业度让它在AA榜单双料登顶,直接干翻了Suno和Udio。

这一步跨了两年,但昆仑万维是真跨过去了。

所以那套看似“超速”的迭代节奏,好像也没那么“疯”了——

不这么卷,怎么在两年内把一个从零开始的模型做到全球第一?

说它卷它还真没完!!

V8发布刚刚过去两个月,基于MusiCoT进一步深化的

Mureka V9

就要来了……

Mureka V8解决了AI音乐“能写出来”这件事,至于V9卷成了什么样嘛——

咱只能说,它琢磨的是

“能按你想的方式写出来”

不懂?3月27日看发布会估计你就懂了。

当然了,即使不谈Mureka V9,仅从V8的两次登顶,我们也已经能看到一个更清晰的变化:

“东升西落”正在AI音乐这个垂类赛道上演

之所以这样说,是因为过去很长一段时间,AI音乐基本是太平洋那头的主场,出名的模型也就那几家。

包括这次提到的Suno、Udio等,基本有一个算一个。

但是现在,以昆仑万维Mureka V8为代表的国产模型,却悄然间拿回了主动权。

说到这里有人或许就好奇了,为什么会出现这种反转?

答案,其实早就已经浮出水面了。

一旦把这件事放在一个更大的背景下来看,你会发现,“东升西落”几乎已经成了各个AI赛道必然会出现的一幕景象。

从引爆这轮AI革命的大语言模型,到最近掀起热潮的“龙虾”,剧本基本都一样——

前期由海外公司完成技术引爆,后期则由国产团队实现追赶,甚至反超

到现在,国产开源已经成了比肩闭源的重要力量、国产模型被海外公司“友好借鉴”拿去玩“龙虾”……人们总是后知后觉发现,很多原本以为的“追赶”,其实早就变了。

而这一切背后的逻辑,其实大家也都心知肚明。

放在制造业领域,大家会说这是因为有“中国制造”;而放在互联网科技、放在AI领域,答案则是“中国速度”“中国规模”“中国场景”。

一方面,国内这批AI玩家基本都经历过互联网从诞生到发展的完整时期,所以他们很熟悉那套“小步快跑、不断根据用户反馈进行迭代”的打法。

可以说,相比从0到1,我们尤为擅长从1到100。

另一方面,在内容、场景和用户规模上,国内也拥有得天独厚的“练兵场”——

无论是庞大的互联网用户群体、丰富多元的应用场景,还是足够复杂的内容生态,都给国产模型提供了快速试错、持续优化的土壤。相应地,国产AI也能更快形成“飞轮效应”。

而这些,也同样正在支撑着AI音乐赛道的发展。

所以,此时国产玩家里有人能“站出来、站起来”,也就不足为奇了。

至于为什么会是昆仑万维,上一部分也已经说了很多了——

围绕把“好听”变成可复现的系统能力这个目标,他们对AI音乐这个垂类赛道进行了长期持续投入

俗话说,水滴石穿、绳锯木断。所以如今能有这个结果,也算是水到渠成的事情。

再加上昆仑万维还是

北京市人工智能产业的科技创新代表

,所以登顶这件事本身也多了另一层象征意义:

AI音乐,往后高地就是北京了。

据说,昆仑万维还会在

3.27(本周五)举办的中关村论坛开专场发布会

届时Mureka V9,应该会有更多详情和介绍。

酷~

体验地址:

国内版:https://www.mureka.cn/

海外版:https://www.mureka.ai/

榜单地址:

人声:https://artificialanalysis.ai/music/leaderboard/vocals

器乐:https://artificialanalysis.ai/music/leaderboard/instrumental

— 完 —