“欢乐马”打哭字节,阿里用最戏剧的方式成功反杀
发布时间:2026-04-10 19:12:51 浏览量:4
风云突变!阿里终于在字节的窒息中成功反杀。
连日来,一款名为HappyHorse(欢乐马)的神秘模型频频在全球屠榜,将炙手可热的Seedance斩落马下。
颇具戏剧性的是,字节一脸懵逼三天后,阿里举手说,这是我干的。而且快乐马的操盘手张迪,不仅是抖音老冤家快手的“可灵之父”,现在又跑到了现任生死大敌阿里这里捅了一刀。
更具侮辱性的是,阿里宣布开源,这让要百万保证金的字节猝不及防。
神秘的HappyHorse是4月7日开始屠榜的。
没有任何官方背书、没有任何公司认领的神秘模型,悄然空降AI视频领域最权威的第三方评测榜单Artificial Analysis Video Arena,以1333 Elo分的成绩登顶视频竞技场排行榜,在文本生成视频(含音频/不含音频)、图片生成视频(含音频/不含音频)四个赛道中均位列第一。
第二天,阿里巴巴集团CEO吴泳铭发布全员信,宣布 AI 相关组织的重大调整,成立集团技术委员会,原通义实验室升级为通义大模型事业部,ATH 创新事业部浮出水面。
4月10日,碾压级表现还在继续。
在文本生成视频(不含音频)赛道,HappyHorse得分达到1389,领先排名第二的字节跳动Seedance 2.0 达115分;在图片生成视频(不含音频)赛道,HappyHorse更是跑出了1415分的高分,刷新了该榜单的历史纪录。
即便在含音频的综合评测中,HappyHorse文本生成视频(含音频)得分已超过Seedance 2.0;而图片生成视频(含音频)仅以微弱差距紧随其后,得分1162分,仅比Seedance 2.0的1164分低2分。
Artificial Analysis被全球认可很重要的原因在于盲测机制:所有模型匿名提交,用户完全不知道视频来自哪个模型,仅凭观感投票打分,再通过类似国际象棋的Elo评分系统汇总排名。
因此,欢乐马接连登顶,立刻引发了全网的“寻马”热潮。
各种猜测在4月10日终于水落石出。
HappyHorse开通了微博账号,并发布首条官宣内容:HappyHorse属于阿里ATH创新事业部,其正在内测中,目前尚未上线。
将欢乐马的欢乐推向高潮的是两个传言:一个是操盘手张迪,一个是字节紧急变阵。
这让整个AI视频圈都为之侧目张迪,张迪的履历堪称传奇。
他本硕毕业于上海交通大学。
2010年加入阿里巴巴,担任阿里妈妈大数据与机器学习架构负责人。
2020年,他跟随阿里妈妈前技术总监盖坤跳槽快手。2024年,他以“技术一号位”身份牵头可灵AI的全链路研发,主导了可灵1.0和2.0两代底层架构,被业内称为“可灵AI之父”。
2025年9月,张迪短暂加入哔哩哔哩担任技术条线负责人,但仅任职约两个月便再次离开。
2025年11月正式回归阿里,出任淘天集团未来生活实验室负责人,职级P11,直接向淘天首席科学家郑波汇报。
也就是说,张迪先在快手做出了可灵AI,然后跳到阿里做出了HappyHorse来打败可灵,还帮被字节搞得颇为狼狈的阿里出了口恶气。
有网友调侃:“可灵最大的竞争对手,不是Seedance,是张迪本人。”
更令人惊叹的是效率。张迪回归阿里后,仅用5个月时间,带领团队打造出了HappyHorse-1.0。而传统大模型开发周期通常在12至18个月,OpenAI的Sora从立项到发布用了近两年,字节Seedance 2.0也花了差不多一年。
HappyHorse之所以能在短时间内实现弯道超车,与其独特的技术路线密不可分。
它是目前全球首个原生支持音视频联合生成的开源视频大模型,参数量为150亿,采用40层统一自注意力Transformer架构,单张H100显卡生成一段5秒1080p视频耗时仅约38秒。不同于传统模型“先生成无声视频、再单独配音、再做口型对齐”的多工序流程,HappyHorse将所有模态的Token拼成同一个序列,让模型在一次前向推理中直接输出带声音的成片,口型、脚步声、环境音全部在同一过程中生成,无需后期拼接。此外,HappyHorse原生支持英语、普通话、粤语、日语、韩语、德语、法语七种语言的唇形同步,词错误率在同类开源模型中最低。
不过,HappyHorse也并非全无短板。有机构实测报告指出,HappyHorse的场景感、真实感、成片感是其最大长板,但在复杂动作控制和分镜调度上,尚不如Seedance 2.0成熟。它更像一个“很会拍漂亮镜头的摄影师”,还不是一个“真正成熟的动作导演”。
HappyHorse的横空出世,让原以为大局已定的AI格局风云突变。
过去一年,AI视频生成的竞争格局泾渭分明:字节跳动凭借Seedance系列稳坐头把交椅,快手可灵AI凭借庞大的用户生态占据第二梯队,而阿里在这一赛道长期缺乏一款能打的产品。
阿里举全集团之力力捧的千问,在用户活跃度和市场普及度的消费级应用榜单上,一直被豆包压着一头。
此前,阿里还因为前阿里千问大模型负责人林俊旸的出走而备受争议。
HappyHorse的诞生,无疑是对于阿里ALL IN AI的组织变革最好的礼物,林俊旸的那句“快乐马简直高兴疯了”更让一扫此前阴霾。
让字节无比被动的是开源带来的巨大压力。
此前,字节Seedance 2.0虽然面向企业用户开放公测,但同时设置了各种严苛的要求和准入条件:仅面向完成企业认证的主体,默认并发数锁定在10;真人人脸生成与自定义人像功能暂不开放,仅可使用平台公共虚拟人像库进行二次创作。想要解锁高级能力或新签约团队还需签署保底合作协议,和支付100万元保证金及10%预付款。
因为版权和产品问题一直让Seedance不敢免费放开。
2月12日,Seedance 2.0正式上线,凭借超写实的视频生成能力和多模态音视频联合架构惊艳全球,但美国电影协会(MPA)和美国影视演员协会(SAG-AFTRA)先后发布声明,谴责Seedance 2.0大规模擅自使用受版权法保护的作品,存在公然侵权行为。字节跳动随后决定暂缓Seedance 2.0在全球发售的计划。
同时Seedance 2.0也存在一些局限性问题,如细节稳定性、文字与字幕处理缺陷、多主体与复杂交互处理不足等。在生成复杂场景或长视频时,可能出现角色动作不连贯、场景元素漂移等情况;在高并发使用或生成长视频时,可能出现生成时间延长、任务排队等待或偶尔生成失败的情况。
产品的成熟度不佳、并发不够用、版权问题等等,使得Seedance 2.0只针对大客户开放。这些限制性条款虽然出于版权风险管控的考量,却在客观上抑制了产品的普及速度。
据知情人士透露,HappyHorse屠榜并宣布即将开源的消息传来后,字节AI视频团队紧急召开会议,原定对Seedance 2.0实施的严格准入限制,包括企业认证、百万元保底保证金、并发数锁定等条款,被连夜提上调整日程,计划在10日全面放开。
中国AI视频正式进入三国杀时代。
字节和阿里的双雄会终于有了点看头。
