站点出售QQ:1298774350
你现在的位置:首页 > 演出资讯  > 歌剧话剧

2月Gemini Drop来了:音乐生成、深度推理、图像升级全面上新

发布时间:2026-02-28 10:51:41  浏览量:4

AIPress.com.cn报道

谷歌的AI助手Gemini又迎来了一波集中更新。在2月的Gemini Drop中,谷歌一口气推出了五项新功能,覆盖了音乐创作、智能推理、图像生成、视频制作和学术研究,几乎把能卷的方向都卷了一遍。

先说最有意思的一个:AI作曲。谷歌最新的音乐生成模型Lyria 3正式上线Beta版,用户只需要输入一段文字描述,甚至丢一张图片进去,就能生成一段30秒的定制音乐。不管是给短视频配个BGM,还是给派对找个氛围音乐,输入你想要的感觉,Lyria 3就能帮你"写"出来。

核心能力方面,Gemini 3.1在解决复杂问题的智能水平上有了明显的提升。这次发布了两个版本:3.1 Pro面向高强度工作流程,适合日常高要求任务;Deep Think则是一个专门的深度推理模式,针对科学和工程领域的硬核问题做了优化。不过Deep Think目前只向Google AI Ultra订阅用户开放,想尝鲜的话得先掏钱。

图像生成方面,谷歌推出了新模型Nano Banana 2。最大的亮点是支持在生成图像中添加任意语言的文字,而且精度很高,这一直是AI图像生成领域的老大难问题,文字渲染要么糊、要么乱码,Nano Banana 2在这个方向上做了重点突破,生成速度也很快。

视频创作方面,谷歌新增了Veo模板功能。用户可以浏览模板库,选一个喜欢的风格作为起点,然后填入自己的内容进行二次创作。对于不擅长从零开始构思视频的用户来说,这个功能相当于给了一个"脚手架",降低了上手门槛。

最后一个更新和学术研究相关:Gemini现在能直接提供经过验证的科学论文引用链接。以前想找一篇靠谱的论文,往往要在搜索结果里翻好几页。现在Gemini可以直接把论文来源摆在你面前,省去了大量筛选工作。对于科研工作者和学生来说,这个功能相当实用。

整体来看,这次更新的思路很清晰:谷歌正在把Gemini从一个"聊天助手"推向一个"全能型创作和生产力平台"。音乐、图像、视频、推理、学术,每个方向都在加码,而且每一项都在往实际可用的方向走,而不仅仅是秀技术。