谷歌杀入AI音乐牌桌！实测一键生成3分钟歌曲，可精细控制段落

智东西（公众号：zhidxcom）
编译 | 杨京丽
编辑 | 李水青

智东西3月26日消息，谷歌于当地时间3月25日发布了AI音乐生成模型Lyria 3 Pro。作为上月发布的Lyria 3的进阶版本，Lyria 3 Pro由谷歌DeepMind团队打造，最大的升级是音乐时长大幅提升，由此前的30秒提升至3分钟。此外，模型能够理解歌曲结构，用户可以通过提示词指定前奏、主歌、副歌、桥段等段落，对完整歌曲进行精细控制。

与模型升级同步，谷歌还将Lyria 3系列一口气铺进了Vertex AI、Google AI Studio与Gemini API、Google Vids、Gemini应用以及ProducerAI等多个产品平台，覆盖从企业级开发到个人创作的全链路场景。

谷歌杀入AI音乐牌桌！实测一键生成3分钟歌曲，可精细控制段落

▲谷歌官宣新模型Lyria 3 Pro（图源：X）

智东西在谷歌ProducerAI平台上试用该模型，生成了几首歌曲。

首先我先给Lyria了一张前段时间去海边旅游的照片，让它根据照片生成音乐。

谷歌杀入AI音乐牌桌！实测一键生成3分钟歌曲，可精细控制段落

▲Lyria 3 Pro根据图片生成音乐

▲音频由Lyria 3 Pro生成

首先它对图片理解的比较清晰，迅速捕捉到了画面中海鸥这一元素。不到一分钟，歌曲也生成出来了，整体采用电吉他作为主旋律，加入了海鸥的叫声和浪花作为白噪音，此外用沙锤打节奏。整体音质清晰、自然流畅，很有律动感、层次感，能够从中感受到自由的氛围。

后面，我又让它创作了一首古风歌曲，提示词是这么写的：

“创作一首抒情的国风中文歌曲，中低音女声，伴奏除了曲调外，可以加入笛子、古筝或琵琶，演绎要有情感”

▲音频由Lyria 3 Pro生成

谷歌杀入AI音乐牌桌！实测一键生成3分钟歌曲，可精细控制段落

▲Lyria生成的歌词

客观来讲，歌词写的一般，不怎么押韵，语言质感稍差了一些。不过，音乐听着还是不错的，能够看出Lyria 3 Pro对于歌曲的认知，副歌、主歌交代得很明白，提示词理解清晰，能够明显听到笛子声，歌声也很有情绪。

从实际体验来看，Lyria 3 Pro已经开始具备生成成熟作品的能力。也正因此，谷歌这次发布的重点不只在于“模型更强了”，还在于迅速把这项能力接入多个产品入口，让开发者、企业用户和普通创作者都能直接用起来。

一、一次性铺开5大平台，从开发者到普通用户全覆盖

Lyria 3 Pro现已在谷歌云的Vertex AI上开放公开预览，面向需要大规模按需生成音频的用户。用户可将其应用至游戏配乐批量生成、创意工具集成、音乐和视频平台嵌入等典型场景。

与此同时，面向开发者的Google AI Studio和Gemini API也同步上线了Lyria 3 Pro，与此前发布的Lyria RealTime（实时音乐生成能力）并列提供，开发者可以将这些能力集成到自己的应用中。

谷歌杀入AI音乐牌桌！实测一键生成3分钟歌曲，可精细控制段落

▲API网站上关于Lyria 3 Pro的介绍（图源：Gemini API）

在消费端，谷歌的AI视频创作应用Google Vids本周起向Google Workspace企业客户和Google AI Pro & Ultra付费订阅用户开放Lyria 3和Lyria 3 Pro，用户可以为营销视频、创意项目等添加定制配乐。Gemini应用中，付费订阅用户现在也可以用Lyria 3 Pro生成更长的音乐作品，适用于vlog、播客、教学视频等场景。

此外，谷歌此前推出的协作式音乐创作工具ProducerAI也搭载了Lyria 3 Pro。谷歌称，ProducerAI由音乐人构建，搭载新模型后提供Agent式体验，能帮助艺术家、制作人和词曲作者在各个水平上迭代完整歌曲，目前面向全球免费和付费用户开放。

谷歌杀入AI音乐牌桌！实测一键生成3分钟歌曲，可精细控制段落

▲协作式音乐创作工具ProducerAI（图源：ProducerAI）

二、格莱美制作人率先上手，谷歌以“行业共创”打磨Lyria 3系列

谷歌着重强调Lyria 3开发过程中，持续与音乐行业深度协作。此前，谷歌通过Music AI Sandbox项目为音乐人、制作人和词曲作者提供了一套实验性工具，从这些合作中获得的反馈，对Lyria 3的研发影响深远。

在实际应用层面，格莱美获奖制作人扬·斯皮尔伯格（Yung Spielburg）已将Lyria用于谷歌DeepMind短片《Dear Upstairs Neighbors》的配乐创作流程中。

谷歌杀入AI音乐牌桌！实测一键生成3分钟歌曲，可精细控制段落

▲谷歌DeepMind短片《Dear Upstairs Neighbors》海报（图源：谷歌）

知名DJ兼制作人弗朗索瓦·K（François K）也在使用Lyria进行迭代创作，其作品即将发布。弗朗索瓦·K在评价中表示：“在探索了大量音乐工具之后，Lyria 3的进步令人震惊，其保真度和音乐性强。我使用生成式AI工具的方式从来不是‘一键生成’，而是将它作为武器库中的多功能组件，让我以更高的真实感和精确度打磨创意。”

三、责任机制：不模仿艺人风格，全部输出嵌入隐形水印

在版权责任方面，谷歌为Lyria 3设置了多重防护。训练数据方面，Lyria 3使用的是YouTube和谷歌依据服务条款、合作协议及适用法律有权使用的素材。艺人保护上，Lyria 3和Gemini不会模仿特定艺术家的风格，当用户在提示词中输入某位创作者的名字时，模型只会将其作为宽泛的灵感方向，而非进行风格复制。

此外，系统还会对生成内容进行比对过滤，防止输出与已有作品高度相似。所有Lyria 3和Lyria 3 Pro生成的音频都嵌入了SynthID隐形水印，用于标识AI生成内容。

结语：从“能生成”到“能商用”，AI音乐的真正赛点才刚到来

Lyria 3 Pro将AI生成音乐的时长从30秒推至3分钟，AI音乐已经从Demo走向完整作品。此前，Suno、Udio等AI音乐创企已凭借社区传播跑出了可观的用户规模，但它们面临的共同问题是：生成质量的天花板受限于模型能力。

当AI能够批量生成游戏配乐、广告音乐和短视频BGM时，首先受到冲击的是版权音乐库市场。Epidemic Sound、Artlist等平台赖以生存的“海量标准化配乐”，正是AI最容易替代的品类。格莱美制作人率先采用AI，也释放了另一个信号：专业音乐人不再把AI视作“竞争对手”，而是用作生产工具，音乐行业的创作流程正在被重塑。当然，版权归属、风格模仿的法律边界、以及AI生成内容对原创生态的挤压，仍是悬在整个赛道上方的达摩克里斯之剑。

不过，我们可以发现，AI音乐的竞争已经不再是“能不能生成”的问题，而是“谁能率先进入真实的商业场景”。从这个意义上说，这场比赛才刚刚开始。

来源：Google Blog、X

一、一次性铺开5大平台，从开发者到普通用户全覆盖

二、格莱美制作人率先上手，谷歌以“行业共创”打磨Lyria 3系列

三、责任机制：不模仿艺人风格，全部输出嵌入隐形水印

结语：从“能生成”到“能商用”，AI音乐的真正赛点才刚到来

相关推荐