智东西(公众号:zhidxcom)
编译 | 杨京丽
编辑 | 李水青
智东西3月26日消息,谷歌于当地时间3月25日发布了AI音乐生成模型Lyria 3 Pro。作为上月发布的Lyria 3的进阶版本,Lyria 3 Pro由谷歌DeepMind团队打造,最大的升级是音乐时长大幅提升,由此前的30秒提升至3分钟。此外,模型能够理解歌曲结构,用户可以通过提示词指定前奏、主歌、副歌、桥段等段落,对完整歌曲进行精细控制。
与模型升级同步,谷歌还将Lyria 3系列一口气铺进了Vertex AI、Google AI Studio与Gemini API、Google Vids、Gemini应用以及ProducerAI等多个产品平台,覆盖从企业级开发到个人创作的全链路场景。

▲谷歌官宣新模型Lyria 3 Pro(图源:X)
智东西在谷歌ProducerAI平台上试用该模型,生成了几首歌曲。
首先我先给Lyria了一张前段时间去海边旅游的照片,让它根据照片生成音乐。

▲Lyria 3 Pro根据图片生成音乐
▲音频由Lyria 3 Pro生成
首先它对图片理解的比较清晰,迅速捕捉到了画面中海鸥这一元素。不到一分钟,歌曲也生成出来了,整体采用电吉他作为主旋律,加入了海鸥的叫声和浪花作为白噪音,此外用沙锤打节奏。整体音质清晰、自然流畅,很有律动感、层次感,能够从中感受到自由的氛围。
后面,我又让它创作了一首古风歌曲,提示词是这么写的:
“创作一首抒情的国风中文歌曲,中低音女声,伴奏除了曲调外,可以加入笛子、古筝或琵琶,演绎要有情感”
▲音频由Lyria 3 Pro生成

▲Lyria生成的歌词
客观来讲,歌词写的一般,不怎么押韵,语言质感稍差了一些。不过,音乐听着还是不错的,能够看出Lyria 3 Pro对于歌曲的认知,副歌、主歌交代得很明白,提示词理解清晰,能够明显听到笛子声,歌声也很有情绪。
从实际体验来看,Lyria 3 Pro已经开始具备生成成熟作品的能力。也正因此,谷歌这次发布的重点不只在于“模型更强了”,还在于迅速把这项能力接入多个产品入口,让开发者、企业用户和普通创作者都能直接用起来。
一、一次性铺开5大平台,从开发者到普通用户全覆盖
Lyria 3 Pro现已在谷歌云的Vertex AI上开放公开预览,面向需要大规模按需生成音频的用户。用户可将其应用至游戏配乐批量生成、创意工具集成、音乐和视频平台嵌入等典型场景。
与此同时,面向开发者的Google AI Studio和Gemini API也同步上线了Lyria 3 Pro,与此前发布的Lyria RealTime(实时音乐生成能力)并列提供,开发者可以将这些能力集成到自己的应用中。

▲API网站上关于Lyria 3 Pro的介绍(图源:Gemini API)
在消费端,谷歌的AI视频创作应用Google Vids本周起向Google Workspace企业客户和Google AI Pro & Ultra付费订阅用户开放Lyria 3和Lyria 3 Pro,用户可以为营销视频、创意项目等添加定制配乐。Gemini应用中,付费订阅用户现在也可以用Lyria 3 Pro生成更长的音乐作品,适用于vlog、播客、教学视频等场景。
此外,谷歌此前推出的协作式音乐创作工具ProducerAI也搭载了Lyria 3 Pro。谷歌称,ProducerAI由音乐人构建,搭载新模型后提供Agent式体验,能帮助艺术家、制作人和词曲作者在各个水平上迭代完整歌曲,目前面向全球免费和付费用户开放。

▲协作式音乐创作工具ProducerAI(图源:ProducerAI)
二、格莱美制作人率先上手,谷歌以“行业共创”打磨Lyria 3系列
谷歌着重强调Lyria 3开发过程中,持续与音乐行业深度协作。此前,谷歌通过Music AI Sandbox项目为音乐人、制作人和词曲作者提供了一套实验性工具,从这些合作中获得的反馈,对Lyria 3的研发影响深远。
在实际应用层面,格莱美获奖制作人扬·斯皮尔伯格(Yung Spielburg)已将Lyria用于谷歌DeepMind短片《Dear Upstairs Neighbors》的配乐创作流程中。

▲谷歌DeepMind短片《Dear Upstairs Neighbors》海报(图源:谷歌)
知名DJ兼制作人弗朗索瓦·K(François K)也在使用Lyria进行迭代创作,其作品即将发布。弗朗索瓦·K在评价中表示:“在探索了大量音乐工具之后,Lyria 3的进步令人震惊,其保真度和音乐性强。我使用生成式AI工具的方式从来不是‘一键生成’,而是将它作为武器库中的多功能组件,让我以更高的真实感和精确度打磨创意。”
三、责任机制:不模仿艺人风格,全部输出嵌入隐形水印
在版权责任方面,谷歌为Lyria 3设置了多重防护。训练数据方面,Lyria 3使用的是YouTube和谷歌依据服务条款、合作协议及适用法律有权使用的素材。艺人保护上,Lyria 3和Gemini不会模仿特定艺术家的风格,当用户在提示词中输入某位创作者的名字时,模型只会将其作为宽泛的灵感方向,而非进行风格复制。
此外,系统还会对生成内容进行比对过滤,防止输出与已有作品高度相似。所有Lyria 3和Lyria 3 Pro生成的音频都嵌入了SynthID隐形水印,用于标识AI生成内容。
结语:从“能生成”到“能商用”,AI音乐的真正赛点才刚到来
Lyria 3 Pro将AI生成音乐的时长从30秒推至3分钟,AI音乐已经从Demo走向完整作品。此前,Suno、Udio等AI音乐创企已凭借社区传播跑出了可观的用户规模,但它们面临的共同问题是:生成质量的天花板受限于模型能力。
当AI能够批量生成游戏配乐、广告音乐和短视频BGM时,首先受到冲击的是版权音乐库市场。Epidemic Sound、Artlist等平台赖以生存的“海量标准化配乐”,正是AI最容易替代的品类。格莱美制作人率先采用AI,也释放了另一个信号:专业音乐人不再把AI视作“竞争对手”,而是用作生产工具,音乐行业的创作流程正在被重塑。当然,版权归属、风格模仿的法律边界、以及AI生成内容对原创生态的挤压,仍是悬在整个赛道上方的达摩克里斯之剑。
不过,我们可以发现,AI音乐的竞争已经不再是“能不能生成”的问题,而是“谁能率先进入真实的商业场景”。从这个意义上说,这场比赛才刚刚开始。
来源:Google Blog、X