谷歌Lyria 3音乐生成模型来袭,能否在AI音乐领域分一杯羹?
2026/4/22 10:39:28 网站建设 项目流程

谷歌推Lyria 3,欲在AI音乐领域分一杯羹

你已经习惯向ChatGPT、Gemini或Grok这类生成式AI工具输入指令,以获取答案、图片甚至视频。而谷歌希望你能用Lyria 3来创作音乐。你只需输入提示信息,上传音频或图片,该模型就能在数秒内将你的想法转化为一首歌曲。

Lyria 3于2月推出,是谷歌最先进的音乐生成模型。3月,谷歌又推出了更为先进的Lyria 3 Pro。此前,Suno和Udio等竞争对手在热门AI歌曲领域占据主导地位,如今谷歌也想分一杯羹。其实,谷歌此前也曾对音乐模型进行过试验,但Lyria 3和Lyria 3 Pro旨在创作出时长更长、音质更好且结构更完善的歌曲。下面让我们深入了解一下。

什么是Lyria 3?

Lyria 3是谷歌DeepMind最新的多模态音乐AI模型。这意味着它能处理多种类型的输入,包括文本、音频和图像,并创作出与视觉效果的情绪和节奏相契合的配乐。该工具能生成高保真的音乐,音符之间的过渡更加自然流畅,并且能在整首曲子中保持旋律、节奏和风格的一致性。

Gemini中的Lyria 3包含在谷歌所有的AI计划中,付费订阅用户和使用Lyria 3 Pro的用户享有更高的使用限制。据谷歌介绍,Lyria 3 Pro可在多个产品中使用,包括Vertex AI、Google AI Studio、Gemini API、Google Vids、Gemini应用程序以及ProducerAI(这是一个音乐创作平台,谷歌于2月将其引入Google Labs)。ProducerAI更像是一个创意伙伴,而非一次性的歌曲生成器。你不仅可以生成完整的歌曲,还能创作特定的音乐元素,如节拍、旋律或副歌,并对其进行不断调整。

如何开始使用Lyria

在Gemini中使用Lyria 3非常简单。你只需描述你想要的歌曲类型,或上传一张图片,Gemini就能利用AI生成一张封面图,并创作出一首30秒的歌曲。如果你选择“思考”模式,它还能生成更长的曲目,就像我创作的那首一样。

在谷歌的开发者工具和云产品中,Pro模型能更好地处理歌曲结构,包括前奏、主歌、副歌、过渡段和结尾。在Gemini API中,Lyria 3片段模型可生成30秒、48kHz的立体声音频。这两个模型都能让你对音乐性进行深度控制,你可以指定复杂的音乐流派、乐器配置,甚至是特定的音乐年代风格,如“70年代的模拟温暖感”。

谷歌表示,Lyria 3 Pro在一定限制下支持多轮编辑,这意味着你可以在对话中不断迭代修改,而无需每次都从头开始。但如果模型的创作方向出现偏差,通常从头开始会比不断细化更容易。

掌握提示技巧

在Lyria 3中,输入提示信息是发挥创意的关键。简单的关键词列表就能生成一首歌曲,但为了更好地控制模型,谷歌建议你使用以下框架:[流派和风格] + [情绪] + [乐器配置] + [节奏和韵律] + [演唱风格和语言] + [歌词]。你可以查看谷歌的提示指南,获取更详细的说明和创意灵感。你也可以让聊天机器人为你推荐提示信息。

Futureproof音乐学校的首席执行官John von Seggern表示:“文字与音乐并非一一对应的关系。你不能只输入‘给我创作一首朗朗上口的流行歌曲’,因为结果往往会与预期不同。”他认为,人们更愿意“利用AI创作一些小的音乐元素,而不是单纯用文字来塑造整首作品”。

歌词和语言

目前,Lyria 3支持用八种语言生成歌词和演唱,包括英语、西班牙语、法语、德语、葡萄牙语、印地语、日语和韩语。而且,它生成的音频并非像社交媒体上常见的那种机械呆板的声音,而是带有与你所选流派相匹配的情感表达。

处理歌曲歌词主要有两种方式。你可以描述一个特定的主题或情绪,让工具为你编写并演唱歌词;也可以在提示信息中提供自己的自定义歌词。此外,你还可以对歌词进行时间校准,精确控制歌词在歌曲中的起始和结束时间。Lyria 3还能处理翻译和演唱风格。如果你用英语输入指令,但指定歌曲要用其他支持的语言演唱,工具会自动处理翻译和演唱,例如“将这首歌曲制作成韩语K - pop风格”。

谁适合使用Lyria?

谷歌试图将Lyria 3定位为一款灵活的创意工具,而不仅仅是供爱好者消遣的玩具。最明显的使用场景是数字创作者和社交媒体影响者,比如为短视频、播客、宣传视频、演示文稿和社交媒体帖子创作背景音乐。von Seggern说:“我觉得它非常适合那种‘我正在为YouTube制作一个三分钟的视频,需要为我的纪录片配上一些普通背景音乐’的场景。”但别以为你只需输入提示信息就能一夜成名。他补充道:“如果你想对创作过程进行更精细的控制,那么你至少需要具备一定的音乐知识。”

谷歌还建议将其作为实验和教育工具,特别是对于那些没有乐器或缺乏资金支持的音乐项目的学生来说。

生成的音乐质量如何?

互联网上已经充斥着大量的AI垃圾内容,我们最不需要的就是更多糟糕的作品。音乐可能比文本或图像更难驾驭,因为人们对歌曲往往有着深厚的情感寄托。这使得像Lyria 3这样的工具既引人关注,又更容易受到严格审查。

von Seggern认为其音频质量“相当不错”,但对其原创性不太满意。他说:“我很失望,它生成的音乐似乎非常普通。”

版权和所有权问题

美国版权局2025年1月的报告指出,只有当人类为AI生成的作品提供了有意义的创意投入时,该作品才能获得版权保护,仅依靠提示信息生成的作品则无法获得版权。Belous Law Corporation和The Trademark Channel的创始人Relani Belous表示:“具体如何界定还存在一定的解释空间,但作品中仍然需要包含一些人类创作的元素。”

Belous建议,在计划将AI生成的音乐进行商业化之前,人们应三思而后行。她建议了解相关条款和法律风险,并咨询法律专家(Belous补充说明这只是一个法律观点,并非法律建议)。她还表示:“每当出现具有颠覆性的技术时,就会引发法律诉讼,而且在诉讼中,人们往往会追究最有经济实力的一方。”事实上,法律诉讼已经开始。今年3月,一群独立音乐人和词曲作者起诉谷歌,指控该公司在未经授权和支付费用的情况下,使用从YouTube上获取的“至少4400万个片段和28万小时的音乐”受版权保护的录音来训练Lyria 3。谷歌则表示,他们是“根据服务条款、合作伙伴协议和适用法律,使用YouTube和谷歌有权使用的材料”来训练Lyria 3模型的。

Belous指出,创作者往往从艺术的角度出发进行创作,而忽视商业方面的考虑,这使得他们在涉及合同、管理和资金等问题时更容易受到伤害。她还说:“历史上,音乐家常常没有得到应有的回报。”

谷歌表示,Gemini中生成的音乐嵌入了SynthID,这是一种直接嵌入AI生成音频内容中的无形、不可听的水印技术。该公司还称,Lyria 3 Pro旨在避免模仿现有艺术家的风格。Belous说:“你不能为一种风格申请版权,就像不能为一部在牧场拍摄的牛仔电影申请版权一样。但当涉及到旋律和独特元素时,就需要音乐学家来进行鉴定了。”她还指出,版权法中的合理使用原则常常被误解,不能将其作为侵权的借口。“合理使用并非一项权利,而是一种积极的抗辩理由,这意味着你虽然实施了侵权行为,但有合理的抗辩理由。”

AI生成音乐的未来走向

谷歌表示,他们相信与艺术家合作可以提升人类的创造力,而不是取代它。格莱美奖得主Wyclef Jean在创作歌曲《Back From Abu Dhabi》时,就将Lyria 3作为创意工具。Jean说:“我们人类比AI多了一份灵魂,而AI比我们拥有无限的创造力。将两者结合起来,将无往不胜。”

似乎其他艺术家,如Grimes,也不介意自己的音乐被用于AI训练或融合,但前提是要获得相应的报酬。她在2023年4月24日发布推文称:“任何使用我声音成功生成的AI歌曲,我都将收取50%的版税,这与我和其他艺术家合作的待遇相同。大家可以随意使用我的声音,无需承担任何责任。我没有签约唱片公司,也没有法律约束。”

然而,也有人试图利用AI音乐走向不良的方向。2025年,Spotify下架了一首以已故乡村歌手Blaze Foley(1989年去世)的名义上传的AI生成歌曲。Belous说:“我认为这里存在着巨大的不确定性和风险,需要进行平衡,这需要时间来验证,就像我们对待新技术一样。”她还注意到,许可协议正在发生变化,与AI相关的条款正在被添加到合同中。

Lyria 3在技术上令人印象深刻,在某些情况下似乎也很有用。但音乐是一种情感表达,若AI音乐想要被广泛接受,它不能仅仅只是毫无灵魂的背景音乐。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询