谷歌Lyria 3音乐生成模型来袭，能否在AI音乐领域分一杯羹？-酒店常州论坛

谷歌推Lyria 3，欲在AI音乐领域分一杯羹

你已经习惯向ChatGPT、Gemini或Grok这类生成式AI工具输入指令，以获取答案、图片甚至视频。而谷歌希望你能用Lyria 3来创作音乐。你只需输入提示信息，上传音频或图片，该模型就能在数秒内将你的想法转化为一首歌曲。

Lyria 3于2月推出，是谷歌最先进的音乐生成模型。3月，谷歌又推出了更为先进的Lyria 3 Pro。此前，Suno和Udio等竞争对手在热门AI歌曲领域占据主导地位，如今谷歌也想分一杯羹。其实，谷歌此前也曾对音乐模型进行过试验，但Lyria 3和Lyria 3 Pro旨在创作出时长更长、音质更好且结构更完善的歌曲。下面让我们深入了解一下。

什么是Lyria 3？

Lyria 3是谷歌DeepMind最新的多模态音乐AI模型。这意味着它能处理多种类型的输入，包括文本、音频和图像，并创作出与视觉效果的情绪和节奏相契合的配乐。该工具能生成高保真的音乐，音符之间的过渡更加自然流畅，并且能在整首曲子中保持旋律、节奏和风格的一致性。

Gemini中的Lyria 3包含在谷歌所有的AI计划中，付费订阅用户和使用Lyria 3 Pro的用户享有更高的使用限制。据谷歌介绍，Lyria 3 Pro可在多个产品中使用，包括Vertex AI、Google AI Studio、Gemini API、Google Vids、Gemini应用程序以及ProducerAI（这是一个音乐创作平台，谷歌于2月将其引入Google Labs）。ProducerAI更像是一个创意伙伴，而非一次性的歌曲生成器。你不仅可以生成完整的歌曲，还能创作特定的音乐元素，如节拍、旋律或副歌，并对其进行不断调整。

如何开始使用Lyria

在Gemini中使用Lyria 3非常简单。你只需描述你想要的歌曲类型，或上传一张图片，Gemini就能利用AI生成一张封面图，并创作出一首30秒的歌曲。如果你选择“思考”模式，它还能生成更长的曲目，就像我创作的那首一样。

在谷歌的开发者工具和云产品中，Pro模型能更好地处理歌曲结构，包括前奏、主歌、副歌、过渡段和结尾。在Gemini API中，Lyria 3片段模型可生成30秒、48kHz的立体声音频。这两个模型都能让你对音乐性进行深度控制，你可以指定复杂的音乐流派、乐器配置，甚至是特定的音乐年代风格，如“70年代的模拟温暖感”。

谷歌表示，Lyria 3 Pro在一定限制下支持多轮编辑，这意味着你可以在对话中不断迭代修改，而无需每次都从头开始。但如果模型的创作方向出现偏差，通常从头开始会比不断细化更容易。

掌握提示技巧

在Lyria 3中，输入提示信息是发挥创意的关键。简单的关键词列表就能生成一首歌曲，但为了更好地控制模型，谷歌建议你使用以下框架：[流派和风格] + [情绪] + [乐器配置] + [节奏和韵律] + [演唱风格和语言] + [歌词]。你可以查看谷歌的提示指南，获取更详细的说明和创意灵感。你也可以让聊天机器人为你推荐提示信息。

Futureproof音乐学校的首席执行官John von Seggern表示：“文字与音乐并非一一对应的关系。你不能只输入‘给我创作一首朗朗上口的流行歌曲’，因为结果往往会与预期不同。”他认为，人们更愿意“利用AI创作一些小的音乐元素，而不是单纯用文字来塑造整首作品”。

歌词和语言

目前，Lyria 3支持用八种语言生成歌词和演唱，包括英语、西班牙语、法语、德语、葡萄牙语、印地语、日语和韩语。而且，它生成的音频并非像社交媒体上常见的那种机械呆板的声音，而是带有与你所选流派相匹配的情感表达。

处理歌曲歌词主要有两种方式。你可以描述一个特定的主题或情绪，让工具为你编写并演唱歌词；也可以在提示信息中提供自己的自定义歌词。此外，你还可以对歌词进行时间校准，精确控制歌词在歌曲中的起始和结束时间。Lyria 3还能处理翻译和演唱风格。如果你用英语输入指令，但指定歌曲要用其他支持的语言演唱，工具会自动处理翻译和演唱，例如“将这首歌曲制作成韩语K - pop风格”。

谁适合使用Lyria？

谷歌试图将Lyria 3定位为一款灵活的创意工具，而不仅仅是供爱好者消遣的玩具。最明显的使用场景是数字创作者和社交媒体影响者，比如为短视频、播客、宣传视频、演示文稿和社交媒体帖子创作背景音乐。von Seggern说：“我觉得它非常适合那种‘我正在为YouTube制作一个三分钟的视频，需要为我的纪录片配上一些普通背景音乐’的场景。”但别以为你只需输入提示信息就能一夜成名。他补充道：“如果你想对创作过程进行更精细的控制，那么你至少需要具备一定的音乐知识。”

谷歌还建议将其作为实验和教育工具，特别是对于那些没有乐器或缺乏资金支持的音乐项目的学生来说。

生成的音乐质量如何？

互联网上已经充斥着大量的AI垃圾内容，我们最不需要的就是更多糟糕的作品。音乐可能比文本或图像更难驾驭，因为人们对歌曲往往有着深厚的情感寄托。这使得像Lyria 3这样的工具既引人关注，又更容易受到严格审查。

von Seggern认为其音频质量“相当不错”，但对其原创性不太满意。他说：“我很失望，它生成的音乐似乎非常普通。”

版权和所有权问题

美国版权局2025年1月的报告指出，只有当人类为AI生成的作品提供了有意义的创意投入时，该作品才能获得版权保护，仅依靠提示信息生成的作品则无法获得版权。Belous Law Corporation和The Trademark Channel的创始人Relani Belous表示：“具体如何界定还存在一定的解释空间，但作品中仍然需要包含一些人类创作的元素。”

Belous建议，在计划将AI生成的音乐进行商业化之前，人们应三思而后行。她建议了解相关条款和法律风险，并咨询法律专家（Belous补充说明这只是一个法律观点，并非法律建议）。她还表示：“每当出现具有颠覆性的技术时，就会引发法律诉讼，而且在诉讼中，人们往往会追究最有经济实力的一方。”事实上，法律诉讼已经开始。今年3月，一群独立音乐人和词曲作者起诉谷歌，指控该公司在未经授权和支付费用的情况下，使用从YouTube上获取的“至少4400万个片段和28万小时的音乐”受版权保护的录音来训练Lyria 3。谷歌则表示，他们是“根据服务条款、合作伙伴协议和适用法律，使用YouTube和谷歌有权使用的材料”来训练Lyria 3模型的。

Belous指出，创作者往往从艺术的角度出发进行创作，而忽视商业方面的考虑，这使得他们在涉及合同、管理和资金等问题时更容易受到伤害。她还说：“历史上，音乐家常常没有得到应有的回报。”

谷歌表示，Gemini中生成的音乐嵌入了SynthID，这是一种直接嵌入AI生成音频内容中的无形、不可听的水印技术。该公司还称，Lyria 3 Pro旨在避免模仿现有艺术家的风格。Belous说：“你不能为一种风格申请版权，就像不能为一部在牧场拍摄的牛仔电影申请版权一样。但当涉及到旋律和独特元素时，就需要音乐学家来进行鉴定了。”她还指出，版权法中的合理使用原则常常被误解，不能将其作为侵权的借口。“合理使用并非一项权利，而是一种积极的抗辩理由，这意味着你虽然实施了侵权行为，但有合理的抗辩理由。”

AI生成音乐的未来走向

谷歌表示，他们相信与艺术家合作可以提升人类的创造力，而不是取代它。格莱美奖得主Wyclef Jean在创作歌曲《Back From Abu Dhabi》时，就将Lyria 3作为创意工具。Jean说：“我们人类比AI多了一份灵魂，而AI比我们拥有无限的创造力。将两者结合起来，将无往不胜。”

似乎其他艺术家，如Grimes，也不介意自己的音乐被用于AI训练或融合，但前提是要获得相应的报酬。她在2023年4月24日发布推文称：“任何使用我声音成功生成的AI歌曲，我都将收取50%的版税，这与我和其他艺术家合作的待遇相同。大家可以随意使用我的声音，无需承担任何责任。我没有签约唱片公司，也没有法律约束。”

然而，也有人试图利用AI音乐走向不良的方向。2025年，Spotify下架了一首以已故乡村歌手Blaze Foley（1989年去世）的名义上传的AI生成歌曲。Belous说：“我认为这里存在着巨大的不确定性和风险，需要进行平衡，这需要时间来验证，就像我们对待新技术一样。”她还注意到，许可协议正在发生变化，与AI相关的条款正在被添加到合同中。

Lyria 3在技术上令人印象深刻，在某些情况下似乎也很有用。但音乐是一种情感表达，若AI音乐想要被广泛接受，它不能仅仅只是毫无灵魂的背景音乐。

企业官网建设流程全解析

谷歌推Lyria 3，欲在AI音乐领域分一杯羹

什么是Lyria 3？

如何开始使用Lyria

掌握提示技巧

歌词和语言

谁适合使用Lyria？

生成的音乐质量如何？

版权和所有权问题

AI生成音乐的未来走向

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

谷歌推Lyria 3，欲在AI音乐领域分一杯羹

什么是Lyria 3？

如何开始使用Lyria

掌握提示技巧

歌词和语言

谁适合使用Lyria？

生成的音乐质量如何？

版权和所有权问题

AI生成音乐的未来走向

热门文章

文章分类

标签云

相关文章

别再用默认参数了！BLAST搜索保姆级调参指南：从BLOSUM62到Gap Penalty

Windows BAT脚本提权实战：从‘拒绝访问’到完美运行，我的踩坑记录与两种VBS方案详解

自学大模型，北京第一份工作13K。（记录一下我的经历）

需要专业的网站建设服务？