Meta 先前发布并开源了自家的音乐生成 AI MusicGen。这个工具可以将文字描述转为约 12 秒的音频,也可以依照参考的音频来进行调整,会生成符合文字描述和参考音乐的旋律。
MusicGen 是基於 Transformer 模型开发的,音频资料则是藉由 Meta 的 EnCodec 音频tokenizer 分割成较小的部分,可以如同大型语言模型可以预测出音乐的下一个片段。
MusicGen 是藉 2 万小时的音乐数据进行训练,其中包括 1 万首授权音乐曲目,以及来自ShutterStock 和 Pond5 的 39 万首仅有乐器的歌曲。
经外媒《TechCrunch》实测,当下简单的指令时,MusicGen 生成的歌曲是具旋律的,生成结果与 Google 的音乐生成 AI MusicLM 结果相当。
利用生成式 AI 集结既有歌曲元素自制成新音乐的风气愈来愈盛,像是先前藉由歌手 Drake 和 The Weeknd 声音生成的 AI 歌曲《Heart on My Sleeve》在网路上爆红。但音乐产业像唱片公司环球音乐集团 Universal Music Group 等,呼吁串流平台不要让 AI 使用有版权的歌曲进行训练。
Meta 对 MusicGen 虽然没有对使用者施加限制,但强调 MusicGen 所使用的训练资料,都有先与音乐合法持有者包括 Shutterstock 签订协议。
资料来源:TechCrunch、Dataconomy、The Guardian
责任编辑:Jocelyn
核稿编辑:Sisley