Meta 开源 AI 语言模型 MusicGen 可将文本和旋律转化为完整乐曲

智能机器人 2025-03-26 10:38www.robotxin.com人工智能机器人网

Meta最近在其Github平台上开源了其AI语言模型MusicGen。这款模型是基于谷歌在2017年推出的Transformer模型研发而来。正如其名所示,MusicGen主要用于音乐创作,可将文本和已有的旋律转化为完整的乐曲。研发团队采用了强大的技术手段来打造这款模型。他们使用了高达20000小时的授权音乐来训练该模型,并运用meta特有的EnCodec编码器将音频数据分解为更小的单元进行高效并行处理。这使得MusicGen相较于同类AI模型运算效率和生成速度更具优势。除了音频处理方面的高级技术外,MusicGen还具备强大的文本与旋律结合能力。用户只需输入一段文字描述,如“生成一首轻快的曲目,并融入贝多芬《欢乐颂》的元素”,MusicGen就能够完美融合文本和旋律,创造出令人惊叹的作品。研发团队对MusicGen的实际表现进行了详尽的测试,并与谷歌的MusicLM以及其他音乐模型如Riffusion、Mousai和Noise2Music等进行了对比。测试结果显示,MusicGen在音乐与文本提示的匹配度以及作曲可信度等方面表现尤为出色,总体水平甚至超过了谷歌的MusicLM。值得一提的是,Meta已经允许该模型的商业使用,并在Huggingface上发布了一个互动演示网页应用,让用户能够亲身体验MusicGen的强大功能。

上一篇:会说话的美女机器人多少钱一个 下一篇:没有了

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by