用大模型写歌,豆包上线音乐生成功能 字节再补一块AI拼图

AI时代,写一首歌的时间也许只需按秒计算。

8月8日,《每日经济新闻》记者了解到,字节跳动旗下智能AI助手豆包已上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词,设定音乐风格、情绪及音色,便能快速生成一首约1分钟的词曲。

《每日经济新闻》记者使用该功能发现,目前豆包音乐生成功能提供民谣、嘻哈、R&B等11种音乐风格,其中还涵盖了爵士、雷鬼、电音等相对小众的曲风,用户可选择男声或女声演唱。

为让AI音乐更好地贴合普通用户的情感表达,豆包还预设了快乐、伤感等多种情绪状态。同时,生成歌曲支持一键分享至抖音等社交平台。

事实上,AI生成式音乐大模型已有先例。今年3月,科技公司Suno推出了AI音乐工具SunoV3,一度被外界视为“音乐界的ChatGPT”,该款大模型能够一次性完成歌词、演唱、编曲、配乐等音乐创作的全流程。5月末发布的最新3.5版本已支持所有用户制作4分钟的歌曲,创建最长2分钟的歌曲扩展。

《每日经济新闻》记者了解到,现阶段,豆包生成的音乐时长不超过1分钟,歌词字数不超过200。豆包相关负责人表示,音乐生成能力刚刚推出,还有各种待完善之处。豆包希望,这个功能可以激发更多人的创造力,让他们以音乐的形式表达自己的心情,分享自己的故事。

在新增音乐功能的同时,豆包的主力模型和多个垂类模型均在今年5月首次亮相后进行了升级迭代。

在7月25日的火山引擎2024“AI创新巡展”首站成都站上,豆包模型家族正式发布了“新成员”豆包·图生图模型。该模型能力已经在抖音、剪映、豆包、星绘等字节系App中落地,并通过火山引擎服务了三星、努比亚等企业客户,目前日均图生图数量达到数千万张。

此外,字节也没有忽略在AI视频生成工具上的投入。8月6日,字节跳动旗下剪映团队研发的一站式AI创作平台“即梦AI”移动版正式上架至苹果App Store应用商店,该应用目前拥有文生图和文/图生视频等功能。

官方数据显示,截至7月,豆包大模型日均Tokens使用量已突破5000亿,平均每家企业客户日均Tokens使用量较5月15日模型发布时期增长22倍。