供求信息
拒绝机械感!30秒生成商用级歌曲「歌歌AI」完成新一轮融资 36氪首发

日期:

2024-05-01

  在键盘上敲出短短一行命令:请给我写一首充满喜悦/悲伤/的歌,等待片刻,一首完整的、甚至带有人声、歌词的”歌曲“就已完成——进入2024年,Suno等产品带来的热度还没散去,如今国内已经有不少瞄准AI音乐领域的产品,如雨后春笋般出现。

  36氪此前报道的「歌歌AI」是其中的一员。此公司近期获得新一轮数百万元投资,投资方为锡创投。

  音律闪动成立于2022年8月,瞄准AI生成音乐方向,其基本的产品为「歌歌AI」app。

  音律闪动CTO王枢沛告诉36氪,音律闪动的团队为来自互联网大厂的技术专家,以及在音乐产业中的资深制作人。在生成式AI出现前,团队就已经有通过AI技术来探究在音乐领域中的应用——早在2016年,小组成员就开始开发AI写歌产品,并有项目创业经验。

  真正促使团队创业的,是在2022年左右看到以Transformer架构为主的技术突破,“我们大家都认为,这个技术能够真正改变音乐产业。”王枢沛表示。因此,从2023年成立开始,音律闪动就开始从底层模型开始训练,在经历2023年的小程序版试运营后,在4月完成了独立的app开发,近期刚刚上线。

  “让所有人都成为音乐人”是歌歌AI的目标,从产品形态来看,歌歌AI是一款面向所有爱音乐的用户的AI写歌软件。使用方法也非常“傻瓜式”,容易上手——

  用户进入app界面,即可看到三种模式:自由模式、惊喜模式、纯音乐模式,通过对话和“AI制作人”沟通,生成自己想要的音乐。

  在自由模式下,用户都能够输入简单一句话的Prompt,让AI生成拥有具体主题、完整旋律和人声的歌曲。

  比如,36氪就以自由和勇气为主题,请AI帮忙写一首歌曲,不到1分钟内,歌歌AI就生成了一首时长为2分20秒的《希望之歌》,并且带有完整填词。

  整首歌拥有比较和谐的旋律和编曲,并且旋律变换也相对丰富。不过在填词上,还是有个别词句会不通,或者断句尚有问题,但用户都能够通过手动调整来完成歌词修改。哪怕不懂乐理,还能够最终靠简单点选操作,来调整每个字的音高。

  “除了修改歌词和旋律,还有包括AI演唱的这个声音,用户也可以在选择付费后做修改,替换成自己的声音。”王枢沛表示。

  对于要求更高的用户,歌歌AI还提供了更专业的“惊喜模式”,能够生成满足商业级场景的歌曲。

  在这一模式下,用户能对音乐风格、具体的配器提出更多要求。AI能够生成更完整的旋律,会有完整的主歌、副歌、桥梁等结构。

  并且,人声的变换也更为丰富——无论是颤音、旋律的高低变换过度都更自然,听起来更接近自然人声演唱的状态,“AI感”减少很多。

  在所有模式下,歌歌AI都基于一定的免费积分,用户都能够消耗积分以生成音乐。一旦用户对AI生成的demo比较满意,希望“扩写”,就能在对话框里和“AI制作人”对话,以修改风格等等,同时付费来让AI生成更完整的歌曲。目前的三档付费价格分别为包月18元、48元、98元。

  音律闪动COO王枢沛对36氪表示,惊喜模式使用的是端到端的大模型技术,为了能够更好的保证音乐效果质量更高,暂时不支持具体的歌词和人声修改,这也是与市面上大部分AI生成音乐产品相比,歌歌AI的优势所在。

  “AI文字、图片生成现在都有开源框架,技术层面是比较开放的,但从AI生成音乐赛道总的来看,技术路线是比较封闭的,各家都有自己的训练技术差异。”王枢沛表示。

  总体来说,上一代将AI技术应用到音乐中的尝试,普遍能做到的程度是,先生成MIDI音乐,即简单将旋律数字化,形成较为单调、机器感的单旋律。

  在上一代AI技术逐步成熟之后,AI生成音乐进入到了用小模型、专家系统训练的阶段。简单而言,一种方式是通过人工标注大量的音乐片段,分“科目”训练模型,比如旋律、歌词、编曲等,都有单独的小模型。等到这些模型能够产出很成熟的片段之后,再“拼接”起来,形成完整旋律。但这种方法的缺点是,由于各个元素是割裂的,拼接之后的机器感难以消除,也很难达到和谐的效果。

  而从AI生成音乐的训练上,为了能够更好的保证歌曲能做到质量更高、更自然,歌歌AI对标海外产品,选择了端到端的大模型路线,即音乐数据不需要经过特别细致的处理,就输入到模型中进行训练。这样子就能够生成比较完整、统一的旋律。

  歌歌AI的另一个亮点在于,并不局限于“用AI写歌”的定位上,而是希望可以基于生成式AI技术,真正让音乐创作、分发方式的链条发生根本性变化。

  音律闪动团队认为,目前音乐平台的推荐音乐内容千篇一律,并且推荐内容页不真正切合需求。“全国现在每天大概产生新产生约十几万首歌,但生成式AI技术能够让这一个数字变成成百上千万。”王枢沛表示,AI技术的普及,也会让人们生成更个性化的音乐,成为打破现在音乐巨头垄断的机遇。

  比如,用户通过AI模型录入自己声音并生成歌曲,可选择不一样的风格和曲风,甚至发行全网。

  歌歌AI近期也正在与国内主要音乐平台洽谈对接,以后希望做到的效果是,用户生成音乐后能做到自动修音、AI混音处理,最后——全网一键发行,用户能通过自己生成的AI音乐,获得版税。

  并且,和短视频的结合也是重要的传播节点。当前,歌歌AI已经能够支持下载带有AI音乐的小视频,未来也会拓展到AI生成视频、直播场景。

  团队方面,目前歌歌AI团队不到10人,CEO龙勇拥有20年音乐制作经验,曾是中国好声音、中国有嘻哈、TME官方合作伙伴,有丰富制作运营音乐和版权经验;COO王枢沛是浙江大学工学/美国伯克利音乐学院音乐制作和吉他表演双专业学士;CTO张文铂为「我要写歌」APP创始人。