拒绝机械感！30秒生成商用级歌曲「歌歌AI」完成新一轮融资 36氪首发_供求信息

供求信息

您当前位置:首页 > 供求信息

拒绝机械感！30秒生成商用级歌曲「歌歌AI」完成新一轮融资 36氪首发

日期：

2024-05-01

作者: 上海体育nba直播视频直播

在键盘上敲出短短一行命令：请给我写一首充满喜悦/悲伤/的歌，等待片刻，一首完整的、甚至带有人声、歌词的”歌曲“就已完成——进入2024年，Suno等产品带来的热度还没散去，如今国内已经有不少瞄准AI音乐领域的产品，如雨后春笋般出现。

36氪此前报道的「歌歌AI」是其中的一员。此公司近期获得新一轮数百万元投资，投资方为锡创投。

音律闪动成立于2022年8月，瞄准AI生成音乐方向，其基本的产品为「歌歌AI」app。

音律闪动CTO王枢沛告诉36氪，音律闪动的团队为来自互联网大厂的技术专家，以及在音乐产业中的资深制作人。在生成式AI出现前，团队就已经有通过AI技术来探究在音乐领域中的应用——早在2016年，小组成员就开始开发AI写歌产品，并有项目创业经验。

真正促使团队创业的，是在2022年左右看到以Transformer架构为主的技术突破，“我们大家都认为，这个技术能够真正改变音乐产业。”王枢沛表示。因此，从2023年成立开始，音律闪动就开始从底层模型开始训练，在经历2023年的小程序版试运营后，在4月完成了独立的app开发，近期刚刚上线。

“让所有人都成为音乐人”是歌歌AI的目标，从产品形态来看，歌歌AI是一款面向所有爱音乐的用户的AI写歌软件。使用方法也非常“傻瓜式”，容易上手——

用户进入app界面，即可看到三种模式：自由模式、惊喜模式、纯音乐模式，通过对话和“AI制作人”沟通，生成自己想要的音乐。

在自由模式下，用户都能够输入简单一句话的Prompt，让AI生成拥有具体主题、完整旋律和人声的歌曲。

比如，36氪就以自由和勇气为主题，请AI帮忙写一首歌曲，不到1分钟内，歌歌AI就生成了一首时长为2分20秒的《希望之歌》，并且带有完整填词。

整首歌拥有比较和谐的旋律和编曲，并且旋律变换也相对丰富。不过在填词上，还是有个别词句会不通，或者断句尚有问题，但用户都能够通过手动调整来完成歌词修改。哪怕不懂乐理，还能够最终靠简单点选操作，来调整每个字的音高。

“除了修改歌词和旋律，还有包括AI演唱的这个声音，用户也可以在选择付费后做修改，替换成自己的声音。”王枢沛表示。

对于要求更高的用户，歌歌AI还提供了更专业的“惊喜模式”，能够生成满足商业级场景的歌曲。

在这一模式下，用户能对音乐风格、具体的配器提出更多要求。AI能够生成更完整的旋律，会有完整的主歌、副歌、桥梁等结构。

并且，人声的变换也更为丰富——无论是颤音、旋律的高低变换过度都更自然，听起来更接近自然人声演唱的状态，“AI感”减少很多。

在所有模式下，歌歌AI都基于一定的免费积分，用户都能够消耗积分以生成音乐。一旦用户对AI生成的demo比较满意，希望“扩写”，就能在对话框里和“AI制作人”对话，以修改风格等等，同时付费来让AI生成更完整的歌曲。目前的三档付费价格分别为包月18元、48元、98元。

音律闪动COO王枢沛对36氪表示，惊喜模式使用的是端到端的大模型技术，为了能够更好的保证音乐效果质量更高，暂时不支持具体的歌词和人声修改，这也是与市面上大部分AI生成音乐产品相比，歌歌AI的优势所在。

“AI文字、图片生成现在都有开源框架，技术层面是比较开放的，但从AI生成音乐赛道总的来看，技术路线是比较封闭的，各家都有自己的训练技术差异。”王枢沛表示。

总体来说，上一代将AI技术应用到音乐中的尝试，普遍能做到的程度是，先生成MIDI音乐，即简单将旋律数字化，形成较为单调、机器感的单旋律。

在上一代AI技术逐步成熟之后，AI生成音乐进入到了用小模型、专家系统训练的阶段。简单而言，一种方式是通过人工标注大量的音乐片段，分“科目”训练模型，比如旋律、歌词、编曲等，都有单独的小模型。等到这些模型能够产出很成熟的片段之后，再“拼接”起来，形成完整旋律。但这种方法的缺点是，由于各个元素是割裂的，拼接之后的机器感难以消除，也很难达到和谐的效果。

而从AI生成音乐的训练上，为了能够更好的保证歌曲能做到质量更高、更自然，歌歌AI对标海外产品，选择了端到端的大模型路线，即音乐数据不需要经过特别细致的处理，就输入到模型中进行训练。这样子就能够生成比较完整、统一的旋律。

歌歌AI的另一个亮点在于，并不局限于“用AI写歌”的定位上，而是希望可以基于生成式AI技术，真正让音乐创作、分发方式的链条发生根本性变化。

音律闪动团队认为，目前音乐平台的推荐音乐内容千篇一律，并且推荐内容页不真正切合需求。“全国现在每天大概产生新产生约十几万首歌，但生成式AI技术能够让这一个数字变成成百上千万。”王枢沛表示，AI技术的普及，也会让人们生成更个性化的音乐，成为打破现在音乐巨头垄断的机遇。

比如，用户通过AI模型录入自己声音并生成歌曲，可选择不一样的风格和曲风，甚至发行全网。

歌歌AI近期也正在与国内主要音乐平台洽谈对接，以后希望做到的效果是，用户生成音乐后能做到自动修音、AI混音处理，最后——全网一键发行，用户能通过自己生成的AI音乐，获得版税。

并且，和短视频的结合也是重要的传播节点。当前，歌歌AI已经能够支持下载带有AI音乐的小视频，未来也会拓展到AI生成视频、直播场景。

团队方面，目前歌歌AI团队不到10人，CEO龙勇拥有20年音乐制作经验，曾是中国好声音、中国有嘻哈、TME官方合作伙伴，有丰富制作运营音乐和版权经验；COO王枢沛是浙江大学工学/美国伯克利音乐学院音乐制作和吉他表演双专业学士；CTO张文铂为「我要写歌」APP创始人。

上一篇: 【知识产权宣传周】涵江法院发布知识产权保护典型案例【48812】南音博饼海蛎煎用英文怎样说？厦门有“参”

供求信息

PDD直播时唱了首歌被索赔10万腾讯新品将解决这类问题

刘半农：因创造一汉字被女人痛骂3年现在这字被国人遍及的运用

中国民用航空局令（第201号）

中立国 neutral country