Bendi新闻
>
拒绝机械感!30秒生成商用级歌曲,「歌歌AI」完成新一轮融资|早起看早期

拒绝机械感!30秒生成商用级歌曲,「歌歌AI」完成新一轮融资|早起看早期

7月前

一句话生成想要的歌曲。



邓咏仪

编辑苏建勋

来源智能涌现(ID:AIEmergence)

封面来源歌歌AI

在键盘上敲出短短一行命令:请给我写一首充满喜悦/悲伤/的歌,等待片刻,一首完整的、甚至带有人声、歌词的”歌曲“就已经完成——进入2024年,Suno等产品带来的热度还没散去,如今国内已经有不少瞄准AI音乐领域的产品,如雨后春笋般出现。

智能涌现此前报道的“歌歌AI”是其中的一员。这家公司近期获得新一轮数百万元投资,投资方为锡创投。

音律闪动成立于2022年8月,瞄准AI生成音乐方向,其主要产品为“歌歌AI”app。

音律闪动CTO王枢沛告诉智能涌现,音律闪动的团队为来自互联网大厂的技术专家,以及在音乐产业中的资深制作人。在生成式AI出现前,团队就已经有通过AI技术来探究在音乐领域中的应用——早在2016年,团队成员就开始开发AI写歌产品,并有项目创业经验。

真正促使团队创业的,是在2022年左右看到以Transformer架构为主的技术突破,“我们认为,这个技术能够真正改变音乐产业。”王枢沛表示。因此,从2023年成立开始,音律闪动就开始从底层模型开始训练,在经历2023年的小程序版试运营后,在4月完成了独立的app开发,近期刚刚上线。

“让所有人都成为音乐人”是歌歌AI的目标,从产品形态来看,歌歌AI是一款面向所有爱音乐的用户的AI写歌软件。使用方法也非常“傻瓜式”,容易上手——

用户进入app界面,即可看到三种模式:自由模式、惊喜模式、纯音乐模式,通过对话和“AI制作人”沟通,生成自己想要的音乐。

来源:歌歌AI

在自由模式下,用户可以输入简单一句话的Prompt,让AI生成拥有具体主题、完整旋律和人声的歌曲。

比如,智能涌现就以自由和勇气为主题,请AI帮忙写一首歌曲,不到1分钟内,歌歌AI就生成了一首时长为2分20秒的《希望之歌》,并且带有完整填词。

来源:歌歌AI

整首歌拥有比较和谐的旋律和编曲,并且旋律变换也相对丰富。不过在填词上,还是有个别词句会不通,或者断句尚有问题,但用户可以通过手动调整来完成歌词修改。哪怕不懂乐理,还可以通过简单点选操作,来调整每个字的音高。

来源:歌歌AI

“除了修改歌词和旋律,还有包括AI演唱的这个声音,用户也可以在选择付费后进行修改,替换成自己的声音。”王枢沛表示。

对于要求更高的用户,歌歌AI还提供了更专业的“惊喜模式”,能够生成满足商业级场景的歌曲。

在这一模式下,用户能够对音乐风格、具体的配器提出更多要求。AI能够生成更完整的旋律,会有完整的主歌、副歌、桥梁等结构。

并且,人声的变换也更加丰富——无论是颤音、旋律的高低变换过度都更自然,听起来更接近自然人声演唱的状态,“AI感”减少很多。

在所有模式下,歌歌AI都基于一定的免费积分,用户可以消耗积分以生成音乐。一旦用户对AI生成的demo比较满意,希望“扩写”,就能在对话框里和“AI制作人”对话,以修改风格等等,同时付费来让AI生成更完整的歌曲。目前的三档付费价格分别为包月18元、48元、98元。

音律闪动COO王枢沛对智能涌现表示,惊喜模式使用的是端到端的大模型技术,为了保证音乐效果质量更高,暂时不支持具体的歌词和人声修改,这也是与市面上大部分AI生成音乐产品相比,歌歌AI的优势所在。

“AI文字、图片生成现在都有开源框架,技术层面是比较开放的,但从AI生成音乐赛道整体来看,技术路线是比较封闭的,各家都有自己的训练技术差异。”王枢沛表示。

总体来说,上一代将AI技术应用到音乐中的尝试,普遍能做到的程度是,先生成MIDI音乐,即简单将旋律数字化,形成较为单调、机器感的单旋律。

在上一代AI技术逐步成熟之后,AI生成音乐进入到了用小模型、专家系统训练的阶段。简单而言,一种方式是通过人工标注大量的音乐片段,分“科目”训练模型,比如旋律、歌词、编曲等,都有单独的小模型。等到这些模型能够产出比较成熟的片段之后,再“拼接”起来,形成完整旋律。但这种方法的缺点是,由于各个元素是割裂的,拼接之后的机器感难以消除,也很难达到和谐的效果。

而从AI生成音乐的训练上,为了保证歌曲能做到质量更高、更自然,歌歌AI对标海外产品,选择了端到端的大模型路线,即音乐数据不需要经过特别细致的处理,就输入到模型中进行训练。这样能够生成比较完整、统一的旋律。

歌歌AI的另一个亮点在于,并不局限于“用AI写歌”的定位上,而是希望能够基于生成式AI技术,真正让音乐创作、分发方式的链条发生根本性变化。

音律闪动团队认为,目前音乐平台的推荐音乐内容千篇一律,并且推荐内容页不真正切合需求。“全国现在每天大概产生新产生约十几万首歌,但生成式AI技术能够让这个数字变成成百上千万。”王枢沛表示,AI技术的普及,也会让人们生成更个性化的音乐,成为打破现在音乐巨头垄断的机遇。

除了歌曲生成等基本功能外,歌歌AI也拓展了多个板块,涉及生成和分发。

比如,用户通过AI模型录入自己声音并生成歌曲,可选择不同风格和曲风,甚至发行全网。

歌歌AI近期也正在与国内主要音乐平台洽谈对接,以后希望做到的效果是,用户生成音乐后可以做到自动修音、AI混音处理,最后——全网一键发行,用户能够通过自己生成的AI音乐,获得版税。

并且,和短视频的结合也是重要的传播节点。当前,歌歌AI已经能够支持下载带有AI音乐的小视频,未来也会拓展到AI生成视频、直播场景。

本轮融资后,歌歌AI团队也会继续加速产品迭代,并且投入到市场增长方面。

团队方面,目前歌歌AI团队不到10人,CEO龙勇拥有20年音乐制作经验,曾是中国好声音、中国有嘻哈、TME官方合作伙伴,有丰富制作运营音乐和版权经验;COO王枢沛是浙江大学工学/美国伯克利音乐学院音乐制作和吉他表演双专业学士,曾任网易AI音乐业务“天音”发起人;CTO张文铂为“我要写歌”APP创始人。

36氪旗下AI公众号

👇🏻 真诚推荐你关注 👇🏻

点击关键词,查看最近的早起看早期
餐饮:「四叶咖」「爆爆姐螺蛳粉」「墨比优创」
医疗:「无忧跳动」「Glowe 阁楼」
文娱:「山漫文化」「集卡社」
教育办公:「推推(Tuitui)」「UPDF」

工业技术:「桥田智能」「贻如生物」「芯率智能」

微信扫码关注该文公众号作者

来源:36氪

相关新闻

餐饮供应链走向成熟,「鲜沐」完成新一轮融资|早起看早期人形机器人公司「加速进化」完成新一轮数千万融资,源码资本领投|早起看早期提供工业AI生成式设计软件,「设序科技」完成近亿元A+轮融资|早起看早期基于AI打造潮玩服饰,「TOP FAVOR」完成第四轮融资|早起看早期以纳米新材料技术撬动千亿温控市场,「磐际智储」完成天使轮融资|早起看早期「咖爷科技」完成数千万元A轮融资,自研商用全自动咖啡机「Smart X」|早起看早期大模型学会写万字长文,AI企业「波形智能」完成千万元Pre-A轮融资|早起看早期专注交通基础设施运维数智化升级,「圭目机器人」完成A+轮融资|早起看早期鲜肉饼配咖啡9块9,「饼小咖」完成千万级首轮融资丨早起看早期专注于职业主播孵化,「大捶文化」完成5000万天使轮融资|早起看早期聚焦牛肉饭品类,中式快餐品牌「牛大吉」完成8200万B1轮融资|早起看早期「kuiperbelt」完成天使轮融资,首款eBike「S1」欧洲多国上市| 早起看早期面向心理咨询师的AI助手,「心跃智能」获百万元种子轮融资|早起看早期专注于巧克力制品赛道,「斑马与巧BAN&CHOC」完成2000万元A轮融资|早起看早期把台球厅从地下搬到地面,「豆豆台球」完成1000万元天使轮融资|早起看早期消费级外骨骼已量产,「极壳科技」获数千万元Pre A轮融资|早起看早期主攻电动工具DIY场景,「铁腕创新」完成近2500万元天使轮融资|早起看早期一键成片,内容商业AIGC视频应用平台「筷子科技」完成近5000万元B1轮融资|早起看早期「天鹜科技」获数千万元Pre-A轮融资,成功交付多款AI设计蛋白质|早起看早期「溪砾科技」获3000万美元A轮融资,AI加速靶向RNA药物研发|早起看早期「联想系」大模型公司「诺谛智能」完成近亿元Pre-A轮融资,武岳峰科创领投|早起看早期「LEMMO」完成近千万美元Pre-A轮融资,自研E-PLUS技术,实现单车与电单车无缝切换|早起看早期「南京安立格」完成一亿元A轮融资,专注微界面反应强化解决方案|早起看早期「奥创光年」半年内再获1500万美元A+轮融资,加速AI全链路营销产品迭代升级|早起看早期
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。