作者 | 傅宇琪
生成式 AI 技术的飞速发展,不断突破人们的想象边界。从文生图、文生视频,AI 技术的进步不免让人感叹其对传统创作领域的冲击。如今,这股创新的浪潮终于涌向了音乐产业。
近期,一款名为 Suno AI 的音乐创作工具成为了业界的焦点。用户只需提供一段简单的文本提示,便能够生成一首包含歌词、人声和伴奏的完整歌曲。Suno AI 还允许用户根据个人喜好选择不同的音乐风格,从而满足个性化的音乐创作需求。
同时,文本分析领域也正在“卷天卷地”。近日,月之暗面旗下的智能助手 Kimi 因其长文本处理能力,同样引起了巨大讨论。
AI 测评室营业了!本期,让我们一起看看 Kimi+Suno 会碰撞出什么样的火花!
原神,启动!
在测评的最开始,我想为现在大热的游戏《原神》生成 BGM,来测测 Suno 不带歌词的 instrumental 能力
图省事儿,我直接让 Kimi 帮我写好 prompt:
很有模有样嘛!从五个 prompt 中,我选择了元素之力战斗场景神秘遗迹与古代文明这两个主题,先用 Kimi 翻译成英文,再缩短使其简练些,最后的 prompt 长这样:
  1. Battle:
    "Generate intense, elemental-themed battle music with tight rhythms and distinct sounds for fire, ice, and lightning, highlighting the combat's vigor in Genshin Impact."
  2. Ancient Mysteries:
    "Compose a mysterious track with cello and ethnic percussion for scenes of ancient exploration, evoking the allure of forgotten civilizations in Genshin Impact."
把 prompt 分别输入 Suno 后,首先得到的是元素战斗主题的歌曲:
怎么说呢,节奏很紧张,弦乐让整体十分厚重且宏大,但似乎不太战斗(?),也没有体现火、冰、闪电这些元素,感觉和游戏不太搭。
接着是第二首古代文明主题的歌曲:
Suno 给到低沉的轰鸣、清脆的钢琴声,虽然没有用 prompt 中提到的大提琴和民族打击乐,但这首歌整体是神圣和宁静的,整个人仿佛沐浴在圣母的光辉下,也就不偏离我想要的“神秘的远古探索感”。顺便提一嘴,和永恒绿洲很配!
所以,我想给 Suno 这轮的表现打🌟🌟✨,读者朋友中的原神玩家对这两首 BGM 满意吗?
重金属版《新造的人》
最近热门的电影除了刚上映的《沙丘 2》、狂揽奥斯卡 7 项大奖的《奥本海默》,还有就是年度国产院线电影尺度扛把子《周处除三害》了!相信看过这部电影的朋友,都对其中洗脑的《新造的人》印象深刻。那也让 Kimi 给没来得及看《周处除三害》的朋友们科普一下这首歌:
读者朋友们可以先听听原曲:
歌词如下:
[Verse 1]
曾经我茫然前行黯夜的路上,微风刺痛着灵魂,找不到应该的方向。
[Chorus]
生命这样的旅程,要用多少泪水来完整。是否我能期待遥远天际。一起飞翔,新造的人。生命这样的旅程,我渴求你的微笑来完整。你能为我打开自由的门,牵起手吧,新造的人。
[Verse 2]
你看它白色的翅膀,耀眼而无暇。我们平凡的灵魂,紧紧跟随不需多想。
[Chorus]
生命这样的旅程,要用多少泪水来完整。是否我能期待遥远天际,一起飞翔,新造的人。生命这样的旅程,我渴求你的微笑来完整。你能为我打开自由的门,牵起手吧,新造的人。
[Bridge]
走向那道光,把名字遗忘,他将会永生,在你我的心中。
[Outro]
啦啦啦啦啦啦啦,他将会永生,在你我的心中。
大家可以听到,原曲使用吉他进行伴奏,是一种小清新风格。在电影中,灵修中心的人合唱着这首歌,伴随着阮经天扮演的男主角陈桂林不断地朝他们一次次开枪,形成了一种黑色幽默和文艺怪诞的感觉。我很好奇,在这样暴力的场景下如果搭上重金属风格的音乐,会适配吗?
于是,把歌词直接输入 Suno ,填写音乐风格为 heavy metal,我们就得到了这首重金属版《新造的人》:
家人们,燃起来了!!不得不说这首歌完全命中了我想要的点,从密集鼓点 intro,到嘶吼着的“微风刺痛着灵魂”,到抓耳的副歌,最后到 outro 没有背景音乐的“他就会永生”,很嗨很爽!(建议大家搭配陈桂林 6 分钟“冥”场面食用。)用这首重金属版《新造的人》,相信陈桂林可以根据节奏更放肆地“测试上天的旨意”了!
这一次我很满意,豪掷🌟🌟🌟🌟🌟给到 Suno!
伏地魔 X 林黛玉
伏地魔和林黛玉这对“拉郎”cp 虽然离谱,但是我觉得好磕、爱磕。所以接下来,我让 Kimi 以伏地魔的视角给林黛玉写一首情歌,为了让黛玉能听懂,咱们贴心地准备了文言文歌词。至于歌曲风格,既然是情歌,就得体现伏地魔的温柔一面,于是我选择了 blues(蓝调布鲁斯),歌曲名为《夜思黛玉》,期待 AI 版伏地魔同学能唱出他的浪漫。
我一连生成了四次,Suno 给我的都是女声的音乐,我觉得非常奇怪,于是再仔细读了一遍歌词,发现原版歌词里头出现了很多次“君”字,Suno 可能以此判别歌者为女生了。手动将“君”改成“汝”之后,歌曲终于是男声了。这么看来,Suno 能够通过歌词来判断用户想要的歌者性别?
歌词如下:
[Verse 1]
月下影孤,心绪如织,独坐幽暗之境,思汝之意,难以言表。魔法虽强,权势虽高,然心之所向,唯愿与汝共赏,花开花落。
[Chorus]
黛玉,黛玉,泪痕满袖,红尘若许,愿化作风,吹散愁云,抚慰汝心,共赴红楼,细数流年。
[Verse 2]
魂绕潇湘,夜雨敲窗,思汝之心,如影随形。愿抛却黑暗之权势,换得与汝共度,岁月静好。
[Chorus]
黛玉,黛玉,泪眼问花花不语,乱红飞过秋千去。红尘若许,愿为汝守候,直至天荒地老,海枯石烂。
[Bridge]
情深入骨,恨不相逢未嫁时,愿以千年修行,换汝一日之笑。红尘万丈,不过一场梦,唯愿与汝,共赏月明星稀。
[Chorus]
黛玉,黛玉,泪痕满袖,红尘若许,愿化作风,吹散愁云,抚慰汝心,共赴红楼,细数流年。
让我们一起听听“伏地魔”献给“林黛玉”的这首歌:
前奏电吉他一推弦,小颤音一挠,布鲁斯的味道就出来了。男声一出来,我倒吸一口凉气,直呼:怎么觉得像是陶喆唱的(陶喆老师:别尬黑),好好听啊~
特别是“愿为汝守候,直至天荒地老,海枯石烂~~”这句,陶喆老师啊不是唱得我心都要碎了。
我很喜欢这次生成的歌曲,不过因为生成了足足花了我 50 credit 才得到想要的结果,扣半颗星,给到🌟🌟🌟🌟✨的高分!
AI 有嘻哈
《中国新说唱 2024》即将开播,这个热度不蹭白不蹭,摩拳擦掌地让 Kimi 和 Suno 帮我准备准备海选。
为了确保 Kimi 写出来的歌词符合京瓷儿的感觉,我特地先问了问它认不认识北京 rapper 。好家伙,一下给我列出了十多位北京的 OG :
既然如此,那就直接让它帮我写词了!为了让词真的能 rap,我特意提到了押韵、flow、punchline 这些说唱要素。结果 Kimi 输出了……
Yo,我是京城的孩子,站在这舞台中央,18岁的梦想,像火焰在心中燃烧旺。
从鼓楼到前门,我的声音穿越城墙,说唱是我的翅膀,让我飞得更高。
北京的节奏,是我的心跳,每一句押韵,都是我心中的号角。
从 Nasty Ray 到辉子,他们的故事我知道,现在我拿起麦克风,让世界听我咆哮。
Flow 像长安街上的车流,永不停歇,押韵锋利,像是王府井的刀削。
我是新一代的声音,不怕挑战和困难,在这个舞台上,我要让梦想绽放。
Punchline 来了,就像炸酱面里的蒜泥,地道的北京味儿,让你回味无穷。
我是说唱的战士,不怕任何的挑战,在这个舞台上,我要让世界看到北京的光芒。
Yo, 这是我的世界,我的舞台,用我的声音,讲述我们的故事。
《中国新说唱 2024》,我来了,带着北京的力量,让梦想在这里绽放!
坦白说,看到 Kimi 的词我直接笑出来了,特别是这句:“ Punchline 来了,就像炸酱面里的蒜泥。”帮我的外地朋友问一句:炸酱面里真的有蒜泥吗?
虽然我告诉 Kimi “写得更炸一点”、“更押韵一点”,但它完全无法理解。所以我直接采用它给出的第一版歌词提交给了 Suno,音乐风格我填写了“old school rap a cappella(老派说唱阿卡贝拉)”,希望 Suno 能够还原出咱老儿北儿京儿的地儿道儿味儿。
几分钟过去,Suno 终于交作业了,我怀着忐忑不安的心点开了这首《新说唱海选阿卡贝拉》。请大家一起欣赏:
我的评价是,不错!能摇!经典的 boombap flow,居然还有一个恰到好处的 break,我忍不住在工位点起了头。
不过这段音乐也存在诸多问题。首先,Suno 并没有理解什么是阿卡贝拉,或者可能是因为它无法生成不带伴奏的音乐?其次,虽然歌词写得“北京味儿”十足,但 Suno 还是无法生成京味说唱那种独特的咬字和口音。咱们的 AI rapper 口胡的程度比较像是在唱 mumble rap(模糊说唱),最像北京 rapper 的地方可能就在于它无意识生成的吞音吧!(狗头保命)
我觉得 Suno 这轮的表现可以打🌟🌟🌟,读者朋友们觉得 Suno 的作品能挺过比赛第一轮的 60s 吗。
“甄学家”限定歌曲
《甄嬛传》十年老粉不请自来!最后是我最期待的一趴:让 Kimi 使用《甄嬛传》的经典台词,写一首朗朗上口的口水歌。
Kimi 给了我这些台词参考,不知道各位“甄学家”的 DNA 动了吗?
台词参考:“逆风如解意,容易莫摧残。”“贱人就是矫情!”“臣妾做不到啊!”“翠果,打烂她的嘴。”“你还有多少惊喜是朕不知道的。”“这福气给你要不要啊!”“那年杏花微雨,你说你是果郡王...”“皇上,三阿哥又长高了。”
接着,我让 Kimi 基于这些台词,生成歌词:
[Verse 1]
逆风如解意,容易莫摧残,梦中花落知多少,往事如烟散。贱人就是矫情!话语似刀割,心如止水难再起,泪干情已断。
[Chorus]
翠果,打烂她的嘴,言语成武器,你说我做不到,我偏要逆天行。那年杏花微雨,你说你是果郡王,情深缘浅,难断难续,宫廷深宫梦一场。
[Verse 2]
你还有多少惊喜是朕不知道的,宫墙之内,步步惊心,谁又能预知。这福气给你要不要啊!是福是祸难料,权势如梦,爱恨交织,谁能说得清。
[Chorus]
翠果,打烂她的嘴,命运由我不由天,你说我做不到,我偏要逆风翻盘。皇上,三阿哥又长高了,岁月不饶人,情深缘浅,难断难续,宫廷深宫梦一场。
[Bridge]
宫廷深深深几许,恩怨情仇难了断,爱恨交织成网,谁又能逃脱这宿命的纠缠。
[Chorus]
翠果,打烂她的嘴,言语成武器,你说我做不到,我偏要逆天行。那年杏花微雨,你说你是果郡王,情深缘浅,难断难续,宫廷深宫梦一场。
[Outro]
逆风如解意,容易莫摧残,贱人就是矫情!情已断,梦已远。翠果,打烂她的嘴,命运由我不由天,那年杏花微雨,你说你是果郡王,情深缘浅,难断难续,宫廷深宫梦一场。
然后,我问 Kimi 应该选择什么样的风格,这是它的回答:
基于上面内容,我决定用 POP(流行音乐) EDM(电子舞曲)都试一试!输入歌词、歌曲风格和歌名《宫廷深宫梦》后,Suno 分别生成了 POP 版和 EDM 版的两首歌曲。先来听一下 POP 版的:
下面是 EDM 版本的:
大家觉得咋样,这两首歌能在抖音火起来吗?我感觉 EDM 版的非常上头!听到第二遍,我已开始跟唱,“翠果,打烂她的嘴,命运由我不由天~”
就是 2 分钟时长不够,突然被掐断了音乐,有点可惜。POP 版相比之下旋律没记忆点,也就相对没有那么洗脑。总之,我给这一轮 Suno 的表现打🌟🌟🌟✨。
写在最后
Suno 刚推出的时候,诸如“音乐人要失业了!”之类的言论充斥互联网,网友们直呼“做音乐原来这么简单”。不过,依目前的情况来看,Suno 只能生成一些标签化、功能化、流水线式的音乐形式,虽然很有趣,但也仅限于“自嗨”,更做不到“杀死音乐”。
同时,Suno 作为国外的大模型,生成的中文歌曲老是带着一股英语味儿,如果歌词中有生僻字,Suno 要么唱错,要么直接替换掉,也出现了断句错误等问题。
听说最近国内的昆仑万维推出了“天宫 Sky Music ”,宣称“做中文歌还得靠国产音乐大模型。”目前仅对部分人群开放内测。读者朋友们好不好奇,这个大模型真有它吹得这么厉害吗?在评论区留言告诉我们你的想法吧!说不定下一期的测评对象就是它。
栏目推荐
大模型日新月异,夸得天花乱坠,不如实际用用!AI 前线特别栏目《AI 测评室》营业啦!
后续 AI 前线将会定期选择模型产品进行测评,效果直观可见,为大家选择模型做参考。
你希望我测试哪个模型效果?可以评论区或私信告诉我。如果想让大家看到你的产品,也欢迎来撩,微信:T_demo(请注明来意)
内容推荐
大模型应用挑战赛已拉开帷幕。现阶段,多数语言模型已完成 3 轮更新,大模型赛道入场券所剩无几。同时,2023 年超 200 款大模型产品问世,典型场景又有哪些产品动向?对于现阶段的文生图产品而言,四大维度能力究竟如何?以上问题的回答尽在《2023 年第 4 季度中国大模型季度监测报告》,欢迎大家扫码关注「AI 前线」公众号,回复「季度报告」领取。

 活动推荐
AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展将于 5 月 17 日正式开幕,本次大会主题为「智能未来,探索 AI 无限可能」。如您感兴趣,可点击「阅读原文」查看更多详情。
今天是会议 9 折购票阶段,购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。

用 AI 面试员工的企业,知道打工人在想什么吗?!

被性别歧视、陷经济窘境,AI女神李飞飞自述:我要打破算法中的偏见

ChatGPT免注册让官网挂了?沃顿教授:OpenAI 做了错误的决定

你也「在看」吗?👇
继续阅读
阅读原文