AI音乐生成软件 Suno V3 在发布后引起极大关注,媒体传OpenAI 要将 Sora 卖给好莱坞。这两项音乐生成和视频生成工具的动态引起了业界对生成式 AI 在文娱行业应用机会的讨论。
本期要点
Sora 和 Suno 在文娱界最近有多火?
GenAI 真的能用之后会发生什么?
Sora 和 Suno 之前有过哪些生成式方法?
GenAI 在文娱行业还有哪些应用?
生成式 AI 在文娱行业又起波澜??
Suno 团队推出的 AI 音乐生成软件 V3 版本,凭借其出色的性能表现,被业界誉为“音乐界的 ChatGPT”。该版本能够创作长达两分钟的音乐作品,其音质达到了广播级别的标准。此外,V3 版本在风格多样性和对用户输入的理解上均有所提升,减少了生成过程中的误差。
在V3 发布前,Suno 团队在音乐技术领域的成果已经得到了市场认可。根据 a16z 发布的 GenAI Top100 报告,Suno 在近六个月(截止1月4日)内成为最受瞩目的 GenAI 应用之一,并作为唯一一家音乐公司上榜。
在此之前,Suno 团队在 2023 年 4 月发布的开源文本转音频模型 Bark,短时间内在 Github 上获得了超过 4500 个星标。
  • 7 月,Suno 为音频生成模型增加人声音乐功能。
  • 9 月,Suno 通过 Discord 频道为用户提供音频生成模型的访问入口。
  • 12 月,Suno 推出 web 端应用,并宣布与微软合作,在 Copilot 中集成 Suno 的模型能力。
在视频创作领域,OpenAI 于 2 月 15 日发布的视频生成模型 Sora,凭借其能够生成一分钟高质量视频的能力,引起了业界的广泛关注。除了引起国内外对 Sora 的复现热潮,媒体还曝出OpenAI 首席执行官 Sam Altman 近期在奥斯卡颁奖典礼期间的活动中出现,并计划与娱乐产业的高层进行会谈,探讨合作机会。而 OpenAI 在上周分享的由艺术家使用 Sora 创作的作品则又一次吸引了大量目光。
当 GenAI 开始真的有用,下一步会发生什么?
就 AI 生成音乐而言,其难度在于:
1、音乐结构复杂,情感丰富,AI 需掌握音乐理论和模拟人类情感。
2、高质音乐数据集对 AI 训练至关重要,但获取多样化、高质量数据依然困难。
3、音乐领域某些模式涉及较长的时间跨度,当前的模型在记忆并利用这些信息以生成连贯作品方面仍然困难。
4、音乐涉及风格和情感的表达, AI 需要捕捉特定风格,同时需要理解和模拟音乐的情感层面。
5、音乐质量评估是一项主观过程,缺乏客观标准,导致音乐生成模型的改进反馈机制不成熟。
Suno V3 虽然在音乐创作方面取得了一定的成就,但在时长、语言理解能力和音轨处理等方面仍有待提高。尽管如此,其作为音乐创作者的辅助工具的功能已经初步实现。
  • 对于普通用户而言,AI 工具能够降低创作门槛,使得更多的人能够通过简单的方式进行自我表达;
  • 对于专业用户来说,AI 工具可以作为提高创作效率的创意助手。
随着 AI 音乐创作工具的逐步成熟,未来可能会对音乐产业产生多方面的影响。技术的进步和公司的市场定位可能会推动音乐领域的 GenAI 发展出面向企业(toB)和面向消费者(toC)的商业模式。此外,基于 GenAI 的内容生成工具,结合发布渠道和互动功能,有潜力构建起一个完整的内容生态系统,实现内容的变现和创作者的收益分配。同时,GenAI 技术的应用有望缩小业余和专业创作者之间的技能差距,使得更多业余创作者能够通过 AI 技术实现高质量的创作。
尽管存在对 Suno 可能对音乐行业造成冲击的担忧,但目前业界普遍认为 AI 技术不太可能完全取代专业音乐人,而是可能影响那些技术要求相对较低的从业者。爱梦科技的 CEO 雷鸣指出,Suno 不太可能取代需要团队合作创作的音乐形式,也不会影响到知名音乐人的职业前景。但他也提到,那些不追求独特性、倾向于批量创作的公司和领域,如广告配乐、环境音乐、影视配音等,可能会受到 AI 技术的冲击。
在视频生成技术方面,Factorial Funds 的分析指出,尽管 Sora 模型存在一定的局限性,但其生成的视频质量已经能够满足特定场景的需求,并有望替代一些库存视频片段。Sora 的成功展示了视频模型中 Scaling law 的重要性,持续的模型扩展将是提升模型能力的关键因素。同时,其他公司如 Runway、Genmo 和 Pika 等,正在探索如何构建更加直观的用户界面和工作流程,这将对视频生成模型的易用性和推广性产生重要影响。....
GenAI 走了多远才带来 Sora 和 Suno?GenAI 走向商业化还有什么问题要解决?Sora 和 Suno 之外,GenAI 近期还有什么文娱应用让人眼前一亮?... 查看完整解读请前往「机器之心PRO」业内通讯 · 2024年度#Week 13
本期完整版通讯含 3 个专题解读 +  31 项 AI & Robotics 赛道要事收录
 1. LLM 之后,「Next token Prediction」还能训机器人?
为什么说「预测好下一个 token,就能达到 AGI」?NTP 技术是什么?伯克利是如何用 NTP 的思路训机器人的?「Next Action Prediction」在机器人领域能走通吗?...
2. 生成式 AI 又要在文娱掀起波澜了?
Sora 和 Suno 在文娱界最近有多火?GenAI 真的能用之后会发生什么?Sora 和 Suno 之前有过哪些生成式方法?GenAI 在文娱行业还有哪些应用?...
3.Richard Sutton 最新播客内容要点解读
Richard Sutton 在播客访谈中都透露了哪些关键信息?阿尔伯塔计划进展到哪一步了?Sutton 对于 AGI 的实现有哪些新思路?...
继续阅读
阅读原文