2024年是大模型从技术走向应用的关键一年。在这样的征途中,字节跳动是不可忽视的玩家之一,从推出云雀大模型到上线火山方舟大模型服务平台,今天也正探索将大模型融入到旗下数十个业务场景中。

  • 大模型能力如何赋能核心业务环节,助力实现商业新增长
  • 大模型时代的超级APP需要具备哪些先决条件?
  • 抖音电商等复杂场景如何落地应用大模型升级用户体验?
  • 下一个时代的内容和交互形态有哪些演变的可能性?
近期,高榕创投榕汇邀请超过30+创新企业走进火山引擎,围绕上述话题展开研讨,也交流字节在大模型领域的探索和实践,以及火山引擎构建的底层云计算服务和大模型生态。
生态与开放 
共建AI创新生态
“只有从底层技术、资本加速到上层应用都实现闭环,才有望真正建立起中国AI创新生态。”火山引擎总裁谭待在开场致辞中表示,未来一段时间,字节和火山引擎一方面希望将自己Foundation Model的能力做好,同时考虑到企业的创新成本,火山引擎计划推出系列孵化计划,降低企业使用大模型服务的门槛和成本;此外也将联合创投伙伴帮助创业企业加速闭环。
“大模型带来的创新机会令人兴奋”,高榕创投合伙人韩锐指出,在这一轮创新热潮中,字节是大模型领域不可忽视的玩家之一,原因在于用户量庞大、形态丰富的业务场景是大模型和AI技术最好的试炼场。“火山引擎不仅在字节内部有非常好的口碑,也正将字节快速发展过程中积累的技术、增长方法和工具开放给外部企业,某种程度也在推动行业发展。”
模型与算力
超级APP涌现的前提
2023年6月,火山方舟大模型服务平台上线,提供模型训练、推理、评测、精调等功能与服务。火山引擎智能算法负责人吴迪在分享中预测,未来2-3年,国内将迎来应用型算力的爆发,预计2024年靠后或2025年靠前的时间点,应用型算力(推理+Fine-tune)需求量将超过训练型算力需求量。
吴迪观测目前国内的应用市场犹如早春时分的春意萌动,“远远看过去好像土地还是一片贫瘠,但你侧耳倾听,会感觉大地在震动,很快就会有春笋从一个个角落冒出来。”目前很多客户已经在方舟平台上逐渐找到把大模型能力应用到核心业务的感觉,“当他们去提高渗透率的时候,推理用量的爆发会非常惊人。”
面对即将井喷的算力需求,吴迪表示,火山方舟将锻造三个核心竞争力,真正帮助创业者解决关键问题。
模型好:火山方舟构建“多云多模型”生态,囊括字节云雀大模型,以及智谱AI、Moonshot AI等的模型,并克制地引入一些能力强的开源模型。
流量大:火山方舟在底层做了大量系统性的工作,调度做得极其灵活,加之充足的算力资源,让客户仿佛打开水龙头就有无穷无尽的token,进而支撑他们去取得大模型赛道的成功。
成本低:成本低是以客户为标准的,只有人人都能轻松自由地购买大模型服务与应用,大模型时代才算真正到来。
吴迪补充,在上述三个基础能力以外,火山方舟在智能体编排、内容安全、RAG(检索增强生成)等关键环节引入内外部合作伙伴,让客户在平台上可以一站式获得整合的优质资源。例如智能体编排方面,方舟平台和扣子(coze.cn)AI Bot开发平台打通,帮助客户高效进行轻量的原型设计。
当大模型、算力等基础设施逐步完善,超级APP何时涌现?“超级APP是对大模型能力的忠实反映和表达,如同瓶子和酒,APP是瓶子,关键是酒酿到什么程度。”吴迪认为,在这样的前提下,超级APP可能需要具备三个必要条件——
第一,超级APP需要把很多人的需求聚合在一起,就如同抖音电商;
第二,超级APP一定会将高门槛的人机交互变为低门槛的人机交互,把原本复杂的规划、逻辑藏在后面,就像剪映的出现让人们可以方便地剪辑视频;
第三,超级APP可能和硬件集成度非常高,长期来说大模型捕捉的信号一定不只是文本,可能会和声音、视觉、光线乃至人的运动和加速度都有很好的融合。
长远看来,吴迪认为,大语言模型的出现会扩张我们每个人的信息负载能力,从而使得组织在同等规模下实现原来数倍的产出,最终深刻改变经济环境和商业领域的竞争格局。面对这样的变化,企业如何应对?吴迪分享了团队自身的实践,“我们希望团队成员未来所有的产出做到LLM-friendly,比如文档、代码等等都做到易于被大模型精调和使用,大模型吸收团队的智力产出,从而形成正向增强的飞轮。”
应用与场景
终极目标是转化为企业收益
围绕创业者关注的大模型实际落地应用,火山引擎AI应用产品负责人骆怡航、抖音电商技术专家李小青分别结合AIGC营销场景和抖音电商场景分享实践经验。
骆怡航指出,从模型到场景尤其企业场景,需要经历打磨、验证、落地,最终才有望转化为企业收益。
以AIGC营销应用为例,火山引擎已基于大模型基础能力打造了一系列应用,贯穿营销的触客、获客、活客环节,提升创作效率、互动效率和留存效率。面向市场部门,智能创作云提供智能创意洞察、AIGC素材生成与内容创作、多平台分发管理等服务,也有越来越多的客户通过AR+AIGC互动营销取得不俗的成效;面向销售端,打造了智能销售助手实现提效,囊括智能外呼、智能陪练、线索评级、门店管理、知识助手等能力。
抖音电商作为内容密集、交互高频的典型应用场景,目前已积极探索利用大模型改善用户体验,落地了智能导购、智能机器人、文案生成等应用。
李小青分析了大模型加持下的智能导购如何“更胜一筹”,并与搜索形成互补的关系。“以往客服机器人面对消费者各种各样的诉求,需要去构建多个模块,每个模块都要单独训练和调试,整个系统会非常复杂,且理解能力有限,回答内容相对机械,很难做到多轮交互;有了大模型,只要给大模型输入query、上下文和业务状态,就能生成答案,回答范围更广、质量更高,标注成本也更低。”
内容与交互
大模型带来的新可能
随着AI技术的进阶,如何升级游戏等产品的体验,乃至为人们带来全新的内容和交互?在高榕创投执行董事陈柒霖的主持下,字节跳动UGC团队与三位创业者展开讨论,预测AI在不远的将来为我们创造的惊喜。
AI让未来内容平台实现三重突破
云中子科技开发了面向海外C端用户的Storytelling平台MidReal,之所以要打造这一平台,云中子科技CEO陈锴杰指出,“我们认为Storytelling是所有娱乐形态的本质,是下一个AI Native时代中重要的内核,比如小说、电影剧本、短视频台本、游戏脚本都是story。”
在陈锴杰看来,AI让未来内容包括游戏平台实现三重突破。
第一,AI打破了对工具的定义。以往人类作为生产者使用各种各样的工具去生产内容和资产,但当Agent进一步发展,AI自己就可以定义问题、解决问题,那么Agent可能从工具升格为生产者本身。
第二,AI实现了消费即生产。消费者本身也参与到生产环节里,生产过程是和消费者实时互动的。以Storytelling平台为例,用户可能点击一下,就生成了沿着他的想法发展的故事线,这时内容生产和消费的界限就十分模糊了。
第三,AI改变了价值创造者的界定。当生产和消费者的角色可以自由切换,平台产生的收益如何分配也随之改变。
陈锴杰也期待未来把多模态大模型接进Storytelling的主干上,“把故事直接变为图片、视频、3D等等,这或许会在未来1-2年内让人非常兴奋,也为内容和娱乐行业带来新的格局变化。”
AI给未来游戏形态带来更多想象空间
超参数科技是专注于AI领域的科技公司,致力于创造一个10亿人与100亿AI共同生活的虚拟世界,具体能力包括打造游戏里的AI Bot,以及构建AI NPC生态能力的技术系统。AI Bot和AI NPC作为虚拟世界的原住民,不仅帮助玩家在游戏里获得更愉悦的体验,也为人类带来新的内容和社交关系。
超参数科技平台技术负责人朱恒满介绍,随着大模型技术发展,AI在虚拟世界的能力也在不断提升,能更加好地理解玩家的行为和语言,不仅能够自由对话,还可以感知环境变化并做出反馈,生成游戏中新的剧情。可互动的独立AI能给未来游戏的形态和玩法带来更多可能性和想象空间。
在未来技术期待上,朱恒满谈及近期DeepMind发布的世界生成模型Genie(《Genie: Generative Interactive Environments》),该模型可以生成可交互的视频,视频内容会根据用户实时的动作输入来生成。尽管目前Genie生成视频的质量和Sora相比仍有差距,但展现了实时互动视频生成的可能性,一旦成熟也将为很多行业带来颠覆式的变化。
AI创建有趣的灵魂和好看的皮囊
字节跳动-UGC-游戏AI技术负责人舒志分享目前的工作——“用AI技术创建游戏里有趣的灵魂和好看的皮囊”。好看的皮囊可能是游戏里的NPC、角色创建,有趣的灵魂背后需要大语言模型、强化学习等技术能力。
UGC游戏被认为是大势所趋,如何在其中应用落地生成式AI?舒志以今年受到比较多关注的3D内容AI生成为例去预测,未来玩家有望通过一个简单的prompt去创建一个家园或城市;亦或是生成Avatar,之前捏脸是有一定难度的,加入AI技术,可以通过上传照片或者输入一段文字prompt去捏脸;再进一步,有可能生成3D物品,乃至去生成新的关卡、剧情等等,丰富创意玩法。
3D生成到世界模型
火山引擎加速器成员企业影眸科技重点探索3D生成,包括角色生成和物品的生成。影眸科技CTO张启煊指出,“Sora这类工作给我们带来最大的启示是,不要想着通过上一种模态去升维到新的模态。”在Sora之前,视频生成大部分都是通过一个预训练的2D生成模型,让其在一定范围内输出连续一致的画面;但在Sora架构里可以直接输出视频,因此也不需要解决视频稳定性、一致性的问题,“它天然地具备了对物理世界的模拟能力,在3D生成中也是如此。
面向大模型时代,创业企业不仅需要重塑开发模式、产品模式、商业模式,也正倒逼着我们打造大模型友好型组织,以更好应对接下来的技术变革和新竞争格局。
继续阅读
阅读原文