“你只要会说话,就可以成为一名开发者。”
4月16日的百度Creat AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏在题为《人人都是开发者》演讲中这样说。在他看来,大模型和生成式AI,将彻底改变开发者这个群体。
这一天并不遥远。因为有了强大的基础大模型,有了很多低门槛甚至零门槛的开发工具,开发者的生产力大大提高了,自然语言将成为新的通用编程语言。“今天,你不会写代码,也可以做出一个AI应用;不用编程,也可以做出一个智能体。AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”
在演讲中,李彦宏还对外分享了百度在过去一年实践中踩过的坑,交过的学费,并发布三大AI开发工具。AI原生的时代已经到来,百度发力推进AI应用与技术普惠,再次成为行业的风向标。这不仅将极大地提升社会创造力,也将让更多的普通人享受到科技带来的便利。
推理成本降了99%
百度是国内大模型领域最早的入局者之一。去年3月16日,百度发布文心一言,一年零一个月时间过去,文心一言怎么样了?
李彦宏在演讲中透露一组数据:文心一言用户数突破了2亿,API日均调用量也突破了2亿,服务的客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。
去年年底时,百度公司CTO王海峰曾宣布文心一言用户规模突破1亿,成为国内第一个宣布用户破亿的大模型产品。百度最新披露的数据意味着,不到4个月的时间,文心一言用户规模已经实现了翻倍式增长。
支撑文心一言不断迭代的基座模型,正是文心大模型。过去一年,它经历了从3.0版本到3.5,再到4.0版本的进化。当天,百度正式发布文心大模型4.0的工具版,用户可以在工具版上,体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。
李彦宏还透露,文心4.0在理解、生成、逻辑、记忆四大能力方面达到了业界领军水平。尤其近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到领先水平。
例如,基于文心大模型的智能代码助手Comate,不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。
“上岗一年多,基于文心大模型的智能代码助手Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。”
李彦宏表示,文心大模型已经成为了中国领先、应用广泛的AI基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。
换句话说,客户原来一天调用1万次,同样成本现在可以调用100万次。对企业或者开发者而言,大模型一旦用起来,最关注的就是效果和成本。
提升性能的同时,把推理成本降到1%,背后离不开百度在芯片、框架、模型、应用这四层架构上有着全栈的布局。这意味着通过端到端优化,不断地把成本打下来,更多用户将能够高效、低价地用大模型做AI应用。 
三大AI工具助力,人人成为开发者
在MoE、小模型、智能体这三个方向上,百度做好了“开箱即用”的工具:智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。
以智能体为例,这可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。截至目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。“我们的目标是,让每个人、每个组织都成为智能体的开发者,打造国内最完整的智能体生态。”李彦宏表示。 
大会现场,李彦宏演示了新加坡旅游局、启德教育和索菲亚三个智能体案例。 据介绍,启德教育利用百度的AgentBuilder打造专属智能体,上线第一周,就成功分发了155万次,与用户交互了5.8万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。 
索菲亚商家智能体通过利用文心大模型的能力,对于用户诉求优先给出问题的答案,还会主动与客户确认具体需求,如装修类型、预算等,并推荐附近的线下门店。数据显示,自上线以来,有效线索成本下降了30%。也就是说,它获得一个有效客户,如果过去的成本是100块,现在只需要70块了。
目前,已有超过1万个百度的客户拥有了商家智能体,涵盖了教育培训、房产家居、机械设备、商务服务等超过30个行业。
而 AI原生应用开发工具 AppBuilder中,百度提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。李彦宏举例,最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。 
以游乐场排队助手为例,打开AppBuilder的开发界面,第一步先给应用起名『游乐场排队助手』,第二步填写角色指令,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;第三步再插入需要的工具组件。这样,在零代码的情况下,一个应用就生成了。
对于专业开发者使用的工具,也就是ModelBuilder,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT从而达到更好的效果。
“对开发者来说,用好大模型很重要的一件事儿,就是掌握模型精调的方法。”李彦宏说。
以教育行业的作文批改场景为例,因为作文批改有明确的评分标准,并且不同年级对作文的要求和打分标准,也是不同的。这就需要模型精调,让大模型输出的结果,更符合特定的要求。结果显示,精调后的大模型拥有了更加专业的老师点评思维、更好地做了格式遵循。原本老师需要较长时间才能完成的作文批改任务,现在借助大模型,几秒钟就可以快速完成,大大地提升了给学生反馈的速度和效率。目前,这一类精调后的模型,已经在多个教育行业的头部企业中应用起来。
在现场,李彦宏还问起了小度添添AI平板机器人多个问题,既有简单的新闻问询,也有复杂的日程安排需求。看起来是跟同一个小度在交流,其实背后调用了不同的模型。有些是适用于复杂场景、能力强大的旗舰版大模型ERNIE3.5和ERNIE4.0,有些涉及轻量级的大模型,ERNIE Speed、Lite、Tiny。
通过这种大小模型的组合调度方式,小度不仅顺利完成了“换脑行动”,装上了全新的AI原生操作系统DuerOS X,而且形成了效果、速度和成本的最优组合,李彦宏透露,相比全部使用文心大模型的旗舰版,让响应速度提升2倍,成本下降了99%。
通过百度高效低价生产模型的能力展现,李彦宏称,通过降维裁剪出来的模型,比直接拿开源调出来的模型,同等尺寸下,效果明显更好,同等效果下,成本明显更低。大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的,所以开源模型会越来越落后。
踩了无数的坑,交了高昂的学费换来的经验
在AI领域,百度率先将业界“卷模型”层面的竞争拉到了AI应用层的竞争。
去年3月,在文心一言发布会上,李彦宏在强调大模型重要性的同时,就点出了应用的潜力:“大模型时代,真正最大的机会既不在基础服务,也不在行业服务,我觉得恰恰是在应用。”
一年过去,他称,2024年大模型相关的话题毫无疑问依然会很热,各类技术突破还会不断涌现。业界也会继续热衷于用“震撼发布”“史诗级更新”进行渲染。但他坚定认为,大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。
在现场,李彦宏分享了一些基于大模型开发AI原生应用的具体思路和工具。这是百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。
第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,背后是有技术含量的,要针对应用的不同场景做匹配。
第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,它的使用效果可以媲美大模型。这就是百度发布Speed,Lite、Tiny三个轻量模型的原因。李彦宏称,通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。
第三是智能体。随着智能体能力的提升,有望不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,人们还可以让不同的智能体互动,相互协作,更高质量地完成任务。
李彦宏透露,这些智能体能力,反思、规划、自我计划的能力,百度已经开发出来了,并且向开发者全面开放。
共建AI原生时代生态
大模型带来的革命性价值,不仅仅是一项技术突破,它们真正的价值,恰恰是因通用性而带来的应用爆发潜力,以及由此带来的生产力变革。
在百度内部,从去年开始,已经在用AI重构了各个产品。以百度文库为例,在AppBuilder的支持下,百度文库新推出的智能漫画和智能画本功能,更是把场景延伸到了更加有趣的跨模态创作领域,它成为用户“内容生产的起点”。
而在百度的核心业务搜索中,每天已有的问答需求中,首条满足的比例已达到70%,百度搜索日均新增问答需求超过5000万。
面向未来,李彦宏认为多模态大模型,或者说文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI的必经之路。百度在这些领域有着长期投入,并将及时更新技术进展。
他说自己有一个非常不一样的判断:视觉大模型最大的应用场景是自动驾驶。百度在这个方向上不只训练AI如何生成视频,更训练AI理解真实世界发生的事情并预测未来。
基于超过1亿公里的、中国复杂城市道路测试里程数据,百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。
百度地图也率先将视觉感知大模型应用到了制图领域。现在,车道级地图数据,已经上线全国360座城市。李彦宏说:“只要百度地图导航能去的地方,智驾就都能开。“
除了用AI改变百度自身业务与产品之外,大模型生态的建设对于百度而言有着重要意义。一个健康、繁荣的生态系统能够为大模型提供丰富的应用场景和用户需求,使得模型能够在实践中不断迭代和优化,进而提升其性能与准确性。同时,生态的构建也能够吸引更多的开发者、企业和用户参与到大模型的开发与应用中来,形成良性循环,推动行业进步。
在AI生态方面,百度不仅为合作伙伴提供了智能化的解决方案和智能化的赋能平台,更与创业者、开发者共同推动大模型生态繁荣。
例如,百度的文心智能体平台为开发者们提供了流量变现的通路。除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,为开发者解决流量分发的后顾之忧,获得实打实的收益。
在扶持AI创业者方面,去年5月份,百度启动了“文心杯“创业大赛,推动大模型生态繁荣,打造更有活力的生态系统,帮助创业者、开发者开发各种AI原生应用。第一届“文心杯”创业大赛收到了近1000支创业团队报名,百度为其中的15支优胜团队,提供了近亿元的投资支持,并且在技术、团队和资源上持续提供全方位扶持。
在今年Create大会上,李彦宏宣布第二届“文心杯”创业大赛正式启动,此次将扩大项目筛选范围、设置分赛场,并首次设立了“特别大奖”,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。
2024年有望成为AI大模型落地和商业化之年,新一代年轻创业者持续涌现,国际化也成为AI创业的关键趋势。李彦宏说:“中国的创业者和开发者非常善于利用新技术来开发应用。我相信文心大模型将成为中国AI创业者和开发者的首选,越来越多的应用会建立在文心大模型之上。我也期待更多创业者和开发者加入我们,一起构建繁荣的AI生态。”
继续阅读
阅读原文