“未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”
4月16日,Create 2024百度AI开发者大会在深圳举办。百度创始人、董事长兼首席执行官李彦宏发表了题为《人人都是开发者》的主旨演讲。他认为,大模型和生成式AI将彻底改变开发者这个群体。
“AI正在掀起一场创造力革命,未来开发应用就像拍短视频一样简单,人人都是开发者,人人都是创造者。”
百度已经为开发者们准备好了三大“开箱即用”的工具,包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。“这三个工具,都代表了先进生产力。”
值得一提的是,李彦宏现场分享了百度在开发AI原生应用上的具体思路,并表示:“这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”这三个开发AI原生应用的思路分别是:MoE、小模型和智能体。
会上,李彦宏正式发布了文心大模型4.0的工具版。他还透露,截至目前,文心一言用户数已经突破2亿。“文心大模型已成为中国领先、应用广泛的AI基础模型。”
得益于文心大模型的强大,开发者通过文心4.0降维裁剪出来的更小尺寸模型,明显要比直接拿开源模型调出来的,在同等尺寸下效果更好;同等效果下,成本明显更低。“大家以前用开源觉得便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。
以下为李彦宏的主要观点:

自然语言将成为新的通用编程语言
只要会说话就可以成为一名开发者
“大模型和生成式AI,将彻底改变开发者这个群体。过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”
“上岗一年多,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。”
“今天,你不会写代码,也可以做出一个AI应用;不用编程,也可以做出一个智能体。AI正在掀起一场创造力革命,未来开发应用就像拍短视频一样简单,人人都是开发者,人人都是创造者。”

AgentBuilder、AppBuilder、ModelBuilder
都代表了先进生产力
“作为一家技术公司,百度的角色定位,就是尽可能地为大家提供所需的开发工具,不断提升整个社会的创造力。”
“具体来说,我们提供1个强大的基础模型系列,也就是文心大模型系列,这包括旗舰版的ERNIE3.5,ERNIE4.0,也包括轻量版的ERNIE Speed、Lite、Tiny等等。”
“我们还提供基于大模型来开发各种应用的工具,包括智能体开发工具AgentBuilder,AI原生应用开发工具AppBuilder,以及各种尺寸的模型定制工具ModelBuilder。这三个工具,都代表了先进生产力。”

文心一言用户数突破2亿
文心大模型4.0工具版正式发布
“文心一言从去年3月16日发布,到今天是一年零一个月的时间。我们的用户数突破了2亿,API日均调用量也突破了2亿,服务客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。”
“近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到国际领先水平。今天,我们正式发布文心大模型4.0的工具版。”
“文心大模型已经成为中国领先、应用广泛的AI基础模型。”
“相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本现在一天可以调用100万次。”

开发AI原生应用的具体思路
是过去一年踩了无数坑、交了高昂学费换来的
“大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”
“今天我想跟大家分享的是一些基于大模型开发AI原生应用的具体思路和工具。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”
“第一是MoE。未来大型的AI原生应用基本是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。”
“第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,它的使用效果可以媲美大模型。这就是我们发布Speed、Lite、Tiny三个轻量模型的原因。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训练小模型,效果要好很多,比基于开源模型训练出来的模型,效果更好,速度更快,成本更低。”
“第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。”

智能体是未来离每个人最近
最主流的大模型使用方式
“智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。”
“百度刚刚升级了文心智能体平台。截至目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。我们的目标是,让每个人、每个组织都成为智能体的开发者,打造国内最完整的智能体生态。那如何实现这个目标呢?就是给大家提供零门槛的智能体开发工具AgentBuilder。”
“今天,每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入和简单的几步操作调优,就能迅速生成一个智能体,成为7X24小时在线的金牌业务员。”
现场,李彦宏演示了新加坡旅游局、启德教育和索菲亚三个智能体案例,手把手教开发者用自然语言,5分钟、零门槛创建一个智能体。
“启德教育智能体非常的受欢迎,上线第一周,就成功分发了155万次,与用户交互了5.8万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。”
“索菲亚商家智能体上线以来,有效线索成本下降了30%。也就是说,它获得一个有效客户,如果过去的成本是100块,现在只需要70块了。”

AppBuilder:最好用的AI原生应用开发工具
用自然语言三步就能开发一个应用
“AppBuilder,它是目前最好用的AI原生应用开发工具。在AppBuilder上面,我们提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。”
“最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。”
现场,通过“游乐场排队助手”、华北电力大学“华电AI助理”和百度文库智能漫画生成三个案例,李彦宏展示了一个AI原生应用的创建过程。只需名称设定、填写角色指令、插入组件简单三步,即可创建一个AI原生应用。
他还指出,AppBuilder拥有两大优势:
“一是功能强大。依托文心4.0对指令的理解和遵循能力,我们的AppBuilder能保证冷启动就能达到一个不错的水平,不会因为效果差,再花很长时间去调优,大大降低了开发门槛。依托检索增强技术RAG,在知识问答等典型场景,我们的问答准确率和友好回复程度都达到了95%以上,大幅超越其他同类产品。”
“AppBuilder还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的AI能力组件、大模型能力组件,还有百度独家开放的业务组件等55个组件。以及一些主流场景的第三方API,比如航班查询、论文查询等。我们还支持自定义组件,客户可以直接对接自己专有的任何工具和数据。这些丰富的组件,共同支撑起了AI原生应用的高效开发。”
“二是简单易用。使用AppBuilder,只需三步即可快速创建应用、一键分发。我们也支持开源的SDK,方便大家进行二次开发。”

各种尺寸的模型定制工具ModelBuilder
高效低价生产模型
“更适合专业开发者使用的工具,那就是ModelBuilder,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,这样就能达到更好的效果。”
现场,李彦宏展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。
他还在现场与小度实时互动,展示小度用MoE多个模型组合的方式来执行不同任务,例如使用小模型ERNIE Tiny执行模型路由工作,而性能很好的文心4.0则用来执行日程安排等复杂需求。据介绍,相比全部使用文心大模型的旗舰版,小度可以实现响应速度提升2倍,成本下降99%。
李彦宏表示,“这几个关于ModelBuilder的例子,展示的是百度高效低价生产模型的能力。”
“为了方便大家快速上手,ModelBuilder预置了全面、丰富的大模型。包括ERNIE3.5和ERNIE4.0,这是旗舰版的大模型,它适合通用的复杂场景,能力强大;还有三个轻量级的大模型,ERNIE Speed、Lite、Tiny;另外还有两个垂直场景的模型,ERNIE Character适合角色扮演,ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。当然,ModelBuilder也支持国内外第三方主流模型,总数量达到77个,是国内拥有大模型数量最多的开发平台。”

开源模型会越来越落后
“因为有了强大的基础模型文心4.0,我们可以根据需要,兼顾效果、响应速度,推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和post pretrain。”
“这样通过降维裁剪出来的模型,明显比直接拿开源模型调出来的,在同等尺寸下效果更好,同等效果下,成本明显更低。”
“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”

多模态大模型是通往AGI的必经之路
视觉大模型最大的应用场景是自动驾驶
“面向未来,我认为多模态大模型,或者说文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI的必经之路。百度在这些领域有着长期投入,并将及时更新大模型的最新进展。”
“我有一个非常不一样的判断:视觉大模型最大的应用场景是自动驾驶。百度在这个方向上是领先的,是自动驾驶的全球领导者,我们不只训练AI如何生成视频,更训练AI理解真实世界发生的事情并预测未来。”
“基于超过1亿公里的、中国复杂城市道路测试里程数据,百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。”

人人都可以成为开发者,未来
必将是一个由开发者一起创造出来的未来
“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工智能+’行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。”
“人人都可以成为开发者,而未来,也必将是一个由开发者一起创造出来的未来!”
文/十一

继续阅读
阅读原文