作者 | 褚杏娟、Tina
“基本上以后不会存在‘程序员’这种职业了,因为只要会说话,人人都会具备程序员的能力。”百度创始人、董事长兼 CEO 李彦宏在 3 月份接受央视采访时表示。
而在 4 月 16 日的 2024 百度 Create 开发者大会上,李彦宏再次强调了这个观点:“过去,开发者用代码改变世界;未来,自然语言将成为通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界”。
李彦宏以百度为例介绍道,基于文心大模型的智能代码助手 Comate 已经编写了百度内部四分之一的代码,而百度每天的新增代码中,27% 是由 Comate 自动生成。Comate 也已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了 46%。
据悉,Comate 支持 100 多种语言和所有的 IDE 平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码等。
“今天,你不会写代码,也可以做出一个应用;不用编程,也可以做出一个智能体。AI 正在掀起一场创造力革命,未来开发应用就会像拍短视频一样简单,人人都是开发者,人人都是创造者。”李彦宏说道。
那么,李彦宏具体要如何淡化程序员边界、降低开发者门槛呢?
“开源模型会越来越落后”
“开源模型会越来越落后。”李彦宏在现场表示。
李彦宏解释称,因为有了最强大的基础模型文心 4.0,用户可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain。这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。“所以开源模型会越来越落后。”
另外,李彦宏也提到,多模态大模型是通往 AGI 的必经之路,而视觉大模型最大的应用场景是自动驾驶。
李彦宏介绍了文心大模型的最新进展。他表示,文心大模型已经成为了中国最领先、应用最广泛的 AI 基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的 5.1 倍,周均训练有效率达到 98.8%,推理性能提升了 105 倍,推理的成本降到了原来的 1%。也就是说,客户原来一天调用 1 万次,同样成本之下,现在一天可以调用 100 万次。
据悉,文心一言从去年 3 月 16 日首发至今,用户数突破了 2 亿,每天 API 的调用量突破 2 亿,服务企业达到 8.5 万,利用千帆平台开发的 AI 原生应用数超过了 19 万。
另外,根据过去一年的实践,百度分享了开发 AI 原生应用的三个具体思路:
第一是 MoE。未来大型的 AI 原生应用基本都是 MoE 架构,这里所说的 MoE 不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,需要针对应用的不同场景做匹配。
第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过 SFT 精调后的小模型,它的使用效果可以媲美大模型。通过大模型压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。
第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。
百度本次的正式产品发布,基本也是围绕上述思路进行的。
如何让“人人都是开发者”?
“人人都可以成为开发者”不能成为一个口号,必须有能让开发者随取随用的工具支撑才能实现。为此,百度推出了文心大模型 4.0 工具版,包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder 和模型定制工具 ModelBuilder 三大工具。
AgentBuilder:智能体开发
“智能体可能是未来离每个人最近、最主流的大模型使用方式。基于强大的基础模型,智能体可以批量生成,并应用在各种各样的场景。”李彦宏说道。
作为基于文心大模型的智能体构建平台,AgentBuilder 为开发者提供了零代码和低代码两种低成本智能体开发模式。开发者可以根据不同行业领域、应用场景,调用平台提供的多样化工具,打造大模型时代的原生应用。无论是专业开发者还是新手,仅用“一句话”就创建智能体。
据悉,截至目前,已经有 3 万多个智能体被创建、5 万多名开发者和上万家企业入驻。
大会现场,李彦宏演示了启德教育等智能体案例。启德教育利用百度的 AgentBuilder 打造专属智能体,上线第一周,就成功分发了 155 万次,与用户交互了 5.8 万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。
李彦宏称,“每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体。”
另外,百度文心智能体平台,已经打通了“流量变现”的通路。通过接入智能体的相关能力,解决流量分发的难题,目前除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体了。
也就是说,AgentBuilder 不止是开发平台,开发者还可以通过百度生态矩阵分发路径,做到“开发 + 分发 + 运营 + 变现”一体化。未来,百度还将接入商业插件功能,进一步实现商业闭环。
AppBuilder:AI 原生应用开发
“AppBuilder 是目前最好用的 AI 原生应用开发工具。”李彦宏说道。
在 AppBuilder 上,百度提前封装和预置了开发 AI 原生应用所需的各种组件和框架,如知识问答类的 RAG、具备运算能力的代码解释器、生成式数据分析 GBI 等,开发者最快只需要三步就可以用自然语言开发出一个 AI 原生应用,并且能够便捷地发布到各种各样的业务环境中,甚至“无需写一行代码,就能开发出 AI 原生应用”。
这对应了李彦宏说的:“大模型本身并不创造价值,基于大模型创造出来的应用才真正有价值。”
李彦宏指出,AppBuilder 拥有两大优势:
  • 一是功能强大。依托文心 4.0 对指令的理解和遵循能力,AppBuilder 能保证冷启动就达到一定水平,不会因为效果差再花很长时间去调优;依托检索增强技术(RAG),在知识问答等典型场景,问答准确率和友好回复程度都达到了 95% 以上,大幅超越其他同类产品。
AppBuilder 还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的 AI 能力组件、大模型能力组件,还有百度独家开放的业务组件等 55 个组件。此外,AppBuilder 还提供一些主流场景的第三方 API,比如航班查询、论文查询等,以及自定义组件,客户可以直接对接自己专有的任何工具和数据。
  • 二是简单易用。使用 AppBuilder,只需三步即可快速创建应用、一键分发。我们也支持开源的 SDK,方便大家进行二次开发。”
ModelBuilder:定制各种尺寸模型
ModelBuilder 是一款适合专业开发者使用的工具,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调 SFT,这样就能达到更好的效果。
对开发者来说,用好大模型很重要的一件事,就是掌握模型精调的方法。ModelBuilder 提供了包括文心大模型系列在内的 77 款精选大模型和全流程的模型工具链,同时提供丰富的 SDK 及全栈 API 能力,能够完成一站式的模型精调,此外还提供模型精调样板间,开发者只需要跟着样板间一步一步精调,就能做出一模一样的专业模型。
这样,开发者可以根据需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,这样就能达到更好的效果。
现场,李彦宏展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。
他还在现场与小度实时互动,展示小度用多个模型组合的方式来执行不同任务。例如使用小模型 ERNIE Tiny 执行模型路由工作,而性能最好的文心 4.0 则用来执行日程安排等复杂需求。据介绍,相比全部使用文心大模型的旗舰版,小度可以实现响应速度提升 2 倍,成本下降 99%。
李彦宏表示,“这几个关于 ModelBuilder 的例子,展示的是百度高效低价生产模型的能力”。
据悉,ModelBuilder 截至目前已经服务了 8.5 万企业客户,累计精调超过 1.4 万个模型,开发超过 19 万个应用。
“市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。”李彦宏说道。
“我们需要一个全新的操作系统”
“编程不再是少数经过专业训练的程序员的特权,相反,人人都是开发者。”
“编程不再需要从 c/c++ 学起,而是从自然语言开始。”
“编程不再是面向过程、面向对象,而是面向需求,以后,编程的过程,就是一个人表达愿望的过程。”
百度执行副总裁、百度智能云事业群总裁沈抖在 2024 百度 Create 开发者大会上强调。
沈抖表示,这是革命性的变化,它会彻底颠覆原有的操作系统。
在操作系统的内核中,底层的硬件从以 CPU 算力为主变成以 GPU 算力为主,而且第一次增加了硬件和软件以外的资源,也就是被大模型压缩的世界知识。操作系统管理的对象也因此发生了本质的变化,从管理进程、管理微服务,变成了管理智能。
“传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统。”沈抖认为,这个全新的操作系统需要管理万卡规模的集群,需要极致发挥 GPU、CPU 的性能、高速互联,需要有强大的大模型作为核心引擎,包括语言大模型、视觉大模型等,这些构成了操作系统的内核。
在内核层之上,这个操作系统还需要构建起强大的大模型服务能力,提供全面的模型精调、评估、部署、调用等工具链;还需要有好的应用开发工具去做工作流编排、插件管理;还有必不可少的安全和运维,隐藏掉上一代云原生系统的复杂性。
基于上述思考,沈抖宣布推出新一代智能计算操作系统——万源。“软件定义世界,万源用自然语言定义软件。”沈抖说道。
据介绍,万源操作系统主要由 Kernel(内核)、Shell(外壳层)、ToolKit(工具层)组成。
万源的内核层既包含了业界领先的 ERNIE 4.0、3.5 大语言模型、也包括 ERNIE Speed/Lite/Tiny 系列轻量模型,此外还包括文心视觉大模型和第三方大模型。
另外,考虑到芯片供应不确定性带来的多款芯片并存格局,为管理好多个厂商、不同代际的芯片,百度的百舸平台实现了百卡规模、单一训练任务下,不同厂商芯片的混合训练,并且把训练的性能损失控制在 3%,千卡规模的性能损失也不超过 5%。百舸屏蔽掉了芯片之间的差异,给用户自由选择不同芯片组合的权力。
内核之上是千帆 ModelBuilder,负责内核中模型的管理、调度、二次开发。ModelBuidler 提供的模型路由服务,可以自动给不同难度的任务选择最合适的模型,实现效果与成本的最优组合,在效果基本持平的情况下,平均降低 30% 的推理成本。
工具层方面,千帆 AppBuilder 和 AgentBuilder 则是强大的应用开发平台。
此外,百度还发布了全球首个 AI 原生操作系统 DuerOS X,该系统基于文心大模型全面焕新,在多模态感知、拟人化呈现上有重要升级,小度的人机交互体验将迎来质的飞跃。
结束语
“人人都可以成为开发者,未来必将是一个由开发者一起创造出来的未来。”李彦宏表示。那么未来,百度能否真正实现这个理想,我们拭目以待。
 内容推荐
跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI 前线」公众号,回复「开发者洞察」领取。
 活动推荐
AICon 全球人工智能开发与应用大会 暨 大模型应用生态展将于 5 月 17 日正式开幕,本次大会主题为「智能未来,探索 AI 无限可能」。如您感兴趣,可点击「阅读原文」查看更多详情。
今天是会议 9 折购票阶段,购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。
今日荐文

逃离 Windows!德国又宣布迁移到 Linux,涉及数万系统、3 万余人,官员吐苦水:Windows 对硬件要求太高了

芯片反击,英特尔和AMD惨了!国内电信运营商逐步淘汰外国芯片,网友:这只是个开始

字节跳动成全球最大独角兽公司?官方回应;智己汽车三次致歉小米:我们被网络霸凌;苹果计划裁员超 600 人|AI周报

OpenAI 创始成员用 1000 行 C 代码手搓了一个大模型,Mac 即可运行!网友:真男人就该用C编程

离开百度7年后,吴恩达终于大厂“再就业”:加入亚马逊董事会,帮其实现AI大志

你也「在看」吗?👇
继续阅读
阅读原文