机器之能报道
编辑:吴昕
这篇文章发布时间正好在OpenAI首届开发者大会(也被一些人称为开发者的春晚)之后,盖茨显然也了解发布会内容,在这篇文章中,他对GPT技术将走向何方以及将如何影响我们的生活做了最通俗易懂的解读。
今天,我仍然和创办微软时一样热爱软件。软件在之后几十年里有了很大改进,但在许多方面仍然相当笨拙。
在电脑上执行任何任务,必须告诉设备使用哪个应用程序。你可以用 Microsoft Word 和 Google Docs 起草商业计划书,但它们无法为你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。即便最好的网站也无法全然了解你的工作、个人生活、兴趣和人际关系,因此为你办事的能力也有限。你只能让密友或者私人助理代劳这些事情。
未来五年,这种情况将被彻底改变。只需大白话告诉设备想做什么,不用再针对不同任务调用不同应用程序。软件会根据你的选择与设备分享到的信息自己作答,因为它更了解你的生活。在不久将来,任何一位网民都能拥有一个 AI 驱动的私人助理,远远超过今天的技术水平。
这种类型的软件——响应自然语言并根据对用户的了解完成许多不同任务——被称为智能体(Agent)。近 30 年来,我一直在思考智能体,并在 1995 年出版的《未来之路》一书中提到了它们,由于 AI 的进步,它们直到最近才变得实用。
智能体不仅会改变每个人与计算机的交互方式,还将颠覆软件行业,掀起一场从输入命令到点击图标以来最大的计算革命。
比尔盖茨出版的第一本书。当时,人们想知道数字技术将走向何方,以及将如何影响我们的生活,比尔盖茨在书中分享了自己的看法,还对未来几十年即将到来的计算,尤其是互联网的突破做出了一些预测,其中包括智能体。不过后来,比尔盖茨曾表示当时预测可能过于乐观了一些。

适合所有人的私人助理

一些批评者指出,以前也做过这种东西,但用户并不完全接受它们。(后来被放弃的微软 Office 数字助理「曲别针」仍然是人们玩笑的对象),人们为什么会使用智能体?
「曲别针」,暴露年龄的记忆
答案是智能体会好得多。你能和它进行细致入微的对话,它们也会更加个性化并不局限于写信等相对简单的任务。「曲别针」和智能体有很多相同的地方,就像过去带转盘的座机和智能电话也有不少类似。


只有你愿意,智能体会帮你完成所有事情。只要授权它跟踪在线互动和现实世界的位置,它就能充分理解活动参与者、地点和活动本身。它能摸清你的私人和工作关系、爱好、偏好和日程安排。你可以决定智能体何时以何种方式参与进来,抑或让你自己做决定。


为了解智能体将带来的巨大变化,不妨对比一下当下一些 AI 工具。其中大多数是机器人(bots),通常局限于一个应用程序,只有在你输入特定内容或寻求帮助时才会被动介入,它们记不住你的行为方式,因此也不会变得更好或者学习到你的任何偏好。
微软的「曲别针」就是一个机器人(bot),不是一个智能体。

智能体更聪明。它们积极主动,能在你提出建议之前提出建议,可以跨应用程序完成任务,随着时间的推移还会变得更好,因为它们能记住你的活动并识别你的行为意图和模式。它们会根据这些提供你所需的东西,尽管你是最终裁决者。


假如你计划一次旅行,旅行机器人(bot)会找到符合预算规划的酒店,但智能体知道更多,比如通常在一年中什么时间旅行、喜欢尝试新地方还是更愿意往返于同一个地方,并据此建议目的地。它还会根据你的兴趣、风险倾向推荐玩些什么、预定你喜欢的餐厅。今天想要这种深度定制化的规划,只能花钱找旅行社实现。


AI 智能体最令人兴奋的影响还是如何大幅降低当今过于昂贵的社会服务成本,它将对四个领域产生特别大的影响:医疗保健、教育、生产力以及娱乐购物。

医疗保健

现在,AI 在医疗保健中的主要作用是帮助完成管理任务。例如,Abridge、Nuance DAX 和 Nabla Copilot 会记录诊疗过程,写下笔记供医生查看。


当智能体可以进行基本的分诊、提出建议并决定病患是否需要寻求治疗,真正的转变将会到来。这些智能体还将帮助医护人员做出决定,提高工作效率。(像 Glass Health 这样的应用程序已经可以分析摘要,提供诊断建议供医生参考。)对不发达国家来说,这种辅助病人和医护人员的能力尤其重要。在这些国家,许多人根本享受不到医疗服务


不过,临床医生智能体的推出速度将相对较慢,毕竟生死攸关。人们需要看到证据——虽然不够完美也会犯错,但智能体总体有利于人类福祉。当然人类也会犯错,得不到医疗服务也是一个问题。


另一个例子是有了智能体,等于每个人都有了一个心理医生。今天,每周接受一次心理治疗还很奢侈,许多可以从治疗中受益的人却得不到相应的服务。
比如兰德公司发现,美国退伍军人需接受心理治疗的人中,有一半都得不到相应服务。

在这面,训练有素的 AI 智能体会大幅降低服务成本,让更多有需要的人享受得起。Wysa 、 Youper 就是这种早期聊天机器人的例子。但智能体的服务会更深入。如果与它们分享足够多信息,它们就能了解你的生活史和人际关系,随时听候你的调遣,永远不会不耐烦。在允许情况下,它甚至可以借由智能手表监测你对治疗方案的反应——比如和老板谈论问题时心跳是否加速——并建议什么时候应该去看人类心理医生。

教育

几十年来,我一直对软件如何让教师和学生的教、学过程更加轻松抱有很大兴趣。软件不会取代教师,它会辅助老师工作,比如为学生提供个性化指导,帮助老师摆脱文书工作,将精力聚焦到最重要的工作内容。现在,变革终于以一种戏剧性方式展开。


目前,可汗学院创建的基于文本的机器人(bot)Khanmigo 最为先进,可以辅导数学、科学和人文学科的学习。比如,它可以解释二次方程并布置相关练习题。它还可以帮老师做一些事情,比如写课程计划。我一直是可汗学院创办人 Sal Khan 的粉丝和支持者,最近,他也在我的播客中谈论了 AI+ 教育。


但是,基于文本的机器人只是第一波浪潮,智能体将开辟更多可能。比如,很少有家庭花得起「一对一」辅导的钱。如果智能体知道如何让辅导变得高效,它就能为每个学生提供量体裁衣的辅导。比如,如果智能体知道孩子喜欢 Minecraft 和 Taylor Swift,它会使用 Minecraft 教他们计算体积和面积,用 Taylor 的歌词教他们讲故事和如何押韵。体验上,这将比今天的基于文本的机器人方案更丰富(既有图像也有声音),也更个性化。

个人和组织的生产力

这个领域的竞争很激烈。微软正在将 Copilot 融入 Word,Excel,Outlook 和其他服务。谷歌也在做类似的事情。这些 Copilot 可以做很多事情,例如将书面文档转换为幻灯片,使用自然语言回答有关电子表格的问题,以及从不同人角度出发总结电子邮件线程。


智能体将做得更多。就像有一个人专门帮你完成各种工作。你有一个商业想法,智能体会帮你写一份商业计划,为它创建一个演示文稿,甚至生成图像显示产品可能的样子。公司将拥有参与每次会议并为员工提供咨询的智能体。


无论是否在办公室工作,智能体都能够像今天的个人助理一样,为企业高管提供支持。
如果朋友刚做过手术,智能体会主动建议送花,还能帮你订购
。如果想和大学室友叙旧,它会和大学室友的智能体商量聚会时间,并在你赴约时提醒你他们最大的孩子刚刚考上本地大学。


娱乐与购物

AI 已经可以帮助你挑选新电视,并推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了 Pix,可以针对你的问题(比如,我喜欢罗伯特·雷德福的电影,在哪里可以看到?),根据你的喜好给出建议。Spotify 也有一个 AI 驱动的 DJ,不仅可以根据您的喜好播放歌曲,还可以和你交流,甚至直呼你的名字。


智能体不仅仅会简单提出建议,还会帮你采取行动。如果想买相机,可以让智能体替你浏览那些评论、总结并提出建议,在你决定后帮你下单。如果告诉智能体想看《星球大战》,它会搞清楚你有没有订阅流媒体服务,如果没有,它会主动为你注册。如果实在不知道自己到底要看什么,它会主动提供建议并播放你指定的内容。


你还可以获得根据自己的兴趣量身定制的新闻和娱乐内容。CurioAI 支持自定义播客(基于你感兴趣的任何主题),由此也可窥见即将发生的一幕。

对科技行业的冲击

简而言之,几乎任何生活领域、人类活动中,智能体都将有所助益,也会对软件行业和社会产生深远影响。


在计算行业,我们谈论的是平台——也就是构建应用和服务的技术,Android、iOS 和 Windows 都是平台。智能体将成为下一个平台。


不用知道怎么编写代码或图形设计,只需要告诉智能体想要什么,你就可以创建新的应用程序或服务。
智能体会自动编写代码、设计应用程序外观、徽标并将程序发布到在线商店。我们在 OpenAI 本周推出的 GPT 上看到了未来,非开发者也能轻松创建和共享自己的助理。


智能体也将影响我们使用、编写软件的方式。它们会取代搜索网站,因为它们会更好地查找和总结信息。它们也将取代许多电子商务网站,因为它们不会受供应商数量的约束,自动找到最优惠的价格。它们将取代文字处理器、电子表格和其他生产力应用程序。今天彼此独立的业务——搜索广告、带广告的社交网络、购物、生产力软件——将合为一个业务。


我并不认为智能体业务将由任何一家公司主导,未来会存在许多不同 AI 引擎。现在,智能体被嵌入到其他软件(比如文字处理器和电子表格),但最终它们将自主运行。虽然有些智能体是免费的(有广告赞助),但我认为大部分智能体还是付费的,这样公司也有动力让智能体为用户(而不是广告商)工作。异常激烈的竞争会让智能体变得非常便宜。


不过,我所描述的这些成为现实之前,我们还需要面对一些问题。关于这项技术以及我们将如何使用它的问题。我以前写过 AI 引发的问题,现在我将主要关注智能体引发的问题。

技术挑战

目前还没有人弄清楚智能体的数据结构会是什么样子。为了创建个人的智能体,我们需要一种新型的数据库,它可以捕获你的兴趣和关系的所有细微差别,并在保护隐私同时快速调用信息。我们已经看到了存储信息的新方法,例如向量数据库,这些方法可能更适合存储机器学习模型生成的数据。


另一个悬而未决的问题是人们将与多少个智能体互动。你的私人智能体会与你的治疗师、数学导师的智能体区隔开吗?如果是这样,你希望这些智能体什么时候一起工作,什么时候又应该自扫门前雪?


你将如何与私人智能体互动?现在的公司正在探索不同的策略,包括应用程序、眼镜、吊坠、别针(pin),甚至全息图。所有这些都是可能的,但我认为人机交互的第一个重大突破将是无线耳机(earbuds)。
如果智能体代需要和你联系,它会和你交谈或显示在你的手机上。
(比如,您的航班延误了。你想等一下,还是需要我重新预订?)如果你愿意,它还将监控进入耳朵的声音,通过屏蔽背景噪音、放大难以听到的声音,或者让你更容易理解口音重的人说话来增强声音的效果。


还有其他挑战。目前还没有一个允许智能体相互通信的标准协议。要想每个人都用得起,智能体成本还需要降低。提示智能体给到正确答案的方法也要更简单一些。需要防止幻觉,特别是在对准确性要求很高的领域(比如健康),确保智能体不会因为他们的偏见而伤害人类。希望智能体不要做不该做的事情。(这里是指人类出于邪恶目的而使用智能体)。

隐私和其他重大问题

鉴于所有这些挑战,在线隐私和安全问题也将变得更加紧迫。你希望能够决定智能体可以访问哪些信息,这样就可以确信你的数据只与选择的人和公司共享。


但是,谁拥有你与智能体共享的数据?如何确保这些数据得到适当的使用?没有人愿意看到与他们告诉治疗师的事情有关的广告。你的智能体能被执法部门作为对你不利的证据吗?智能体什么时候会拒绝做一些可能对你或其他人有害的事情?谁来挑选智能体需要对齐的价值观?


还有一个问题,智能体应该分享多少信息。你想见一个朋友,让智能体去沟通,你不希望它说,「哦,她周二要见其他朋友,不想把你包括在内。」 如果让智能体帮你写工作邮件,它需要被告知不应该使用关于你的私人信息或以前工作的专有数据。


其中许多问题已经成为科技行业和立法者的头等大事。最近,我与其他技术领袖一起参加了一个由参议员 Chuck Schumer 组织的人工智能论坛,许多美国参议员都参加了该论坛。我们分享了关于这些问题和其他问题的想法,讨论了立法者通过强有力立法的必要性。


但其他问题不会由公司和政府决定。例如,智能体可能会影响我们与朋友和家人的互动方式。今天,你可以通过记住他们生活的细节——比如生日——来向某人表明你关心他们。但当他们知道你的智能体会提醒你并负责送花时,对他们来说,这是否同样有意义?


在遥远的未来,智能体甚至可能迫使人类面对有关目的意义(purpose)的深刻问题。想象一下,它们变得如此优秀,以至于每个人都可以拥有高质量的生活,而无需工作太多,人们会如何利用他们的时间?当智能体知道所有答案时,还会有人想要接受教育吗?当大多数人有很多空闲时间时,会有一个安全和繁荣的社会吗?


不过,我们距离这样的未来还有很长的路要走。同时,智能体也正向我们走来,并在接下来几年彻底改变人类线上和线下的生活方式。
参考链接

https://www.gatesnotes.com/AI-agents
© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
继续阅读
阅读原文