「每周一三五更新」
撰文:何昕晔、裘欢欣
编辑:王杰夫
Key Points
拜登考虑降低高科技人员移民门槛
Meta第三季度业绩超预期,但Quest亏损更多了;
Google称除了Gemini还有大模型在2024年发布;
波士顿动力把ChatGPT接入了机器狗Spot;
AI让Google地图成为本地生活搜索引擎。
拜登考虑降低高科技人员移民门槛
据悉,拜登政府预计于下周一公布与AI相关的行政命令,这将是生成式AI热潮引发社会广泛关注以来,美国政府在监管方面做出的最重要的尝试。知情人士对《华盛顿邮报》表示,该命令尚未最终确定,细节或发布时间可能会发生变化。
行政命令包括哪些内容?
这项行政命令主要包括两方面内容:
  • 首先,联邦政府工作人员必须在AI模型经过安全性评估后才可以使用。这项规定的适用机构主要包括美国的国防部、能源部和情报机构。此举的主要目的是降低国家安全风险。评估工作将由美国国家标准与技术研究所(NIST)领导,该机构此前已发布过AI风险监管的框架。
  • 其次,高科技人员的移民门槛将会降低。此前硅谷广泛使用的高技能签证计划「H-1B」可能被修改。此举的主要目的是吸引别国高科技人才,以增强美国的技术优势。
拜登政府预计将与15家技术公司以签署自愿承诺的方式来落实该行政命令的内容,包括OpenAI、Google、Adobe和英伟达。
美国已经在AI监管上落后
白宫选择发布行政命令的时间颇为微妙。11月1日至2日,英国将举办全球人工智能安全峰会,重点讨论AI给社会带来的潜在风险。美国商务部长雷蒙多和副总统卡玛拉·哈里斯受邀出席。美国政府迫切希望在AI监管方面拥有更多话语权。
此前,欧盟已在AI监管方面取得突破性进展。6月14日,欧洲议会投票通过起草并修改了两年的《人工智能法案》(AI Act)草案,其中最引人注意的规定有两项:禁止实时人脸识别,以及强制要求生成式AI公司披露其训练数据的版权细节。该法案预计将在今年年底获得最终批准。
相比欧洲,美国国会仍处于应对该技术的早期阶段,而AI监管将是拜登政府面临的重要考验。在2020年竞选总统时,针对硅谷技术巨头的强力监管是拜登的重要政治承诺之一,然而3年来拜登政府在解决社交媒体危害、侵犯隐私和技术对儿童的影响方面几乎没有取得成果。
国会正在推进AI立法计划
国会正在白宫的支持下推进AI监管的立法计划。本周二,美国参议院多数党领袖查尔斯·E·舒默(Charles E. Schumer)主持了第二届人工智能洞察论坛,预计该论坛将成为两党合作监管AI发展的基础。与会者包括风险投资家、人工智能初创公司创始人以及民间社会和劳工团体的代表。会议重点讨论了人工智能研究和创新的资金问题,与会者还表示需要改变移民流程以吸引技术工人。
在政府推进AI监管的同时,技术巨头们也在行动。10月25日,OpenAI、Anthropic、Google 和微软共同宣布,任命Chris Meserole担任「前沿模型论坛」(Frontier Model Forum)的执行董事。Meserole曾担任美国著名智库布鲁金斯学会人工智能和新型技术倡议主任。此外,前沿模型论坛成员正在创建一个新的AI安全基金,初始资金超过1000万美元。
参考链接
https://www.washingtonpost.com/technology/2023/10/25/artificial-intelligence-executive-order-biden/
https://openai.com/blog/frontier-model-forum-updates
Meta第三季度业绩超预期,但Quest亏损更严重了
本周三,Meta公布了截至2023年9月30日的第三季度(以下简称「第三季度」)业绩报告,营收利润增长双双超预期,其中营收实现自2021年9月以来最快的增速。
尽管本次Meta表现出强劲的收益增长,在财报电话会议期间,Meta首席财务官苏珊·李表达了对第四季度迄今为止广告需求疲软的担忧,Meta的股价最初在盘后交易中上涨约4%,随后回落并下跌约3%。
具体业绩表现
第三季度Meta的营收为342亿美元,高于华尔街一致预测的335亿美元,同比增长23%;净利润达到116亿美元,同比跃升164%,远高于市场普遍预期的94亿美元。
Meta的营收主要由Family of Apps(旗下应用系列)与Reality Labs两部分组成。
  • Family of Apps业务包含Facebook、Instagram、Messenger和WhatsApp等产品,第三季度广告总收入为336亿美元,同比增长24%。同时,这些应用的使用量增长强劲,「每日活跃人数」较去年同期增长7%,达到31.4亿。
  • Reality Labs业务,主要包含虚拟现实和增强现实的硬件、软件、内容,其第三季度收入下降了26%,跌至2.1亿美元。该部门第三季度亏损37.5亿美元,而去年同期亏损36.7亿美元。今年迄今为止Reality Labs已经造成114.7亿美元的亏损。
财报会议还传达了哪些信息?
  • 优先考虑人工智能:扎克伯格表示,2024年人工智能将成为Meta在工程和计算资源方面投入最多的领域。人工智能已经并将继续成为Meta提高效率和降低成本的重要组成部分。
  • 坚持投资Reality Labs:苏珊·李表示,Reality Labs的成果将会应用到更多其他应用程序中。例如Meta推出的虚拟数字人服务Avatar,目前用户已经创建了超10亿个Avatar形象。再例如Ray-Ban Meta智能眼镜,它可以帮助用户使用、分享Meta应用程序,甚至支持直播功能,有助于创建更有吸引力的内容生态系统。
  • 招聘人数增加:扎克伯格表示,Meta计划为此招聘更多专注于人工智能的技术人员,Meta预计明年的薪资支出将增加,特别关注「成本较高的技术职位」。苏珊·李表示,2024年年底的员工人数应「明显高于」目前水平,此后增长将放缓。
  • 广告需求疲软:苏珊·李也提到Meta预计第四季度业绩良好,但警告称,由于中东目前的情况,最终营收可能会出现波动。
参考链接
https://investor.fb.com/investor-events/event-details/2023/Q3-2023-Earnings/default.aspx
Google称除了Gemini还有大模型在2024年发布
10月24日,Google母公司Alphabet发布第三季度财报后,公司举行了2023年第三季度财报电话会议,会议中透露了Google关于大模型迭代进度、Google新搜索的商业化等信息。
在当日发布财报后,Alphabet股价大跌9.5%,创2020年3月以来最大跌幅;单日市值蒸发逾1660亿美元,为上市以来最惨纪录。核心原因是云计算增速不及预期,而这恰巧是投资人最为看重的业务。
Gemini之后还有大模型
之前已经有多家媒体报道,称Google最先进的大模型Gemini已经在小范围测试,并且将于今年年底正式推出。而在财报会议上,Alphabet首席执行官桑达尔·皮查伊表示,除了Gemini,Google还计划于2024年推出其他大模型。
Gemini是由Google DeepMind团队开发的多模态AI模型,主要对标OpenAI的GPT-4模型。目前Google正在开发不同尺寸、不同功能的Gemini产品,并且正式发布后将立即用于所有内部产品。开发人员和云客户将通过Vertex AI访问。因此Gemini很可能会取代Google当前的PaLM 2语言模型。
Bard将推出移动版本
在财报电话会议中,Google表示将在创造力和生产力产品领域应用人工智能功能,其中Bard作为大型语言模型的试验性对话界面,是早期试验和对Google搜索的补充体验。目前,Bard可以与Google应用程序和服务集成,显示来自Workspace、地图、YouTube以及 Google的航班和酒店的相关信息。
本月早些时候,Google发布了Assistant with Bard——一款由生成式人工智能驱动的个人助理,结合了Bard的生成推理能力和Assistant的个性化帮助能力。在未来的几个月中,Google将推出Assistant with Bard的Android和iOS移动版本。
在Google新搜索中插入广告
广告业务贡献了约90%的营收,仍然是Google的大部分收入来源,因此Google希望通过向Google新搜索(Search Generative Experience,SEG)中添加广告来提升营收。皮查伊表示,Google正在计划试验一种适合Google新搜索的原生广告格式,使用生成式AI来创建相关的高质量广告,并根据搜索过程的每一步提供定制化广告。
今年5月,Google在Google I/O开发者大会上推出了AI驱动的Google新搜索。该功能首先向美国用户开放,随后于8月扩展到日本和印度用户。Google在财报电话中表示,将在未来添加功能并开放更多国家/地区和语言,而广告将继续在这种新的搜索体验中发挥重要作用。
参考链接
https://abc.xyz/2023-q3-earnings-call/
波士顿动力把ChatGPT接入了机器狗Spot
10月26日,波士顿动力公司在YouTube上传了一段视频,视频中其四足机器狗Spot戴着高礼帽,留着小胡子,能够与员工实时交互,并作为机器人导游带领他们参观公司的设施。
视频来源:波士顿动力YouTube频道
机器狗Spot有哪些能力?
Spot是由波士顿动力公司设计的一款动力平衡四足机器人,采用四条机械腿来运动,被广泛应用于各种研究应用和行业,包括遥感和检查、建筑监测、现场文件记录、辐射探测、环境监测等。目前,Spot具有测绘、定位和自主遍历系统,统称为GraphNav。通过GraphNav系统,Spot能够自主适应不同类型的地形,操作员可以使用机器人控制器平板电脑上的自动行走功能来访问自主导航。
这个机器狗导游是如何工作的?
为了让Spot能够「说话」,波士顿动力公司使用OpenAI的ChatGPT API以及一些开源大语言模型(LLM)来训练其响应。
  • 波士顿动力公司首席软件工程师马特·克林根史密斯(Matt Klingensmith)表示,团队用简短的描述标记了Spot所处的建筑物位置,并将3D建筑物地图数据提供给包括ChatGPT在内的模型。
  • 随后,结合定位系统,机器人将3D建筑物地图数据与通过抓手和身体上的摄像头获取的图像结合起来,能够「在生成响应之前获得有关所看到内容的更多信息」。最后调用LLM生成内容回答。
  • 此外,为了让Spot与其受众和环境交互,波士顿动力集成了视觉问答模型(Visual Question Answering,VQA)和语音转文本软件,使Spot能够为图像添加字幕并回答有关图像的问题。
  • 在硬件改造上,Spot配备了带有LED的环形阵列麦克风,以及一些默认的肢体语言和外部装饰来增强和观众的交互感。
探索AI和机器人技术的交叉点
该公司还指出,研发中仍然遇到了一些模型编造答案的情况。尽管如此,马特·克林根史密斯表示,机器人提供了一种在现实世界中「落地」大型基础模型的绝佳方法。ChatGPT等大语言模型可以提供文化背景、常识性知识和灵活性,这对于许多机器人任务来说都是有用的——例如,仅仅通过与机器人交谈就可以将任务分配给机器人,这将有助于减少使用这些系统的学习量。
波士顿动力表示,通过结合大语言模型,将使机器人在与人类一起工作或在人周围工作时表现得更好——无论是作为工具、向导、伴侣还是娱乐者。
参考链接
https://bostondynamics.com/blog/robots-that-can-chat/
AI让Google地图成为本地生活搜索引擎
10月26日,Google地图宣布更新一系列新功能。除了帮助用户更便捷地导航,该应用还提供了全新的搜索方式,为用户提供更多出行灵感。更新之后的Google地图更像本地生活的搜索引擎了。
具体有哪些更新?
  • 沉浸式路线视图:在今年的 I/O开发者大会上,Google推出了沉浸式路线视图功能,用户可以预览行程的3D全景图,包括可视的步行导航、时间滑块、模拟交通和天气条件等功能。这次更新,Google扩大了该功能的可用地点,在阿姆斯特丹、巴塞罗那等16地推出。
  • Lens功能:该功能利用AI和AR技术帮助用户更好地理解周围环境,提供附近的ATM、交通站点、餐厅、咖啡店等信息。该功能同样扩展到了更多城市,包括奥斯汀、拉斯维加斯、罗马、圣保罗和中国台北。
  • 更详细的导航地图:导航地图将更准确地反映真实世界,包括建筑物更逼真的呈现和改进后的车道细节。对于美国用户,它将显示高乘载(HOV)车道信息。
  • 电动车相关信息:应用将为电动汽车驾驶员提供更多关于充电站的信息,包括充电器兼容性和充电速度等。用户还可以查看充电桩的最后使用时间,避免已损坏的充电桩。
  • 新的搜索方式:用户可以输入关键词,获得以照片为主的搜索结果和位置信息。
Google地图不止搜索地图
AI改造正在使Google地图变得越来越像搜索引擎。当你并不确切地知道自己想做什么、该去哪里,Google地图可以为你提供更多建议。
如果输入「动物拉花拿铁」「秋日枫叶」这样的关键词,地图会反馈与所输入文字相关的图片以及位置信息;如果你在东京,输入「要做的事情」,Google地图会反馈给你「动漫」「樱花」或「艺术展览」等相关建议,以及活动的位置信息。
Google地图团队负责人Miriam Daniel表示,Google分析了数十亿用户上传的照片,来匹配用户输入的文字与相关的图片,并提供图片定位信息,「我们希望在用户需要时提供更多出行灵感」。
参考链接
https://blog.google/products/maps/google-maps-october-2023-update/
https://www.theverge.com/2023/10/26/23932315/google-maps-ai-immersive-view-ev-charging-search
Bonus
苹果计划全面改造AirPods
10月26日,Mark Gurman称,苹果公司计划全面改造AirPods,包括2024年推出苹果入门级AirPods的改进版本,以及于次年推出新的AirPods Pro和AirPods Max。
据知情人士透露,苹果计划在明年晚些时候逐步淘汰第二代和第三代AirPods,用两款差异化的第四代AirPods取代它们。新型号将采用融合第三代AirPods和AirPods Pro的新设计并改进贴合度,但或许不会配备可更换耳塞。新一代AirPods都将配备更新的USB-C充电盒,提供用于查找的警报扬声器,其中,高端版本将加入噪音消除功能。
此外,苹果计划在明年年底左右更新AirPods Max,提供不同颜色的版本。与此同时,预计2025年AirPods Pro将采用新的设计和芯片,并配备与听力相关的健康功能。
腾讯混元大模型上线文生图功能
10月26日,腾讯宣布升级腾讯混元大模型,并对外开放「文生图」功能,用户可在腾讯混元大模型官网或微信小程序申请内测体验。腾讯称,升级后的腾讯混元模型中文能力整体超过GPT-3.5,代码能力大幅提升20%。本次文生图功能主要就提示词的语义理解、生成内容的合理性以及生成图片的效果这3个技术难点展开技术攻关。目前,在腾讯内部,有超过180个业务接入了腾讯混元,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等;在外部,来自零售、教育、金融、医疗等多个行业的客户已通过腾讯云调用腾讯混元大模型API。
-END-
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。
在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。
以下是最近发生的其他智能资讯
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
喜欢就关注我们吧,记得设为星标」
继续阅读
阅读原文