「每天重要的新闻不会超过五条」
整理:陆彦君
编辑:王杰夫
Key Points
阿里达摩院自动驾驶业务部分并入菜鸟。
OpenAI计划推出开源模型。
Midjourney中文版发布内测。
亚马逊最新的招聘广告暗示公司要做类ChatGPT电商搜索。
Google新功能为AI生成图像打标签。
阿里达摩院自动驾驶业务部分并入菜鸟
5月15日,有消息称阿里达摩院调整组织架构,将长期不能“自我造血”的自动驾驶实验室部分并入菜鸟集团,部门划归于菜鸟CTO下属技术团队。据称仅有约百人留在团队内,剩余70%的员工将面临裁员。不过阿里云官方表示,剩余70%员工将部分转岗到其他业务部门,并非全部裁员,但并没给出具体的比例。此次调整过后,达摩院本身将不再保留相关业务和团队。自动驾驶实验室团队现任负责人沈加翔(花名“五福”)据称不会加入菜鸟集团,新的自动驾驶团队将由P9级别的卿泉(花名)带队,此人之前为团队的算法一号位。 
达摩院自动驾驶业务经历了什么
  • 2015年,当时菜鸟网络的陈俊波提出布局自动驾驶的想法,成立菜鸟ET实验室,推出无人物流车“小G”。
  • 2017年,阿里巴巴人工智能实验室首席科学家王刚担任达摩院自动驾驶实验室负责人。
  • 2018年,阿里决定将陈俊波的团队从菜鸟体系中剥离出来,并入王刚团队。
  • 2020年,达摩院研发推出低速无人物流车“小蛮驴”,其前身正是陈俊波团队开发的无人车小G,这也是阿里自动驾驶实验室的第一个成果。两个月后,该技术应用于菜鸟的末端自动配送场景中,开始探索商业化。
  • 2021年,实验室开启L4级别自动驾驶卡车“大蛮驴”的研发。然而,随着王刚和陈俊波先后离职创业,失去技术带头人的自动驾驶实验室很难再往下推动工作。
阿里达摩院的调整意味着什么?
阿里达摩院本轮组织架构调整,对负责阿里前沿技术研发的达摩院来说,意味着其业务再次收缩。阿里巴巴将重点向达摩院4月推出的AI大模型项目“通义千问”倾斜资源。阿里巴巴董事局主席兼CEO张勇正在推进阿里云的智能化,按照他的要求,公司旗下所有业务都要接入大模型。对菜鸟而言,自动驾驶实验室研发的无人车将会广泛应用在物流配送中,这意味着阿里自动驾驶进入一个新阶段:从实验室前沿技术探索,转入场景业务落地实战。
在自动驾驶领域,遇到困境的团队还有这些
自动驾驶领域的厂商往往面临着商业化的难题,由于资金投入高,回报不明朗,全球厂商都面临压力。近日,Google旗下的Waymo为节约高昂的数据存储成本,决定严格控制数据上线,只保存新采集的数据,删除旧数据。通用汽车旗下的Cruise仅在2022年就消耗了近20亿美元,其投资方之一软银于2022年3月转让了所持股份。如今,AI大模型的研发与应用在全球持续升温,在大模型和自动驾驶之间,技术巨头果断选了前者。

参考链接
https://news.cnstock.com/news,bwkx-202305-5060965.htm
https://www.wired.com/story/self-driving-cars-are-being-put-on-a-data-diet
OpenAI计划推出开源模型
5月15日,The information援引知情人士消息称,OpenAI正准备发布一款新的开源语言模型。考虑到ChatGPT与GPT-4已经形成巨大的商业价值,这款开源模型能力不会很强,至少不会与GPT-4形成竞争关系。最近越来越多的开源模型涌现,就在今天,号称要做大模型领域Linux的初创公司Together宣布完成2000万美元种子轮融资,面对这些开源的竞争对手,OpenAI也不得不施展防御措施。
OpenAI为什么要推出开源模型?
5月初,Google在一份名为《我们没有护城河,OpenAI也没有》的内部文件中提到,“在这场AI军备竞赛中,第三方开源正在悄悄吃掉属于我们的好处。”Google和OpenAI在几个月内攻坚成功的技术难题,开源模型在几周内就能完成。例如,现在只要一个晚上就能在笔记本电脑上微调出一个个性化AI。在Google Pixel 6手机上,以每秒5个token的速度就能运行基础模型。大量创新的开源平替模型不断涌现,训练和试验的门槛都在降低。正如在图像生成领域,Stable Diffusion开源后带来了产品集成、市场、用户界面的创新,随之占据市场主流,而在OpenAI推出的Dall E身上,这些都没有发生。
目前都有哪些开源模型?
  • LLaMA:Meta公司于今年2月初发布了语言大模型LLaMA,宣传它在参数规模更小的情况下,性能却优于OpenAI的GPT-3。不过3月6日,LLaMA代码被泄露在4chan后,基于“被迫开源”的LLaMA,涌现出一大批开源模型。
  • Vicuna:美国加州大学伯克利分校的Sky Computing实验室于今年3月发布了语言大模型Vicuna,根据从ShareGPT.com(一个用户可以分享自己与ChatGPT 的对话的网站)收集到的用户共享对话微调 LLaMA 基础模型,Vicuna-13B与Stanford Alpaca等其他开源模型相比展现了具有竞争力的性能。
  • Alpaca:来自斯坦福大学的研究人员于今年3月发布了开源语言模型Alpaca,该模型以Meta推出的70亿参数的LLaMA大模型为基础,效果可比肩1750亿参数的GPT-3.5(text-davinci-003)。
  • MPT系列模型:2023年5月,MosaicML推出了可商用的MPT系列模型,MPT在大量数据(1T tokens)上训练,效果与LLaMA相当,高于StableLM、Pythia等其他开源模型。
  • RedPajama系列模型:2023年5月,Together发布了可商用的RedPajama系列模型,它在5TB的同名开源数据上训练而来(前面提到的MPT也是用此数据集训练)。除了70亿参数基础模型,它还有一个30亿参数版本,可以在5年前发售的RTX2070游戏显卡上运行。70亿版本完成了80%的训练,效果已经超过了同规模的Pythia等开源模型,略逊于LLaMA。
参考链接
https://www.theinformation.com/articles/open-source-ai-is-gaining-on-google-and-chatgpt
Midjourney中文版发布内测
中文互联网用户也可以使用Midjourney玩转AI绘画了。5月15日,Midjourney AI在官方微信公众号发布了名为《Midjourney官方中文版·内测申请》的推文,邀请中国的创作者加入内测。该版本搭建在QQ频道上,每周一、周五下午6点统一开放,用户扫描相关二维码即可加入,参与免费内测,达到一定人数后入口会关闭。不过目前名额已满,想要参与试用的话只能耐心等一等啦。
Midjourney中文版有什么不一样?
  • Midjourney中文版最大的不同就是它搭建在QQ频道上,Midjourney本身并没有独立的软件,过去它一直搭建在美国社交软件Discord上,这是它首次出现在其他平台。
  • Midjourney中文版做了不少本地化工作,用户可以直接使用中文展开对话。加入频道后,在创作频道中输入“/想象+生成指令”,即可召唤Midjourney机器人作画;输入“/漫画+生成指令”,可召唤niji·journey机器人作画。此外,Midjourney还上线了放大图像(upscale)、变化图像(variation)、定向修改(remix)、垫图(image prompt)等功能。
  • 目前Midjourney中文版可以免费生成25张图,收费价格与Discord版本相同,每月订阅费,按功能分为8美元、24美元和48美元不等。
参考链接
https://mp.weixin.qq.com/s/RYE2XUMKYSsXVsOjHaaMhg
亚马逊最新的招聘广告暗示公司要做类ChatGPT电商搜索
和竞争陷入白热化的Google与微软相比,过去半年来,电商巨头亚马逊在生成式AI领域略显沉默。不过亚马逊最新的招聘信息显示这家电子商务与云计算领域的双料“老大”也已经行动起来了。5月15日,有媒体发现亚马逊在一则招聘信息中写道,公司正考虑给线上商店的搜索栏增添新功能,新功能的聊天界面将由类似GPT的大模型提供支持。
这是招聘启事的完整版
“我们正在通过交互式对话体验重新构想亚马逊搜索,帮助您找到产品问题的答案、进行产品比较、接收个性化产品建议等等,从而轻松找到满足您需求的完美产品。我们正在寻找最优秀、最聪明的人才来帮助我们实现这一愿景并将其立即交付给我们的客户。这将是搜索引擎千载难逢的变革,就像30年前的Mosaic浏览器让互联网变得更容易使用一样。如果你错过了1990年代——WWW、Mosaic、亚马逊和Google的创立——你不会想错过这个机会。”
亚马逊用AI带货的想法一直没变过
亚马逊在2014年推出的AI语音助手Alexa,可完成语音交互、音乐播放、控制家用智能设备等功能,衍生的智能音箱曾被誉为“亚马逊上最畅销的产品之一”。不过亚马逊让用户通过Alexa语音助手下单购物的想法却失败了,它的操作太复杂以至于用户发现掏出手机点击下单明显更方便。
不过这一次的招聘信息显示,趁着大模型技术的突飞猛进,亚马逊又想让AI带货了。今年5月初,一份泄露文件显示亚马逊试图依靠内部开发的大语言模型为Alexa提供支持,试图将其变为“会思考的实体”。5月13日另一份泄露文件也显示亚马逊一个名为Burnham的项目试图为Astro家居机器人加上一个更聪明的AI大脑
参考链接
https://venturebeat.com/ai/amazon-job-listings-hint-at-chatgpt-like-conversational-ai-for-online-store/
https://www.theverge.com/2023/5/4/23710938/amazon-alexa-ai-chatbot-llm-teaching-model
Google新功能为AI生成的图像打标签
AI生成的逼真图像令人担忧事实与虚假信息的混淆,对此,Google正在提供新的对策。5月15日,Google将推出能够识别误导性信息和AI生成图像的工具。
此外还有其他公司也在做类似的事情,曾接受微软2600万美元投资的Truepic将自己定位成确保“互联网真实性的基础设施”,该公司开发的系统能够验证图像的真实性,展示图片的拍摄时间、位置与来源,还可以检测图像是否被修改过。
Google将在图像搜索里增添两个新功能
  • Google将为图片提供注释,在“关于此图像”(About this image)里面,用户可以了解图片在何时被Google索引、首次出现的位置在哪里、是否还在其他网站出现过。凭借上述信息,用户能查证图片的原始来源,辨别新闻机构发出的一些“揭露性照片”究竟是真实的还是AI生产的。
  • Google会标记自家软件生成的所有AI图像,同时与Midjourney和摄影网站Shutterstock合作,确保将AI标记添加到它们生成的作品里。
参考链接
https://www.bloomberg.com/news/articles/2023-05-15/google-launching-tools-to-identify-misleading-and-ai-images?srnd=technology-vp
-END-
关于往期智能日报,请点击下面的链接:
喜欢就关注我们吧,记得“设为星标”哦~
接下来将更新:
微软VS Google:AI技术的王权更迭
……
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
再次,喜欢就关注我们吧,记得“设为星标
继续阅读
阅读原文