「每周一三五更新」
撰文:江睿杰、裘欢欣
编辑:王杰夫
Key Points
苹果正推进规模庞大的生成式AI追赶计划;
OpenAI放弃开发成本更低的模型Arrakis,因为技术路线效果不如预期;
纳德拉在致股东的年度信中表示微软要All in AI;
OpenAI员工将按照800亿美元估值套现;
多家报纸要求ChatGPT为数字内容付费。
苹果对生成式AI「非常焦虑」,正在推进规模庞大的追赶计划
10月22日,Mark Gurman撰文称,有了解苹果内情的人士称,苹果对于OpenAI等公司在生成式AI领域占得先机感到「非常焦虑」,目前正启动一项庞大的计划试图追赶,有3位高级副总裁都参与到了该计划中。
苹果想干啥,目前进度如何?
苹果想做的事情不仅是开发单独的AI产品,还包括借助AI更好地完善苹果App的开发与应用生态。其整体计划由苹果负责AI和软件工程的两位高级副总裁John Giannandrea和Craig Federighi领导,服务部门高级副总裁Eddy Cue也参与其中,计划的预算是每年10亿美元。
  • John Giannandrea目前负责开发新的AI系统底层技术并改进Siri,加载生成式AI的Siri预计可能在明年推出。
  • Craig Federighi则在努力将AI添加到下一个iOS版本中,同时也在研究如何将生成式AI整合到类似Xcode的开发工具中,让苹果生态中的App开发者更高效地工作。
  • Eddy Cue则力图将AI功能植入尽可能多的App,包括苹果自家的Apple Music以及Pages、Keynote等生产力工具类应用。
苹果目前还未最后确定接下来到底是把生成式AI完全部署在设备本地或完全部署在云端,也有可能采取两者结合的方式。
苹果AI开发已披露资讯汇总
今年7月彭博社报道称苹果内部建立了自己的AI框架Ajax以及自己的聊天机器人AppleGPT。这两个项目都成立于2022年,Ajax基于Google云的机器学习框架Google Jax搭建,AppleGPT也类似复刻了ChatGPT等同类应用,并没有体现较突出的特色。
9月时,苹果的AI基础模型团队的信息得到更多披露。该团队由曾在Google Brain任职的华人学者庞若明领导,总共有16人,关键角色几乎都来自Google,团队每天的研发成本高达数百万美元。此外苹果还有一个视觉智能团队正专注于生成图像、视频和3D场景的AI,类似于Midjourney 或OpenAI的Dall·E 2。
苹果计划于明年举行一次专项的AI产品的发布。
参考链接
https://www.bloomberg.com/news/newsletters/2023-10-22/what-is-apple-doing-in-ai-revamping-siri-search-apple-music-and-other-apps-lo1ffr7p?srnd=undefined
OpenAI取消开发「Arrakis」项目,该技术路线效果不如预期
曾被OpenAI寄予厚望,预期可能比GPT-4更具性价比的Arrakis模型日前已经中止开发,原因是生成质量达不到预定目标。
Arrakis的开始与结束
Arrakis的开发始于2022年秋天,即ChatGPT发布前夕。该模型使用和常见的「密集模型」相反的「稀疏原则」,这使得AI神经网络在处理指令时并不需要激活整个网络,而只需激活其中一小部分,因此将显著降低AI运算的单次成本。作为一个多模态模型,Arrakis除了文本还能生成图片和视频,曾计划于2024年发布。
自今年春季开始,Arrakis模型正式投入训练,但性能欠佳,始终达不到OpenAI预设的至少与GPT-4表现相当的目标,因此最终被迫腰斩。
目前ChatGPT每天的运行成本超过70万美元,OpenAI的大股东微软曾寄希望于Arrakis能协助降低成本,但现已开始关注其他更便宜的语言模型。微软认为生成式AI的高昂开支可能会影响其商业应用前景。
OpenAI的新计划:多模态和降成本都箭在弦上
Arrakis的开发经验可能对OpenAI计划中的另一个多模态模型Gobi有所帮助。Gobi有可能就是GPT-5,但是该模型目前尚未开始正式训练。
9月25日发布的GPT-4V虽然也是多模态的,拥有了视觉处理的能力、图像生成能力和语音交互能力,但暂时还不能处理视频。而目前Google已经发布了自己的多模态产品Gemini的早期版本,两者功能相似,但Gemini据说还拥有阅读视频的能力。Gemini利用了很多Google的自有数据训练,包括YouTube视频网站上的900多亿分钟的视频字幕,这方面Google拥有一定优势。
除了加快多模态产品的开发,降低成本同样是OpenAI必须考虑的事。在Arrakis中止之后,OpenAI正在考虑自研芯片的方案。在10月17日的《华尔街日报》Tech Live大会上,OpenAI CEO Sam Altman表示为满足模型算力需求,OpenAI可能会自研芯片研发定制芯片确实可以降低运算成本,但周期较长,短期内反而会增加OpenAI的成本压力,是否走这条路公司还在斟酌。
参考链接
https://www.theinformation.com/articles/openai-dropped-work-on-new-arrakis-ai-model-in-rare-setback
https://the-decoder.com/openai-reportedly-canceled-arrakis-its-more-efficient-gpt-4-level-ai-model
纳德拉在致股东的年度信中表示微软要All in AI
每年微软CEO萨蒂亚·纳德拉都会在年度报告前面附上一封致股东的信。一般来说,这封信主要会回顾微软过去一年的发展,包括各个业务情况如何,推出了哪些新产品,有什么技术创新。
今年的年度信有些不同,这封名为《引领新纪元》(Leading in a new era)的信全文围绕生成式AI展开,从基础设施到数据库,从商业软件到搜索,纳德拉事无巨细地将每个业务目前如何与AI结合的、未来又将在哪些方面进一步推进,像待办事项清单一样全部罗列了出来。
年度信写了什么?
首先,纳德拉表示下一代AI「将重塑每个软件类别和每个业务,包括我们(微软)自己的业务」,并且列举了很多已经被AI重塑的软件,包括健康公司Epic为医生提供的病例写作助手、奔驰的车载语音助手等等。
接下来,纳德拉解释了这一次AI浪潮之所以能被称作新纪元,有两个突破至关重要。
  • 其一就是生成式AI提供了最通用的交互界面——自然语言。过去交互都是由鼠标、键盘、触摸屏完成的,但现在AI可以直接看到、听到,并且理解我们的世界。
  • 其二就是这一代AI有这强大的推理引擎,它能够帮助我们更好更快的处理日益增长的数据,这种能力是过去AI没有的。
最后,纳德拉详细介绍了微软各个业务板块在AI时代的机会,例如微软的高算力服务器可以完成AI的训练和推理工作、GitHub Copilot可以帮助程序员提高代码写作效率等。
这应该是纳德拉第二次如此慎重的面对业务转型,上一次还是2014年他在刚刚接任CEO时提出「移动为先,云为先」战略。在近日接受技术媒体Insider的母公司Axel Springer颁发的同名奖项时,纳德拉在采访中,将AI称作继PC与Windows、网络、移动、云计算后,微软面临的第五次重大转变。
参考链接
https://www.microsoft.com/investor/reports/ar23/index.html
https://www.businessinsider.com/microsoft-ceo-satya-nadella-interview-ai-activision-blizzard-axel-springer-2023-10?r=US&IR=T 
OpenAI员工将按照800亿美元估值套现
OpenAI将通过风险投资公司Thrive Capital牵头出售现有股份,该交易将使该公司估值达到800亿美元或以上。9月末,新皮层就曾报道过OpenAI寻求融资的传闻,当时传言的估值是800亿到900亿美元之间。看来一个月不到,OpenAI的估值略有下调。
OpenAI员工套现计划
这并不是OpenAI第一次出售股份给Thrive Capital。今年4月,OpenAI以270亿美元的估值出售股份给Thrive、红杉资本、Andreessen Horowitz 和K2 Global。
目前,OpenAI和Thrive Capital正在谈判新的股权出售协议。据称,此次股份出售中,OpenAI不会发行新股,出售的股份源自公司员工所持的部分。不过最终方案尚未确定,具体的条款可能还会发生变化。
OpenAI估值或达800亿美元以上
如果这项由Thrive Capital牵头的要约收购成立,意味着这家人工智能公司的估值将达到800亿美元,是其4月估值的3倍以上。它也将超越Stripe和SHEIN等公司,成为全球最有价值的创业公司之一,仅次于伊隆·马斯克的SpaceX,以及中国公司字节跳动。字节跳动目前估值2250亿美元,SpaceX的估值则是1370亿美元。
参考链接
https://economictimes.indiatimes.com/tech/technology/us-based-vc-firm-thrive-capital-to-lead-openais-share-sale-at-80-billion-plus-valuation-report/articleshow/104576826.cms?from=mdr
多家报纸要求ChatGPT为文章付费
10月20日,据报道,一些主流报纸媒体正在与ChatGPT的制造商OpenAI就数字新闻故事的访问权进行谈判:AI公司将向出版商支付费用,以便使用其内容训练AI。
这些内容平台都想让AI公司掏钱
  • 4月,伊隆·马斯克宣布向批量访问原Twitter平台数据的AI公司收取至少每月4.2万美元的费用。
  • 7月,OpenAI与美联社发布共同声明,宣布两家机构已经签订合作协议,授权OpenAI使用部分美联社的新闻报道用于AI训练;同时美联社也将在工作中使用OpenAI的AI技术,可能用于生成赛事总结、会议实时转录等。
  • 此外,OpenAI还与图片库供应商Shutterstock达成合作协议,将获得Shutterstock的数据许可,包括图像、视频和音乐,以及任何相关的元数据。
  • 10月,有报道称社交论坛Reddit与多家顶级生成式人工智能公司就数据付费问题会面,Reddit表示如果无法达成协议,可能会考虑阻止来自Google和Bing的搜索爬虫。
训练生成式AI,数据成为关键
很长时间以来,像OpenAI这样的技术公司一直从互联网抓取大量未经许可的数据来构建数据集,以训练生成式AI。随着对数据需求的增长,获取数据却变得越来越棘手,AI公司需要通过向报纸出版商和其他数据所有者支付费用来合法地获取数据。研究机构Epoch AI认为,训练生成式AI将导致对数据的需求急剧增加,以致可用于训练的高质量文本可能会在2026年耗尽。
参考链接
https://www.washingtonpost.com/technology/2023/10/20/artificial-intelligence-battle-online-data/
-END-
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。
在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。
以下是最近发生的其他智能资讯
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
喜欢就关注我们吧,记得设为星标」
继续阅读
阅读原文