过去的两周里,我们一边兴奋地感受着「大猩猩们」的重拳出击,一边做了一份🔗非专业通用 LLM 测试集 Z-Bench一边回望历史,感慨过去七八年间,地球另一侧的硅谷,在我们毫无感知的情况下不时重现着「人类群星闪耀时」,一边展望未来,期待 AI 以更民主、更平等的形式与我们和平共处。
真格投资团队继续梳理了有趣的 AI 新工具,总结了数家大公司的新动作,还带来了 5 篇探讨「如何与 AI 共生」的精选文章。希望能带给你一些启发,也欢迎在评论区和我们交流你的想法~
本篇文章包含:
- 观点 -5 篇围绕「如何与AI共生」展开的文章:既包括 OpenAI 与微软的合作史、SamAltman 与 Elon Musk 的纷争史,也包括 OpenAI 的两位掌门人、Bill Gates 与自身科技作者对此事的思考;
- 工具 -8 个成熟企业的新产品:过去一个月,开源社区的领袖们着实在 AI 民主化层面做了不少努力;5 个有用的和 5 个有趣的小工具;以及 3 个由华人开发者搭建的有趣工具——随着华人开发者的逐渐增加,中文社区的有趣工具也在不断涌现,「华人开发者」专区此后也将成为我们的固定栏目,希望大家喜欢并推荐/自荐!
- 大事记 -过去两周发生的大事件:从公司角度划分,并以时间线为轴
AI·观点

How Microsoft’s bet on Azure unlocked an AI revolution | 我们如何开启这场 AI 革命?微软答卷:押注硬件,赢得软件

2019 年,还是非盈利研究组织的 OpenAI 决定向市场提出数量「荒谬」的算力需求,而「老大哥」微软决定 Say Yes,并花费数亿美元,用数千个 NVIDIA GPU 以前所未有的规模和新方法搭建了一套硬件系统来支持 OpenAI 的模型搭建。


站在 2023 年的今天回看,这个组合将各自的力量发挥到了极致,成就了一门「赚翻了的」生意——但这一切源自一个信念:构建一个彻底改变人机交互方式的 AI 系统。
原文 - https://news.microsoft.com/source/features/ai/how-microsofts-bet-on-azure-unlocked-an-ai-revolution/

The secret history of Elon Musk, Sam Altman, and OpenAI | 我们如何领导这场 AI 革命?看 Elon Musk 与 Sam Altman 如何选择

尽管 2019 年,为了筹集更多的资金获取 LLM 搭建所需的算力,OpenAI 选择由非营利组织转型成为一家盈利性企业,但 Sam Altman 选择了放弃公司所有股份 —— 虽然他不能从这家创业公司获得任何钱,但早已名留史册而 Sam 也让我对初创公司或者创业这件事产生了一个全新思考:组织的存在是为了完成使命,其性质是否重要?

这篇文章的全文翻译我们也放在了推送副条,看两位有 Vision 的创始人,如何在 AI 斗争中博弈,enjoy~
原文 - https://www.semafor.com/article/03/24/2023/the-secret-history-of-elon-musk-sam-altman-and-openai

This Changes Everything | 我们如何面对这个被 AI 改变的世界?

请回答:
- 我们是否高估了 AI 对世界产生巨大影响,甚至彻底颠覆世界所需的时间?也许是的。
- 我们是否了解正在改变世界的 AI 的运行机制?也许并不。
- 我们是否为 AI 所带来的新世界秩序做好了准备?也许还远远不够。
也许 AI 不是「科幻小说」,而是「神秘之术」——一种我们无法控制、无法理解的力量。
Ezra Klein 的这篇文章不仅思考全面,也是金句频出:
We do not have the luxury of moving this slowly in response, at least not if the technology is going to move this fast. 技术发展如此迅猛,我们没有缓慢响应的奢侈权力。
One of two things must happen. Humanity needs to accelerate its adaptation to these technologies or a collective, enforceable decision must be made to slow the development of these technologies. Even doing both may not be enough. 人类需要至少要做到一件事:加速适应技术,达成共识放慢技术激进发展的脚步 —— 即便都做到,可能也不够。
In the court of the mind, skepticism makes a great grand vizier, but a lousy lord. 在思想的殿堂里,怀疑主义者是伟大的宰相,但不是恰当的领主。
原文 - https://www.nytimes.com/2023/03/12/opinion/chatbots-artificial-intelligence-future-weirdness.html

OpenAI CEO, CTO on risks and how AI will reshape society | 我们如何负责任地让 AI 改变世界?

从生成式 AI 诞生的第一天起,关于其安全问题(包括伦理道德、社会安全、信息可靠性等等)的讨论便不绝于耳,随着以 GPT 和 Midjourney 为代表的模型能力的不断增强,这个问题显得愈发重要。
在短短的 21 分钟的访谈中,面对 ABC 记者一系列尖锐而直接的问题,OpenAI 的创始人 Sam Altman 和 Mira Murati 结合 AI 产品的定位、开发、发布、使用与内外部控制的全流程着重讨论了 AI 安全问题,这里是几点小总结:
1. AI 应被视为增强人类能力的工具而非人类的替代者
- 人类的集体创造力将决定 AI 的长期天花板,所以尽管存在风险,AI 产品必须被推向市场,与现实世界接触并发生关系,而在这个过程中,开发者也会尽可能多地学到如何从技术和产品侧规避大的风险;
- AI 会带来新的学习模式,让过时的工作机会消亡,让新的工作机会诞生。
2. 模型应被视为推理引擎而非事实数据库 
人类不应过度信赖 AI 生成的内容,而应保持独立思考,交叉验证所得信息的真实性。
3. AI 的控制权属于人类,但不应属于独裁者
- 开发者应全方位地控制风险,准备好随时改变模型运行规则甚至关闭模型;
- 政策制定者应深思熟虑,了解 AI 在做什么,能做什么,制定全面而公正的规则。
当然市场也不止存在一种行为,Microsoft just laid off one of its responsible AI teams - https://www.platformer.news/p/microsoft-just-laid-off-one-of-its
视频 -  https://youtu.be/540vzMlf-54

The Age of AI has begun | 我们如何与 AI 一起,面向未来?

「In my lifetime, I’ve seen two demonstrations of technology that struck me as revolutionary」——真诚又乐于分享的 Bill Gates 用 7 页长信,从微软的 Windows GUI 开始,阐述了这场 AI 革命给他带来的震撼与思考,我的一些要点总结如下:
1. AI 的发展会带来全新的行为秩序
从历史发展的角度看,AI 的发展与微处理器、PC、互联网和移动电话的诞生有着同等意义,个人与企业行为都会以 AI 技术为基础,建立全新秩序。
2. 生产力的提升 
- 从个人角度看,会出现以个人数据为基础,在所有个人设备上无缝运行,以自然语言为指令的私人 AI Copilot;
- 从企业角度看,会出现以企业数据为基础的 AI 员工。
3. 医疗健康平权
AI 将可以以低成本为贫困地区提供高质量分诊与健康建议。
4. 教育个性化 
- 从学生角度看,会出现个性化的 AI 导师,根据学生的个人兴趣、目标与习惯定制学习内容;
- 从学校/教师角度看,AI 的应用会更有利于课堂师生互动;
- 虽然场景明显,但教育工作者依然需要时间探索诸如「界定 GPT 论文是否属于抄袭及其影响」之类问题的解决方案。
5. 风险与问题
- 从 AI 的角度思考,AI 是否会因为能够自主决策而失控?
- 从人类的角度思考,如何防范人类利用 AI 做坏事,例如编纂虚假信息?
6. 未来准则
- 我们应平衡 AI 改善人类生活的能力与其弊端;
- 政府与慈善机构需发挥自己的作用,防范/减少 AI 不平等现象的发生;
- 时刻谨记,我们尚处于对 AI 潜力开发的初始阶段——AI 时代,充满了机遇与责任。
原文 - https://www.gatesnotes.com/The-Age-of-AI-Has-Begun
AI · 工具
成熟公司的新动作 | From Big
🪄 Mozilla.ai by Mozilla
Mozilla Foundation 的执行董事 Mark Surman 在博客中介绍 Mozilla.ai 的方式非常有趣「好消息:人们关心 AI 的安全;坏消息:大公司并不在意——而 Mozilla.ai 作为一家创业公司和社区,旨在建立一个值得信赖的,独立的 AI 开源生态系统」
链接 - https://mozilla.ai/

⌨ CopilotX by GitHub

Copilot 是一个已经被开发者广泛高频使用的 AI 项目,现在其用户生产的新代码中有 46% 是由 Copilot 编写的。但此前它的主要功能局限于代码自动补全。于是,GitHub 推出了 Copilot 的全新版本——Copilot X,具有聊天界面、PR 支持,同时可以保证文档质量。
如果关注新 AI 工具的进展,你会发现许多开发者都在尝试制作扩展和插件来将 AI 应用于 PR、explaining repos 等。此外,我在某个采访中听到 Nat Friedman(前 GitHub CEO)谈论他们一直如何努力满足开发者的需求——我猜现在仍是如此。
链接 - https://github.blog/2023-03-22-github-copilot-x-the-ai-powered-developer-experience/

♾ Dolly by Databricks

又一个小型开源模型加入 OpenAI 的竞争对手阵营。为了推动 AI 民主化,Databricks 发布了一个完全开源的模型,并以克隆羊 Dolly 命名。此模型基于 EleutherAI 的 GPT-J-6B 搭建,通过一个包含 50,000 个单词的数据集进行了微调,同时 Databricks 宣称 Dolly 已经展现出了与 ChatGPT 相同的「神奇」人机交互能力——整个过程仅花费 3 小时,速度飞快!
链接 - https://www.databricks.com/blog/2023/03/24/hello-dolly-democratizing-magic-chatgpt-open-models.html

🧑‍🎨 Reimagine by Stability AI X Clipdrop

Stability AI 与 Clipdrop 合作开发了一款新的「图生图」插件 Reimagine,输入并重构图像,甚至是针对指定细节进行增强,以便转移观看者的注意力——也许这可以成为建筑设计、室内设计等领域的实用小工具!
链接 - https://stability.ai/blog/stable-diffusion-reimagine 

🖌 Magic Design by Canva

Canva 正在迅速将 AI 整合到其视觉套件中。
这一次,他们添加了十个,是的,十个新的功能(他们称之为礼物)。这是一组被命名为 Magic Design 的工具,包括设计、演示、橡皮擦、编辑、绘制、同步、视频、印刷页、社交平台适配和翻译功能。当反对者问一个随机图像生成器对具体的创意业务有什么用处时,这就是初步答案——所有这些 AI 功能都可以在譬如 Canva 这样被广泛使用的工具中集成——但工具的未来只能靠我们想象。
链接 - https://www.canva.com/newsroom/news/canva-create-brand-new-era-2023/
📢 Conformer-1 by AssemblyAI
AssemblyAI 推出了其基于 Transformer 的语音识别模型 Conformer-1,在经过 650,000 小时(大约是人一生的时间)训练后,实现了接近人类水平的表现——在嘈杂声音数据识别方面,与此前市场上的 ASR 模型相比,错误率约下降 43%,推理速度约提升了 29%。
链接 - https://www.assemblyai.com/blog/conformer-1/
📽 Gen-2 by Runway
这是市场上第一个公开可用的文生视频模型,虽然 demo 仍旧差强人意,但这是向着正确方向前进的一大步,而且在以速度极快的方式变得更好——想想 Gen-1 仅仅是 2 月 6 日发布的——期待 Runway 成为视频领域进步惊人的 Midjourney。
链接 - https://research.runwayml.com/gen2
📽 AIPlugins by LangChain
一如既往,LangChain 以闪电般的速度跟进了 OpenAI 的开发进程,在 ChatGPT Plugins 发布后,LangChain 便推出了基于他们的工具包的 AIPlugin Tool,亦是推动开放式 AI 开发的伟大工作。
链接 - https://twitter.com/hwchase17/status/1639351690251100160?s=20
有用的|For Money
💡 llama.cpp
AI 民主化大跃进,如果你致力于成为 AI Hacker,那么你要么已经听说了 llama.cpp,要么需要赶快知道!来自保加利亚的开发者 Georgi Gerganov 用一种适用于 Mac 电脑的 4 位量化的方法,将 Meta 的 LLaMa 模型组合并压缩成为更易于管理的大小,可以部署在个人 PC 上使用。据开发者本人说,llama.cpp 的代码库活跃程度非常高,每小时有两位数的拉取请求。
与此同时,这项工作对其他项目也产生了影响,例如 Stanford 的 Alpaca 模型通过 llama.cpp 进行了修改,生成了 alpaca.cpp——一个仅 4GB 的 Chat-GPT-style 模型!
链接 - https://github.com/ggerganov/llama.cpp
🎙 Her
作为语音助手的重度使用者,初版 Alexa 的首批开箱用户,我很高兴找到了更有生产力的语音助手!开发者 Justin Alvey 搭建了一个可以与电子邮件对话的语音助手,还通过 Eleven Labs 调取了一个「真人声音」,而集成了 GPT-3.5 及其他 LLM 意味着我们可以通过语音让它做一些文字 Chatbot 可以做到的事,例如精确查找、总结,甚至生成回复——期待这种交互技术可以真的集成到电子邮件程序中!
链接 - https://twitter.com/justLV/status/1637876167763202053
🤖 Replicate Codex
一句话简介:模型界的导航系统。在这里,一站式实现 AI 模型的搜索、筛选与排序,为 AI 项目开发找到适合的模型!
链接 - https://www.replicatecodex.com/
OpenAI Portfolios
有两家 OpenAI 的被投企业近期正式发布了他们的产品,一个面向垂类消费者,一个面向开发者,让我们一起来看一看:
👪 Milo - Co-Parent,父母的 AI 助理,让 AI 协助处理家务事。
链接 - https://www.joinmilo.com/
🧑‍💻 Cursor - 为 GPT-4 编程而生的 IDE,目前可以做到:
  • 编程 - 用比 Copilot 更智能的 AI,生成 10-100 行代码
  • 修正 - 请求 AI 编辑一段代码,仅查看建议修改的部分
  • 聊天 - 通过 ChatGPT 风格的交互界面理解当前文档
  • 其他 - 请求修复 lint 错误,在悬停时生成测试/注释等
链接 - https://www.cursor.so/
好玩的 | For Fun
📸 HeadshotPro
抛弃专业照相馆吧!上传团队成员的朴素自拍照,AI 自动优化每张照片的光线、焦点与色彩,为每位成员生成 120 张职业照。
链接 - https://www.headshotpro.com/
🛟 Jailbreak Chat
还记得 GPT-3 时期的恶魔 DAN 吗?Jailbreak 专注收集绕过 ChatGPT 安全限制的 Prompts——其实抛开有趣,这同时也在提醒着我们 AI 安防的意义所在。
链接 - https://www.jailbreakchat.com/
🗞 Catbird
还记得 Nat Friedman 自己开发的多语言模型对比平台 nat.dev 吗?如今开发者做出了视觉模型版——输入一个 Prompt,用 15 个模型同时生成图像。
链接 - https://www.catbird.ai/
🐏 ChatLLaMa
利用 Meta 的 LLaMa 模型和 Alpaca 数据集搭建的 ChatGPT 风格的对话机器人,由 Baseten 的三位工程师共同搭建,虽然当前仅支持 LLaMa 7B 模型,但官方表示一周内 LLaMa 30B 模型也会开放!
链接 - https://chatllama.baseten.co/
🔍 Zing
还没用上 New Bing 吗?试试 Zing!
Brex 的 AI 与设计负责人 Poetro Schirano 用 Prompt、GPT-4 和 Bing API 共同搭建了克隆版 New Bing——Zing,一个保持了幽默感的 Sydney!
链接 - https://www.jailbreakchat.com/
搭建过程 - https://twitter.com/skirano/status/1638352454822625280
华人开发者 | Chinese Developer
🗞 沉浸式翻译
一款在 GitHub 获得了 4.3k+ 星星的有产品力的翻译插件,由开发者 Owen Young @OwenYoungZh 独立开发,以下是 Owen 本人对这款产品的介绍:
链接 - https://immersive-translate.owenyoung.com/
📖 myGPTReader 
GitHub 两天轻松收获 2k 星的个人 AI 阅读助手,一个基于 Slack 的聊天机器人,可以读取任何网页、电子书与文档,并根据与问题相关的内容做总结与分析处理,由独立开发者 Dawei Ma@madawei2699 与 GPT 共同开发
链接 - https://github.com/madawei2699/myGPTReader
📜 Bilingual Book Maker
由有趣的伊洪@yihong0618 开发的 Python 脚本,用 GPT-3.5 翻译整本 epub 格式的外文书(不限语种),并输出为双语对照电子书,虽然需要自带 API Key 且耗时较长,但让我们科学计算:
基于 GPT-3.5-turbo 的定价,假设一本约 20 万字的英文书需消耗 700,000 token,则翻译这本书需花费 (700,000 / 1,000) * 0.002 = $1.4,此处@译者。
链接 -
https://github.com/yihong0618/bilingual_book_maker
杂项 · 大事记
Google
📅 3 月 14 日 | PaLM API, MakerSuite, Workspace & Generative AI App Builder
3 月 14 日晚,Google 将四个重磅产品作为组合同时推出:
  • 基于其最佳语言模型 PaLM 的工具 PaLM API;
  • 辅助原型设计,简化开发人员模型制作、迭代流程的工具 MakerSuite;
  • 集成生成式 AI 的 Workspace(即 Google Doc 和 Gmail);
  • 面向开发者,基于 Google Cloud 的可用于构建聊天界面与数字助手的 Generative AI App Buider。
📅 3 月 21 日 | Bard 公测
2 月 6 日发布会后的一个半月,Google AI 对话系统 Bard 的公测姗姗来迟,也许是 ChatGPT 与 New Bing 的负面消息让 Google 不得不提高警惕,又或者是作为一家大公司,Google 必须对自身责任与社会舆论予以更多的关注,公测版本不仅被叠加了重重限制,还在显眼的位置被小心翼翼地标注了「Bard 只是一个测试,也许会生成错误或者具有攻击的言论,但这不代表 Google 的观点」。
尽管当下开放版本还有诸多缺陷,但 AI 的马拉松才刚刚拉开序幕,谁能胜出,让我们拭目以待

Microsoft

📅 3 月 16 日 | 365 Copilot
还记得微软副总裁 Jared Spataro 的开场白吗?
「一百年后,我们将会回顾这一刻,并说,那一刻,数字时代的真正开始了。」
这句话我们尚且无法验证,但随着 Microsoft 365 Copilot 的推出——将 OpenAI 的 GPT-4 模型集成至其 Office 365 的所有应用程序:Word、Excel、Popwerpoint、Teams 等等——Microsoft 确实继续在这场 AI 军备竞赛中保持了其领先地位 :
  • 在 Word 中,我们可以与 AI 共同创作、修改并总结;
  • 在 Excel 中,我们可以利用 AI 实现数据可视化,进行数据分析;
  • 在 PowerPoint 中,我们可以一句话生成演示文稿;
  • 在 Outlook 中,我们可以使用 AI 更便捷地管理邮件;

  • 在 Teams 中,我们可以使用 AI 确立会议大纲,整理会议纪要;
  • 在开发中,我们可以使用 AI 简化开发流程。

Adobe

📅 3 月 21 日 | Firefly
借助 Firefly 模型,Adobe 开始向创作者、艺术家和无数用户展示了一把自己的实力——虽然当前的生成效果还是差强人意,但视觉模型与工作流的整合已经让我们窥见了视觉生产力工具的部分未来——选定特定区域生成局部修改,通过文本对图片进行局部编辑,由草图自定义生成纹理与样式,通过文本对视频进行编辑……

NVIDIA

📅 3 月 21 日 | GTC
一年一度的 GTC,除了参与传统保留项目「老黄是真是假」之外,我们也真的见识到了 NVIDIA 不少的新动作——NVIDIA 正在从制造芯片的「理工学生」转变为能力全面的 AI 服务提供商。而整场大会最亮眼的内容莫过于带有双 GPU NVLink 的,专为大算力需求设计的「核弹级」显卡 H100 NVL;其次,则是把「ChatGPT 同款超算」搬到了云上,向公众开放——正如本文开头所述,微软为了这套超算,花费了数亿美金——现在,每月 $36,999 起即可购买 DXG Cloud 服务,获得由 8 张 H100 或 A100 显卡组成的云端超算,轻松完成高负载计算工作!

OpenAI

📅 3 月 14 日 | GPT-4
3 月 14 日,OpenAI 在万众期待下发布了多模态大模型 GPT-4,用户一方面惊叹于其可控性、实时准确性及遵从指令层面性能的全方位提升,惊讶于其在人类标准化测试中取得的一系列好成绩,另一方面也在为其完全闭源以及对所有技术细节闭门不公感到失望。
📅 3 月 23 日 | ChatGPT Plugins
许多人说这是 AI 的「App Store 时刻」,这是对的,但也不只是这样,借助 Plugins,ChatGPT 延展了对话系统的边界,成为了一个 AI 计算平台和一个决策中枢站。而开发者仅需自然语言指令,即可接入 OpenAI 插件集,插件之间亦可相互串联,以 IFTTT 抑或其他形式一次性执行一系列动作,当前已有以下公司创建了 ChatGPT 插件:
  • Expedia - 旅行计划与预定平台;
  • FiscalNote - 提供实时法律,政治和监管数据和信息;
  • Instacart - 美国本地社区电商;
  • KAYAK - 在预算范围内挑选目的地,搜索航班、住宿和租车服务;
  • Klarna Shopping - 电商搜索比价;
  • Milo - AI 父母助手;
  • OpenTable - 餐厅推荐与预订;
  • Shop - 品牌电商;
  • Speak - AI 语言学习工具
  • Wolfram - 数学、计算与数据工具;
  • Zapier - 无代码集成平台,集成超过 5000 个应用程序。
就在 3 月 24 日,Hacker @rez0 在破解新的 ChatGPT API 时无意间发现了隐藏的 80 多个插件,其中还包括「Crypto Prices plugin」和阔别已久的「DAN plugin」!

Midjourney

📅 3 月 16 日 | Midjourney v5
还记得那是几年前 7 个月前,Midjourney v3 刚刚推出,我们的目光被视觉模型牢牢吸引的时期吗?不过后来,我们都被语言模型转移了注意力(joking)。目光转向 Midjourney v5,虽然官方宣称只是比 v4 有小幅改进,但其生成人物面部的真实性、图片细节的丰富度以及对提示词的理解力的进一步提升已然让人惊叹!
如果说,作为一个模型,Midjounery v5 让我们感受到了 AI 生成图像的质量进步之快,那作为一家公司,Midjourney 也实实在在地让我们感受到了一家充满热情与活力的初创公司的前行速度。
禅修时刻 · 人类群星闪耀时
👍2016 年,Jensen 亲手向 OpenAI 交付了第一台 DGX-1 AI 超算,回顾当时 Elon 的 Twitter,依旧令我热泪盈眶;2023 年的今天,顶尖的 AI 算力得以通过 DXG Cloud 走进每家公司,我相信,无论开源与闭源,AI 的平权与民主化永远在路上——也总有一些星星,会为全人类的未来而闪耀
更多被投新闻
格灵深瞳 | 曦智科技 | 来也科技 | 星亢原
东方空间 | 循环智能 | 诗云科技 | 赛舵智能
推荐阅读
继续阅读
阅读原文