五月最后一周的3个新话题，14个新产品与10篇最受关注的论文

关注 AI，我们动真格的。

从 ChatGPT 到 GPT-4，再到诸多国产大语言模型， AI 技术发展与商业模式都在飞速进化。自成立第一天起，真格基金就是新技术与创业精神的坚定支持者。在过去的几年里，我们先后天使投资了格灵深瞳、云天励飞、地平线、来也、森亿等等许多 AI 技术相关的创业公司。

今年 3 月，我们设计并整理出“Z-Bench”，一个为非技术人员定性测试大模型对话产品的测试集，给大语言模型产品进行测评。并陆续发布了 7 期关于全球 AI 领域新产品和新研究的 Newsletter，也翻译并分享了若干篇 AI 领域的重要文章，旨在与大家一起见证 AI 领域的更新迭代，希望能够共同探讨，彼此启发。

本期内容是我们整理发布的第 9 期全球 AI 动向 Newsletter，包括了近期的 3 个新话题，14 个新产品与 10 篇最受关注的论文。如果你有收获和想法，欢迎在评论区与我们交流。

五月末，AI 的竞争依旧激烈：Microsoft 在 Build 2023 发布了 50 多项新产品，一切都与 AI 相关；Google 除了将图像生成功能整合进了商业营销工具与 Bard，还正式开始测试 AI 版搜索引擎；Meta 开源了基于圣经训练的，可以识别超过 4,000 种口语，对 1,100 多种语言进行语音文字互换的 MMS 模型；NVIDIA 突破万亿美元市值，带领其达成此成就的华人 CEO 黄仁勋在 COMPUTEX 大会上沉稳地抛出了一系列产品，其中更有搭载了 256 颗 GH200 Grace Hopper 超级芯片的新型 DGX GH200 超算......巨头们的竞争下文中我们不再赘述，

本期，我们将为大家带来以下内容：

- 3 个新话题 - 媒体该如何更有价值地进行 AI 报道？不同国家在如何制定 AI 相关政策？关于 AI 安全，有哪些重要的观点？

- 14 个新产品 - 包括 4 个有用的和 3 个好玩的新产品，5 个初创公司的新产品以及 2 家大公司的新动态；

- 10 篇新论文 - 上周热度最高的 10 篇新论文，与上次一样，每篇我们都提供了论文原文链接与最具代表性的 Twitter Thread。

Enjoy！

AI · 话题

How the media is covering ChatGPT｜拒绝炒作，理性报道

在过去半年多的时间里，媒体对 AI 的报道呈爆发式增长趋势，不少新闻记者都在绞尽脑汁以求在自己的报道中体现出「细微差别」，但有多少人在回归新闻的本真，「引导公众关注并思考真正重要问题」？

Jem Bartholomew 和 Dhrumil Mehta 采访了大量的记者与学者并对 2022 年 11 月至 2023 年 5 月中旬关于 AI 的报道进行了统计分析，为我们呈现了一份相对客观完整的报告。

其中的一位受访者 Jenna Burrell 指出，过度讨论 AI 的「技术未解之谜」事实上会分散人们对诸如「AI 对市场结构的影响」之类的问题的注意力——在关注 AI 能力与感知的同时，我们也应关注 AI 如何进一步分配财富和权力。

与此同时，两位作者也为我们总结了一个新技术新闻报道的炒作周期框架：

- 首先，新技术会带来各类承诺与期待；

- 然后，媒体报道会分化为两个极端，一边可能是「行业终结者与民主末日」，另一边则是「技术带来乌托邦」；

- 最后，报道开始更细致地讨论技术的实际影响 —— 这是周期开始冷却的时候。

🔗 https://www.cjr.org/tow_center/media-coverage-chatgpt.php

Statement on AI Risk｜AI 风险声明

硅谷又开启了新一轮 AI 风险声明信的签署潮，其中首当其冲的便是这封由 Geoffrey Hinton、Bill Gates、Sam Altman（OpenAI CEO）、Demis Hassabis（Google DeepMind CEO）、Dario Amodei（Anthropic CEO）等著名企业家与学者共同签署的这封《AI 风险声明（Statement on AI Risk）》，而事实上，正文只有一句话：

全世界都应优先考虑人工智能带来的人类灭绝风险问题，这与大流行病和核战争等社会性风险问题一样重要。

🔗 https://www.cjr.org/tow_center/media-coverage-chatgpt.php

过去几个月里，学界与业界，AI 与非 AI 领域的许多关键组织与人物都曾就 AI 安全问题发表过自己的看法，在这里，梳理一些有价值的观点与大家分享：

1. Is Avoiding Extinction from AI Really an Urgent Priority?｜避免 AI 灭绝人类真的是当务之急吗？by fast.ai

🔗 https://www.fast.ai/posts/2023-05-31-extinction.html

2. AI Is Not an Arms Race｜AI 不是一场军备赛 by TIME

🔗 https://time.com/6283609/artificial-intelligence-race-existential-threat

3. If we’re going to label AI an ‘extinction risk’, we need to clarify how it could happen｜我们即便要将 AI 标记为「灭绝风险」，也需要弄清它为什么会发生 by The Conversation

🔗 https://theconversation.com/if-were-going-to-label-ai-an-extinction-risk-we-need-to-clarify-how-it-could-happen-206738

4. You Can Have the Blue Pill or the Red Pill, and We’re Out of Blue Pills

｜我们将生活在非人类智能的幻觉中 by Yuval Noah Harari

🔗 https://www.nytimes.com/2023/03/24/opinion/yuval-harari-ai-chatgpt.html

5. Yuval Noah Harari argues that AI has hacked the operating system of human civilisation｜我们仍然可以规范新的 AI 工具，但必须迅速行动 by Yuval Noah Harari

🔗 https://www.economist.com/by-invitation/2023/04/28/yuval-noah-harari-argues-that-ai-has-hacked-the-operating-system-of-human-civilisation

6. AI 'godfather' Geoffrey Hinton warns of dangers as he quits Google｜AI 教父离职前的警告 by Geoffrey Hinton

🔗 https://www.bbc.com/news/world-us-canada-65452940

7. How Rogue AIs may Arise｜流氓 AI 是如何出现的 by Yoshua Bengio

🔗 https://yoshuabengio.org/2023/05/22/how-rogue-ais-may-arise/

8. Governance of superintelligence｜超级智能的治理 by OpenAI

🔗 https://openai.com/blog/governance-of-superintelligence

Copyright Doesn’t Apply To AI Training｜AI 训练数据版权应该受保护吗？

日本政府重申不会对 AI 训练中使用的数据实施版权保护，换句话说，AI 训练可以使用任何数据，无论是出于非营利或商业目的，是否有复制以外的行为，也无论是否从非法网站或其他方式获得的内容。

无独有偶，以色列司法部早在今年 1 月就发表了相似的意见。

但并不是没有相反的声音，目前看，在制定 AI 规范法规方面，欧盟的步伐无疑是最快的，而根据 AI Act 初稿，部署 Gen AI 工具的公司将需要披露用于开发系统（训练模型）的所有受版权保护的数据 —— 如果是这样，OpenAI 将不得不退出欧洲。

日本 ‍‍‍

🔗 https://technomancers.ai/japan-goes-all-in-copyright-doesnt-apply-to-ai-training/

以色列‍‍‍

🔗 https://www.project-disco.org/intellectual-property/011823-israel-ministry-of-justice-issues-opinion-supporting-the-use-of-copyrighted-works-for-machine-learning/

欧盟 ‍‍

🔗 https://www.europarl.europa.eu/news/en/press-room/20230505IPR84904/ai-act-a-step-closer-to-the-first-rules-on-artificial-intelligence

AI · 产品

有用的｜ For Money

• AirChat

「口袋里的晚宴（A dinner party in your pocket）。」这是 Naval 对 AirChat 的定义。

抛开文艺的面纱，AirChat 是 Naval 开发的语音社交产品，像是一个异步版 Clubhouse。无需额外翻译，即可用语音与平台上其他说着不同语言的用户进行交流，加上审美非常在线的产品界面，还有 Naval 本人的不定时巡游留言，还没排上号的我真的很像尽快试一试！

提供邮箱和 Twitter 账号（还需关注账号 @getairchat）即可加入 Waitlist，不过目前仅支持 iOS 设备哦！

🔗 https://www.getairchat.com/

• Spawning

艺术家作品版权保护工具 —— 主要针对图像，也有部分声音、视频以及代码，具体来说，就是在各类网站之上加一个「同意层」，需要经过创作者的同意才可使用网站数据进行 AI 训练。

截至目前，Spawning 目前已经帮助 14 亿张图像退出模型训练集。

🔗 https://spawning.ai/

• ChatOCR

一个有意思的 PDF 处理 ChatGPT Plugin 插件，除了读取常见的文字、图表以及图片等信息，它甚至可以抓取手写文字与扫描内容！

🔗 https://www.staf.ai/

• Poolside

GitHub 前 CTO Jason Warner 将其创办的新公司定位为「未来系统的系统」。根据当前的新闻报道，更像是真正可以投入生产的无代码软件搭建平台。‍

🔗 https://medium.com/redpoint-ventures/fresh-ink-hello-poolside-384923ff3ad4

🔗 https://www.newcomer.co/p/former-github-cto-jason-warner-raises

好玩的｜ For Fun

• Paragraphica

根据定位自动收集数据并生成关键词补全 prompt 以生成环境「照片」的相机，由手工达人 Bjørn Karmann 制作。

下面的几幅示例图中，Bjørn 看似拿了一台「相机」，但事实上，这台相机只是一个定位设备，没有任何拍摄功能，三个物理旋钮则是为了调节参数而存在，分别用于控制数据收集的地理半径、图像噪声与遵循 prompt 的程度。

相机所收集的数据与工作原理如下：

基于以上工作原理，想必大家应该发现了：这是在手机上就可以实现的功能呀！没错，打开第二个链接即可体验。

🔗 https://bjoernkarmann.dk/project/paragraphica

🔗 https://paragraphica.bjoernkarmann.dk/

• KURUKURU

由两位华人女孩创办的漫画生成平台，目前已被 YC 投资。

CEO @FengjiaoPeng 毕业于香港大学与 MIT，此前是一位一边在 Adobe 与 Vimeo 担任工程师，一边进行网络漫画创作的斜杠青年，出于对漫画的热爱，与同样是理工科出身的 @YipingLyu 创办了 KURUKURU，侧重连续故事情节的生成以及工作流的易用性 —— 期待更多的进展！

🔗 https://www.kurukuru.xyz/

• GirlfriendGPT

虽然训练一个 Character 的技术难度愈来愈低，但依旧不够小白——试试用 GPT-4 构建一个性格可爱的女朋友吧！

🔗 https://gptgirlfriend.online/

初创企业｜Startups

• lnkyMM by OctoML

第一个开源的可商用多模态模型，基于 MPT-7 Instruct 与 BLIP 搭建。

🔗 https://mm-frontend-ees4nzlyjlh8.octoai.cloud

• Spellbook

用 LLM 帮忙起草合同，目前已有超 600 家企业客户。但请注意，AI 帮忙起草法律文件也许可以节省不少时间，但千万不要因为有了工具而偷懒。最近，同样是在法律行业，一位美国律师用 AI 协助处理案件时显然遇到了大问题 —— 他在庭审时提供了 6 个由 ChatGPT 生成的虚假案件。

🔗 https://www.spellbook.legal/

• Assistant by Betterlegal

在几秒钟内将复杂的法律术语转换为通俗易懂的语言，相对于生成合同、辩词、判例等，也许这是对大众更实用，风险也更小的场景～

🔗 https://betterlegal.com/assistant

• Botatouille by Buzzfeed

据称是全球第一款 AI 烹饪小助手，基于 ChatGPT API 搭建，支持 10,000+ 菜谱的问答与制作指导，内置于 Buzzfeed 的 Tastey app，目前仅支持 iOS 端。

🔗 https://apps.apple.com/us/app/tasty-recipes-cooking-videos/id1217456898

• CapeChat by Cape Privacy

在使用 ChatGPT 的同时保持敏感数据的安全。我们已经见到了许多用 ChatGPT 这样的 AI Chatbot 处理财务数据、日程以及其他个人信息的案例，但这么做是否能够保证数据安全？说实话，我个人一直保持怀疑态度，而 CapeChat 就是一个把数据安全放在第一位的 Chatbot，这真的是一个很棒的切入点！

🔗 https://chat.capeprivacy.com/chat/1685655970623

头部公司｜ Leading Companies

• Photoshop Beta by Adobe

Adobe 终于改变了 33 年的稳健作风，大手笔地将 Firefly 整合进了 Photoshop，说实话，这是我最近见到的最有趣的 AI 产品之一，AI 图像生成功能终于被丝滑地融入了工作流。

先说优点，无论是抠图、补全画面、局部擦除还是扩展画面内容，Beta 都能为创作者节约大量的制作时间和精力，在已有图片的基础上快速修改至 60 分；

再说缺点，与之前的感受相同，Firefly 生成图像的真实性并不高，在某些图片中非常容易出现违和感；此外，Beta 也不擅长从零制作图片，且无法精确控制组件/角色的位置、面部细节和动作等等重要信息。—— 期待 Adobe 的进步了！

🔗 https://www.adobe.com/products/photoshop/generative-fill.html

一些有趣的例子

🔗 https://twitter.com/nathanlands/status/1663878082007281668?s=46&t=O5v_r8PPMabZ2rXHdeCbcA

• Tako by TikTok

5 月 25 日，TikTok 宣布他们正在菲律宾部分测试用于更精准寻找短视频的聊天机器人 Tako，目前技术由第三方提供。

🔗 https://twitter.com/TikTokComms/status/1661718779024531456

AI · 技术

QLoRA

一种高效的微调方法，通过减少内存使用量，在单个 48GB GPU 上微调 65B 参数模型，同时保持完整的 16 位微调性能。

Paper

🔗 https://arxiv.org/abs/2305.14314

Twitter

🔗 https://twitter.com/Tim_Dettmers/status/1661379354507476994

LIMA

一个新的 65B 参数的 LLaMa 模型，通过 1000 个精心设计的提示和回应进行微调；它不使用 RLHF，对于训练数据中没有的任务具有良好的泛化能力，并且在 43% 的情况下生成的回应与 GPT-4 相当或更受欢迎，甚至比 Bard 更高。

Paper ‍‍

🔗 https://arxiv.org/abs/2305.11206

Twitter

🔗 https://twitter.com/violet_zct/status/1660789120069926912

Voyager

在 Minecraft 中使用 LLM 技术的具有体验型终身学习功能的代理人，可以不需要人类干预就能持续探索世界、获得技能并进行新的发现。

Paper

🔗 https://arxiv.org/abs/2305.16291

Twitter

🔗 https://twitter.com/DrJimFan/status/1662115266933972993

Gorilla

一种基于 LLaMA 的微调模型，超越了 GPT-4 在编写 API 调用方面的性能。这种能力可以帮助识别正确的 API，提高 LLM 与外部工具进行交互完成特定任务的能力。

Paper

🔗 https://arxiv.org/abs/2305.15334

Twitter

🔗 https://twitter.com/omarsar0/status/1661540207206846464

The False Promise of Imitatiting Proprietary LLMs

本文对以更强模型的输出进行微调的模型进行了批判性分析；认为模型的模仿是一个错误的前提，改进开源模型的更有效方法是开发更好的基础模型。

Paper

🔗
https://arxiv.org/abs/2305.15717

Twitter

🔗 https://twitter.com/arankomatsuzaki/status/1661908342829187072

Sophia

本文提出了一种简单可扩展的二阶优化器，每步平均时间和内存开销几乎可以忽略不计；在语言建模方面，Sophia 在步数、计算量和实际时间上比 Adam 快 2 倍。

Paper ‍‍

🔗 https://arxiv.org/abs/2305.14342

Twitter

🔗 https://twitter.com/tengyuma/status/1661412995430219786

The Larger They Are, the Harder They Fail

文章表明，当默认函数名称被交换时，LLM 便无法生成正确的 Python 代码，而且模型越大，越倾向于生成错误的结果 —— 这与此前我们观察到的「模型越大，能力越强」的规律相反。

Paper

🔗 https://arxiv.org/abs/2305.15507

Twitter

🔗 https://twitter.com/AVMiceliBarone/status/1662150656327663617

Model Evaluation for Extreme Risks

讨论了模型评估在解决极端风险和在模型训练、部署和安全方面做出负责任决策中的重要性。

文中还详细讨论了十个主要风险：网络攻击、欺骗、说服与操纵、政治策略、武器获取、长期规划、AI 开发、情景意识以及自我传播。

Paper ‍‍

🔗 https://arxiv.org/abs/2305.15324

Twitter ‍

🔗 https://twitter.com/soundboy/status/1661728733156503555

LLM Research Directions

讨论了一系列针对希望在 LLM 领域进行研究的博士研究生的研究方向。

Paper ‍

🔗 https://arxiv.org/abs/2305.12544

Twitter

🔗 https://twitter.com/omarsar0/status/1661405738059571201

Reinventing RNNs for the Transformer Era

提出了一种将 Transformer 的高效可并行训练与 RNN 的高效推理相结合的方法；结果显示该方法在性能上与大小相似的 Transformer 相当。

Paper ‍

🔗
https://arxiv.org/abs/2305.13048

Twitter

🔗 https://twitter.com/_akhaliq/status/1660816265454419969

禅修时刻 · Short Courses by 吴恩达

要说这两天什么课最火，那必然是吴老师的四节生成式 AI 短课程，从 Prompt Engineering、API 调用、LangChain 的使用到 Diffusion 模型的原理，一应俱全！

🔗 https://www.deeplearning.ai/short-courses/

更多被投新闻

依图科技 | Momenta | Nuro | 云天励飞

禾赛科技 | 晶泰科技 | 地平线 | 燧原科技

亿航智能 | 思谋科技 | 青藤云安全 | 爱笔智能

沐曦 | 驭势科技 | 芯耀辉 | 森亿智能 | AutoX

格灵深瞳 | 曦智科技 | 来也科技 | 星亢原

黑湖智造 | 领创集团 | 非夕机器人

芯行纪 | 灵明光子 | 优艾智合 | 炬星科技

东方空间 | 循环智能 | 诗云科技 | 赛舵智能

潞晨科技 | 芯控智能 | 氦星光联 | 悠跑科技

推荐阅读

继续阅读

阅读原文

五月最后一周的3个新话题，14个新产品与10篇最受关注的论文｜真 AI

How the media is covering ChatGPT｜拒绝炒作，理性报道

Statement on AI Risk｜AI 风险声明

Copyright Doesn’t Apply To AI Training｜AI 训练数据版权应该受保护吗？

LIMA

Voyager

Gorilla

The False Promise of Imitatiting Proprietary LLMs

Sophia

The Larger They Are, the Harder They Fail

Model Evaluation for Extreme Risks

LLM Research Directions

Reinventing RNNs for the Transformer Era