AI日报｜ChatGPT更聪明了；为什么苹果不主动在AI领域炫技？

今日值得关注的人工智能新动态：

AI.com再易主，从ChatGPT转向了X.ai
ChatGPT更聪明了
在AI领域，为什么苹果不主动炫技?
最大的地理空间AI基础模型，由IBM和NASA推出
首个可再生能源大模型“HouYi”
当生成式 AI，学会了书籍封面设计
新型agent：用各种语言模拟世界
OpenFlamingo：训练大型自回归视觉语言模型的开源框架
DeepSpeed-Chat：简便、快速、经济实惠的RLHF训练
机器学习诊断疾病的最新进展：几十年来的系统调查、比较与挑战

AI.com再易主，

从ChatGPT转向了X.ai

此前有消息称，OpenAI 购买了 AI.com，以便将其重定向到 ChatGPT 网页界面，这引起了一阵骚动。但现在，昔日的支持者、推特爱好者和 X 爱好者埃隆-马斯克（Elon Musk）似乎已经从他们手中夺走了这个域名：AI.com 现在重定向到了这位亿万富翁的机器学习研究机构 X.ai。

ChatGPT更聪明了

为了使得人与机器的对话更顺畅、更富有成效，OpenAI 继续完善和增强着他们的明星 AI 聊天机器人 ChatGPT。

该公司于今天宣布了一项更新，称其聊天机器人变得更加人性化了。打开一个空白的 ChatGPT 窗口可能会让人望而生畏，因此现在用户会看到一些建议提示，从而激发更多创意。虚拟助理还会提出后续问题和回复，让讨论自然流畅。这些新功能有助于模拟人类对话的风格。

随着 OpenAI 不断完善 ChatGPT 的功能，这款虚拟助手也许有一天会让人感觉就像与有血有肉的人类聊天一样自然。但愿它不会开那些无聊的玩笑，也不会偶尔出现幻觉。

在AI领域，

为什么苹果不主动炫技?

在苹果公司的电话会议上，AI 根本没有被提及，直到一位分析师提出了这个话题，并评论说与许多科技同行不一样，苹果公司“不太谈论”他们的 AI 战略或投资。库克表示 AI “几乎是我们制造的每一个产品的组成部分”——但这并不意味着公司必须总是谈论它。”“我们倾向于在产品上市时就宣布它们，这就是我们的 ‘M.O.’”。

最大的地理空间AI基础模型，

由IBM和NASA推出

IBM 和开源 AI 平台 Hugging Face 宣布，IBM 的 watsonx.ai 地理空间基础模型——由 NASA 的卫星数据构建而成——将在 Hugging Face 上公开发布。这将是 Hugging Face 上最大的地理空间基础模型，也是首个与 NASA 合作构建的开源 AI 基础模型。

首个可再生能源大模型“HouYi”

可再生能源对于实现碳中和目标非常重要。该研究发布了首个开源的可再生能源学术论文（REAP）数据集，用于可再生能源的非商业大型语言模型（LLM）研究。REAP 数据集是通过检索 Web of Science 中 1168970 篇学术论文的标题和摘要收集的。在 REAP 数据集的基础上，通过对通用 LLM 进行微调，研究人员开发了首个可再生能源大模型“HouYi”。该模型展示了在可再生能源领域强大的学术论文段落生成能力，其生成可再生能源学术论文的能力与 ChatGPT 相当。

论文：

Patched Denoising Diffusion Models For High-Resolution Image Synthesis

当生成式 AI

学会了书籍封面设计

一个吸引人的书籍封面对于一本书的成功非常重要。为了获得更好的图像生成，该研究将生成对抗网络（GAN）应用于书籍封面领域，并采用不同的方法进行训练。

研究人员将 GAN 与知识图谱交错使用，从而获得任何给定标题的多种可能选项，然后将这些选项作为生成器的增强输入，然后使用在训练阶段获得的判别器来选择用新标题生成的最佳图像。与之前的尝试相比，这个方法在生成书籍封面方面表现得更好，而且与单独使用 GAN 相比，知识图谱为书籍作者或编辑提供了更好的选择。

论文：

Interleaving GANs with knowledge graphs to support design creativity for book covers

新型agent：

用各种语言模拟世界

代理（agent）要想能够真正做到与人类有效互动，就需要理解人类使用的各种语言。当前的代理可以学习执行来自任务奖励的简单语言指令，而加州大学伯克利分校的目标是建立能够利用各种语言的代理，这些语言可以传递知识、描述世界状态、提供互动反馈等。

Dynalang 是一种学习多模态世界模型的代理，与只使用语言来预测行动的传统代理不同，其通过使用过去的语言来预测未来的语言、视频和奖励，从而获得丰富的语言理解能力。除了从环境中的在线互动中学习外，它还可以在文本、视频或两者都没有动作或奖励的数据集上进行预训练。从在网格世界中使用语言提示到浏览逼真的家庭扫描，Dynalang 利用各种类型的语言来提高任务性能，包括环境描述、游戏规则和说明。

论文：

Learn to Model the world with Language

OpenFlamingo：

训练大型自回归视觉语言模型的开源框架

该研究介绍了 OpenFlamingo，这是一系列自回归视觉语言模型，参数范围从 3B 到 9B。据介绍，OpenFlamingo 是 DeepMind 的 Flamingo 模型的开源复制品。在七个视觉语言数据集上，OpenFlamingo 模型的平均性能是相应 Flamingo 模型的 80%-89%。该研究介绍了模型、训练数据、超参数和评估套件。

论文：

OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models

DeepSpeed-Chat：

简便、快速、经济实惠的RLHF训练

类似于 ChatGPT 的模型已经彻底改变了人工智能的各种应用，从摘要和编码到翻译，这些模型的性能可以媲美甚至超越人类。然而，对于这些功能强大的模型，尤其是在进行数十亿参数规模的训练时，目前还缺乏一个方便、高效、经济的端到端 RLHF（基于人类反馈的强化学习）训练管道。

据介绍，DeepSpeed-Chat 提供了三个关键功能：为类似 ChatGPT 的模型提供易于使用的训练和推理体验；DeepSpeed-RLHF 管道复制了 InstructGPT 的训练管道；DeepSpeed-RLHF 以统一的方式结合训练和推理的各种优化。另外，该系统具有无与伦比的效率和可扩展性，能够在短时间内以极低的成本训练具有数千亿个参数的模型。

论文：

DeepSpeed-Chat: Easy, Fast and Affordable RLHF Training of ChatGPT-like Models at All Scales

机器学习诊断疾病的最新进展：

几十年来的系统调查、比较与挑战

计算机辅助诊断（CAD）正在迅速发展，是一个充满活力的医学影像研究领域。由于医疗诊断系统中的错误可能会导致严重的医疗误导，近年来人们一直在努力改进计算机辅助诊断应用。

在计算机辅助诊断中使用机器学习至关重要。一个简单的等式可能会导致器官等项目的错误指示。因此，从实例中学习是模式识别的重要组成部分。生物医学领域的模式识别和机器学习有望提高疾病检测和诊断的精确度。它们还支持决策过程的客观性。机器学习提供了一种实用的方法，可用于创建优雅、自主的算法，以分析高维和多模态生物医学数据。

该综述文章探讨了用于检测疾病（包括肝炎、糖尿病、肝病、登革热和心脏病）的机器学习算法，概述了各种算法的优点和缺点，给出了用于疾病预测的机器学习算法的详细改进图。分析结果表明，这些算法提高了诊断各种疾病的准确性。

论文：

Recent advancement in Disease Diagnostic using machine learning: Systematic survey of decades, comparisons, and challenges

｜点击关注我 👇 记得标星｜

继续阅读

阅读原文