ScienceAI设为星标
第一时间掌握
新鲜的 AI for Science 资讯

编辑 | 绿萝
现在,谷歌新的医疗大模型又来了,又有了新的基准。
谷歌 Deepmind 高级研究科学家、共同作者 Shekoofeh Azizi 在推特发文:「Med-PaLM M 是 [通才生物医疗人工智能] 的首次演示!
相关研究成果以「Towards Generalist Biomedical AI」为题,于 2023 年 7 月 26 日发布在 arXiv 预印平台上。
论文链接:https://arxiv.org/abs/2307.14334
Med-PaLM M 是一个大型多模态生成模型,可以灵活地编码和解释生物医学数据。它可以处理各种类型的医学数据,包括临床语言、医学图像和基因组学,在各种任务上表现良好。
Med-PaLM M 是通过微调和调整 PaLM-E(Google AI 的一种语言模型来构建的,该模型使用了一个专门设计的开源基准,称为 MultiMedBench。
图示:Med-PaLM M 概述。(来源:论文)
MultiMedBench 包含 7 种生物医学数据类型和 14 种不同的任务,例如医学问答、生成放射学报告和识别基因组变异。该基准样本超过 100 万个,鼓励通用生物医学人工智能系统的开发。
图示:MultiMedBench 数据集。(来源:论文)
Med-PaLM M 在 MultiMedBench 上的所有任务中都表现出色,通常大幅优于专业模型,甚至超过 PaLM-E,证明了将模型适应生物医学数据的重要性。
构建大规模生物医学人工智能背后的关键思想是使用语言作为不同任务的通用框架。这使得人工智能能够结合各种来源的知识,并更有效地跨任务转移技能。
令人兴奋的是,初步证据表明 Med-PaLM M 可以推广到新的医疗任务和概念,并在无需特定训练的情况下执行多模态推理。它可以仅使用基于语言的指令和提示来准确识别和描述图像中的医疗状况,即使它以前从未见过此类情况。
例如,研究人员发现 Med-PaLM M 可以准确识别和描述胸部 X 光片中的结核病,仅通过基于语言的说明和提示,尽管之前从未在图像中遇到过该疾病的表现。
在对 246 份回顾性胸部 X 光检查进行的并排排名中,临床医生在多达 40.50% 的病例中表达了对 Med-PaLM M 报告的成对偏好,而不是放射科医生生成的报告,这表明了潜在的临床实用性。
图示:Med-PaLM M 紧急零样本多模态医学推理的证据。(来源:论文)
最后,为了评估 Med-PaLM M 在临床环境中的实际应用,放射科医生评估了人工智能生成的不同规模的报告。研究发现,人工智能的错误率与之前研究中放射科医生的错误率相当,这表明其潜在的临床用途。
图示:独立的人工评估。(来源:论文)
谷歌对医疗保健领域人工智能的坚定承诺
谷歌的 Med-PaLM 2 是一款回答医疗问题的医疗聊天机器人,自推出以来一直受到粉丝的喜爱。
Med-PaLM 2 基于 Google 的语言模型 PaLM 2 构建,并使用针对医学领域量身定制的 LLM。AI 在医疗问答数据集上表现出了令人印象深刻的性能,在美国医疗执照考试 (USMLE) 式问题以及印度 AIIMS 和 NEET 医学考试问题上实现了高精度。
Google 承认个性化医疗护理的复杂性,并认识到 Med-PaLM 2 的结果可能无法推广到所有医疗问答环境和受众。人工智能接受医疗问答数据集的训练,但排除患者的个人数据以遵守道德规范。
虽然访问患者的个人数据可以提高 Med-PaLM 2 的效率,但隐私问题可能会阻止许多患者共享此类信息。谷歌确保测试 Med-PaLM 2 的客户将在加密设置中保留对其数据的控制权,科技公司无法访问,并且人工智能程序不会摄取任何数据。
共同作者 Vivek Natarajan 表示:「这种可以对生物医学领域进行编码的通用生物医学人工智能的可能性是无限的,其应用涵盖科学生物医学发现到医疗服务。工智能在医学和生物领域的未来非常令人兴奋!」
研究人员表示:「虽然需要做大量的工作来在现实世界的用例中验证这些模型,但我们的结果代表了通用生物医学人工智能系统发展的一个里程碑。」
参考内容:
https://twitter.com/vivnat/status/1684404882844024832
https://twitter.com/AziziShekoofeh/status/1684417895215042560
https://analyticsindiamag.com/google-unveils-multimodal-generative-ai-model-med-palm-m-for-healthcare/
人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展
欢迎注标星,并点击右下角点赞在看
点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。
继续阅读
阅读原文