通过图片诊断皮疹？谷歌的人工智能工具比人类医生更擅长

发布时间：2025-05-12 15:57:15 浏览量：97

编辑 | 白菜叶

谷歌医疗聊天机器人的升级版可以使用智能手机照片来诊断皮疹，并可以评估大量其他类型的医学图像，从而提高机器人查明疾病原因的能力。

早期版本的人工智能 (AI) 系统在诊断准确性和临床态度方面优于医生。升级后的系统在解读心电图和实验室结果 PDF 等图像方面也比人类医生表现更好。

该系统的最新版本名为「Articulate Medical Intelligence Explorer，AMIE」，目前仍处于纯实验阶段，已于 5 月 6 日发布在了 arXiv 预印本服务器。

论文链接：

加州斯坦福大学数字健康中心主任 Eleni Linos 评价道，整合图像和临床信息的系统「让我们更接近能够反映临床医生实际思维方式的人工智能助手。」

医疗保健模拟

为了测试 AMIE 的新功能，25 名扮演患者的演员与聊天机器人和一位人类初级保健医生进行了虚拟咨询。演员们模拟了 105 种医疗场景，涉及一系列症状和病史。他们还展示了相关的医学图像。

每次问诊后，AMIE 和人类医生都会给出诊断和治疗方案。一个由 18 位皮肤科、心脏病科和内科专家组成的团队通过分析问诊记录和问诊后报告，评估了聊天机器人和人类医生的表现。

他们发现，总体而言，AMIE 的诊断准确率高于人类医生。此外，其准确率受图像质量低等问题的影响较小。

「AI 医生」的「医学院」

升级版聊天机器人基于谷歌的大型语言模型（LLM）Gemini 2.0 Flash，该模型能够处理图像。研究人员对其进行了调整，使其适用于医疗用途，并添加了算法来提升 LLM 进行诊断对话和临床推理的能力。

为了验证最终系统确实优于未经修改的 Gemini 2.0 版本，研究人员命令该模型模拟医患对话，其中模型分别扮演患者、医生以及评估其他两人对话的第三方。

「这样，你就可以在进行诊断对话时赋予它正确的、理想的行为。」谷歌 DeepMind 的科学家、论文的作者之一 Ryutaro Tanno 说道。

Tanno表示，该方法与早期版本有所不同，早期版本需要使用专门的数据库重新训练模型，这是一个更为繁琐的过程。「这种方法成本更低，而且可能更容易获得。」

Linos 表示，涉及演员的场景也用于评估人类医生。但她指出，模拟互动无法捕捉现实世界护理的复杂性。「医生拥有经验、直觉以及对患者进行身体检查的能力，而这些元素在模拟脚本中很难复制。」

以色列特拉维夫大学数字健康专家 Dan Zeltzer 表示，研究结果「很有前景，但其实际应用效果如何，仍存在诸多不确定性。」他还指出，论文并未详细说明开发人员使用的代码和提示，这意味着其他研究人员无法复现该系统或在此基础上进行构建。

纽约市西奈山伊坎医学院的人工智能科学家 Xueyan Mei 表示，在现实世界中部署此类模型将是一项挑战。

「话虽如此，我们确实认为，用于诊断的大型语言模型将是未来的发展方向。」她补充道。

标签：谷歌医生人工智能聊天机器人皮疹