谷歌推出新模型MedGemma,基于Gemma 3技术专注于医学领域的文本及图像理解能力的提升
近两日,Google I/O 2025 热度正盛,公司 CEO Sundar Pichai 在活动首日的主题演讲中便分享了多项创新,例如 Gemini 2.5 的全系列升级,Agent Mode 上线 Chrome,编码智能体Jules 开启公测,Android XR 正式版亮相等等。而在一众令人眼花缭乱的重磅更新之中,还隐藏着一个面向于医疗领域的重磅 开源 成果——MedGemma 。
据官方介绍,MedGemma 系列模型基于 Gemma 3 构建, 包含谷歌在医学文本与图像理解方面最强大的开源模型,提供 2 个版本,分别为 40 亿参数的多模态版本,以及 270 亿参数的纯文本版本。
其中,MedGemma 4B 多模态版本采用了 SigLIP 图像编码器,该编码器经过专门预训练,使用的数据涵盖去标识化的医学图像,包括胸部 X 光、皮肤病图像、眼科图像和组织病理切片。其大语言模型组件则基于多种医学数据进行训练,涵盖放射影像、组织病理图像块、眼科与皮肤科图像以及医学文本。而 MedGemma 27B 则是专门在医学文本上进行了训练,并针对推理阶段的计算进行了优化。
针对医学文本理解与临床推理场景,MedGemma 能够完成病人问诊、分诊、临床决策支持以及医疗文本摘要等多项任务。为了方便读者更加直观地体验 MedGemma 的强大能力,HyperAI 超神经官网的「教程」板块现已上线了「一键部署 MedGemma-27b-text-it 医学推理大模型」, 快来体验 AI 医生问诊吧!
教程地址:https://go.hyper.ai/Urygb
我们还为新注册用户准备了惊喜福利,使用邀请码「MedGemma」注册 OpenBayes 平台,即可获得 4 小时 RTX A6000 免费使用时长(资源有效期为 1 个月), 数量有限,先到先得!
此外,官网的教程版块还上线了「vLLM+Open WebUI 部署 II-Medical-8B 医学推理大模型」, 该模型基于 Qwen3-8B,通过使用特定于医疗领域的推理数据集进行监督微调,并在硬推理数据集上训练 DAPO(一种可能的优化方法)来优化模型性能。
教程地址:https://go.hyper.ai/8fFFY
Demo 运行
- 进入 hyper.ai 首页后,选择「教程」页面,并选择「一键部署 MedGemma-27b-text-it 医学推理大模型」,点击「在线运行此教程」。







