近日,上海交通大学与上海人工智能实验室联合团队发布 3D 医学图像分割大模型 SAT,可基于文本提示对人体 497 种器官/病灶进行通用分割,数据和代码、模型均已开源。该研究旨在解决传统医学图像分割模型应用范围有限的问题,构建连接语言和定位能力的医学分割工具。团队做出三点主要贡献,包括探索将人体解剖学知识注入文本编码器、构建多模态医疗知识图谱和最大规模的 3D 医学图像分割数据集 SAT-DS、训练两款不同大小的模型并从多角度验证价值。研究从数据构建(含多模态知识图谱和 SAT-DS)、模型架构(含知识注入和基于文本提示的通用分割)、模型测评(与 nnU-Nets 和 MedSAM 的对比实验、消融实验)、与大语言模型的结合等方面展开,结果表明 SAT 具有高效灵活、可作为基础模型、实现准确鲁棒分割、能作大语言模型代理工具等价值,同时揭示了模型尺寸和领域知识对分割的影响。