DetToolChain 是一种由浙江大学联合上海人工智能实验室和牛津大学提出的新提示范式,旨在释放多模态大语言模型的检测能力。它无需训练,通过设计视觉提示和将检测任务拆解为小任务,并利用 chain-of-thought 逐步优化结果,来避免多模态大模型的幻觉,使其能精确检测。包含全面的视觉处理提示和检测推理提示,可与 GPT-4V、Gemini 等结合,支持多种检测任务,相关研究已被 ECCV 2024 收录。
DetToolChain 是一种由浙江大学联合上海人工智能实验室和牛津大学提出的新提示范式,旨在释放多模态大语言模型的检测能力。它无需训练,通过设计视觉提示和将检测任务拆解为小任务,并利用 chain-of-thought 逐步优化结果,来避免多模态大模型的幻觉,使其能精确检测。包含全面的视觉处理提示和检测推理提示,可与 GPT-4V、Gemini 等结合,支持多种检测任务,相关研究已被 ECCV 2024 收录。