提升GPT-4V、Gemini检测任务性能,你需要这种提示范式

DetToolChain 是一种由浙江大学联合上海人工智能实验室和牛津大学提出的新提示范式,旨在释放多模态大语言模型的检测能力。它无需训练,通过设计视觉提示和将检测任务拆解为小任务,并利用 chain-of-thought 逐步优化结果,来避免多模态大模型的幻觉,使其能精确检测。包含全面的视觉处理提示和检测推理提示,可与 GPT-4V、Gemini 等结合,支持多种检测任务,相关研究已被 ECCV 2024 收录。

Previous:

Next:

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信