北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作

RoboMamba: Multimodal State Space Model for Efficient Robot Reasoning and Manipulation,通过将视觉编码器与Mamba状态空间语言模型创新性地结合,构建了具备视觉常识和机器人推理能力的多模态大模型。利用高效的微调策略,RoboMamba快速掌握了操纵位姿预测能力,实现了强大的推理和操作能力,显著提高了机器人领域的多模态理解与操作效率。

上一篇:

下一篇:

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信