商汤绝影行业首发原生多模态大模型车端部署:80 亿参数、每秒 40 Tokens

商汤科技联合创始人王晓刚宣布商汤绝影率先实现原生多模态大模型的车端部署,车载端侧 8B 模型首包延迟 300 毫秒以内,推理速度 40 Tokens/秒,覆盖主流算力平台。商汤绝影打造的计算引擎“HyperPPL”支持主流车载硬件等,针对车载多人场景优化,多人并发时推理效率不降低。此前深圳首条自动驾驶公交线路采用其车辆与技术,明年上千 TOPS 算力车载芯片问世后,其车端部署方案有望在首包延迟和推理速度上进一步提升,为智能汽车发展助力。

上一篇:

下一篇:

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信