商汤科技联合创始人王晓刚宣布商汤绝影率先实现原生多模态大模型的车端部署,车载端侧 8B 模型首包延迟 300 毫秒以内,推理速度 40 Tokens/秒,覆盖主流算力平台。商汤绝影打造的计算引擎“HyperPPL”支持主流车载硬件等,针对车载多人场景优化,多人并发时推理效率不降低。此前深圳首条自动驾驶公交线路采用其车辆与技术,明年上千 TOPS 算力车载芯片问世后,其车端部署方案有望在首包延迟和推理速度上进一步提升,为智能汽车发展助力。
商汤科技联合创始人王晓刚宣布商汤绝影率先实现原生多模态大模型的车端部署,车载端侧 8B 模型首包延迟 300 毫秒以内,推理速度 40 Tokens/秒,覆盖主流算力平台。商汤绝影打造的计算引擎“HyperPPL”支持主流车载硬件等,针对车载多人场景优化,多人并发时推理效率不降低。此前深圳首条自动驾驶公交线路采用其车辆与技术,明年上千 TOPS 算力车载芯片问世后,其车端部署方案有望在首包延迟和推理速度上进一步提升,为智能汽车发展助力。