人工智能在过去十年进步显著,尤其在自然语言处理和计算机视觉领域,但提升其认知和推理能力仍具挑战。近期论文提出MindStar方法,基于树搜索提升推理时间能力,在开源模型上达近似闭源大模型在数学问题上的推理能力,包括过程监督奖励模型等,实验结果表明该方法显著提升开源模型推理能力,减少模型规模和成本,开辟未来研究新途径。
人工智能在过去十年进步显著,尤其在自然语言处理和计算机视觉领域,但提升其认知和推理能力仍具挑战。近期论文提出MindStar方法,基于树搜索提升推理时间能力,在开源模型上达近似闭源大模型在数学问题上的推理能力,包括过程监督奖励模型等,实验结果表明该方法显著提升开源模型推理能力,减少模型规模和成本,开辟未来研究新途径。