等不来OpenAI的Q*，华为诺亚探索LLM推理的秘密武器MindStar先来了

人工智能在过去十年进步显著，尤其在自然语言处理和计算机视觉领域，但提升其认知和推理能力仍具挑战。近期论文提出MindStar方法，基于树搜索提升推理时间能力，在开源模型上达近似闭源大模型在数学问题上的推理能力，包括过程监督奖励模型等，实验结果表明该方法显著提升开源模型推理能力，减少模型规模和成本，开辟未来研究新途径。