近日消息,月之暗面Kimi智能助手宣布推出新一代数学推理模型 k0-math。该模型在多项数学基准能力测试中表现出色,在中考、高考、考研以及包含入门竞赛题的 MATH 等四个数学基准测试中,成绩均超过了 OpenAI o1 系列的 o1-mini 和 o1-preview 模型。这一成果标志着 k0-math 在数学推理领域取得了显著进展。
特别是在MATH测试中,k0-math模型得分93.8,仅次于o1完全版的94.8分。尽管在竞赛级别的OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%,但公司计划持续迭代,以提升更难题目的解题能力。
k0-math模型采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升了解决数学难题的能力。
该模型在解题过程中会花费更多时间进行推理,包括思考和规划思路,并在必要时自行反思改进解题思路,以提升答题成功率。
尽管k0-math模型在解答大部分有难度的数学题方面表现出色,但当前版本还无法解答LaTeX格式难以描述的几何图形类问题,且对于过于简单的数学问题可能会过度思考,对高考难题和IMO题目也有一定概率做错。
文明上网,理性发言,共同做网络文明传播者