找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 37|回复: 1

[科技新闻] 字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5

[复制链接]
  • 打卡等级:炉火纯青
  • 打卡总天数:82
发表于 2025-12-24 12:43 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×

[size=1pc]12 月 24 日消息,字节跳动 Seed 团队今日宣布推出新一代形式化数学推理专用模型 Seed Prover 1.5,通过大规模的 Agentic RL 训练,其推理能力和推理效率宣称取得显著进步。

[size=1pc]相比上一代模型,Seed Prover 1.5 在 16.5 小时内,针对 IMO 2025 的前 5 道题目生成了完整可编译验证的 Lean 证明代码,换算成绩为 35/42,达到此前 IMO 评分标准的金牌分数线。

[size=1pc]针对北美本科级别数学竞赛 Putnam,Seed Prover 1.5 用时 9 小时,对 12 道 Putnam 2025 赛题中的 11 道生成了可编译验证的 Lean 代码。

[size=1pc]更系统的评估中,Seed Prover 1.5 在完整的 Putnam 历史评估集上解决了 88% 的问题,在代表硕士数学难度的 Fate-H 和代表博士生数学难度的 Fate-X 评估集上,分别解决了 80% 和 33% 的问题,刷新了形式化数学推理模型在这几个评测集上的 SOTA 表现。


  • 打卡等级:渐入佳境
  • 打卡总天数:31
发表于 2025-12-24 15:13 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-12-24 19:40 , Processed in 0.172024 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表