找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 23|回复: 1

[科学观察] AI推理模型提升快到头了?研究:最快一年内将撞上天花板

[复制链接]
  • 打卡等级:自成一派
  • 打卡总天数:129
发表于 2025-5-13 13:39 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
5月13日消息,非营利性人工智能研究机构Epoch AI的最新分析显示,推理类AI模型的性能大幅提升可能已接近极限。报告指出,最快一年内,这类模型的进展速度就可能放缓。

近几个月来,OpenAI的o3等推理模型在AI基准测试中表现亮眼,尤其在数学和编程能力评估方面大幅领先。这类模型通过增加算力投入提升性能,但代价是任务耗时远超传统模型。

推理模型先是用海量数据训练基础模型,再运用“强化学习”技术对复杂问题的解决方案进行反馈式优化。

Epoch AI表示,OpenAI等前沿实验室在推理模型的强化学习阶段尚未投放海量算力。但这一现状正在改变。OpenAI透露,训练o3模型时的算力投入约比前代模型o1多十倍,且大部分算力都流向强化学习环节。公司研究员丹·罗伯茨(Dan Roberts)近日更透露,未来将把更多算力优先用于强化学习,甚至要超过预训练阶段的算力投入。

不过Epoch AI指出,强化学习的算力投入终有其上限。机构分析师Josh You在报告中解释说,训练传统人工智能模型带来的性能提升每年大约翻四倍,而强化学习带来的性能提升则每3到5个月增长十倍。他预计,到2026年,推理训练的进展速度“可能会与整体人工智能前沿水平趋于一致”。

Epoch AI的结论基于多项假设,并部分引用了人工智能公司高管的公开言论。但报告也强调,除算力外,高昂的研发成本等因素也可能阻碍推理模型的扩展。“如果研发持续需要高昂开支,推理模型的扩展幅度或将低于预期,”Josh You写道。“算力快速增长或是推动推理模型进步的重要因素,因此值得持续关注。”

对于已在推理模型研发上投入巨资的人工智能行业而言,任何显示其性能提升可能触及天花板的迹象都会引发忧虑。研究已表明,这类运行成本极高的模型还存在严重缺陷,比如比某些传统模型更易出现“幻觉”问题。(辰辰)
  • 打卡等级:自成一派
  • 打卡总天数:127
发表于 2025-5-13 14:33 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-5-20 05:37 , Processed in 0.118307 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表