夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 212|回复: 20

[科技新闻] 终于,GPT-5发布了,也被喷惨了

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2025-8-5 17:19 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×


[color=var(--weui-FG-HALF)]
1.webp

划重点:
  • [color=var(--weui-FG-HALF)]期盼2年的GPT-5终于如期而至,超过那些全球最聪明的大模型,达到博士水平。
  • [color=var(--weui-FG-HALF)]GPT-5目前已面向普通用户提供免费、plus和Pro三种模式;同时在API平台上,推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择。
  • [color=var(--weui-FG-HALF)]OpenAI直播期间出现重大失误,播出的性能图表被网友怒喷。
    作者 常远
    编辑 重点君
    GPT-5,终于在深夜出炉。
    以为很震惊,以为很惊艳???确实有。
    但先来看一张图:
    2.webp

    OpenAI到底是如何做到在全球直播的场合展示Benchmark,竟然能把52.8显示得比69.1都高,甚至这个69.1能跟30.8平齐的???
    其它的不谈,单就这一点,开场直接号称“博士水平”的AI,就这么水灵灵地“按需缩放”坐标系,也是引得网友怒喷不已。
    3.webp

    甚至Altman都赶忙出来转移话题,称技术博客上是正确的……
    4.webp

    确实,技术博客确实是有所更正。
    5.webp

    但如此失误,着实不应该,毕竟大家都等了2年啊!

       博士水平的AI,来了
    不过有一说一,除了这个被大众诟病的致命失误之外,GPT-5在现场的表现还算是可圈可点。
    在技术博客中,OpenAI开场直接一句:“迄今为止,这是我们最智能、最快速、最实用的模型,内置的思考能力让每个人都能拥有专家级智能。”
    这次发布的GPT-5拥有四个版本:
    GPT-5:在不同领域中进行Coding和执行任务的标准模式;
    GPT-5 mini:轻量级版本,适用于对明确界定的任务和场景;
    GPT-5 nano:强调运行速度和性价比;
    GPT-5 Chat:ChatGPT中使用的版本。
    GPT-5目前已面向普通用户提供免费、plus和Pro三种模式。
    同时在API平台上,推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择。
    不仅如此,承接昨天时隔6年的开源,OpenAI表示这次GPT-5面向所有人,免费!并且是博士水平的那种。
    我们先来看下Benchmark。
    最让人吸睛的,还是GPT-5在AIME 2025的表现,直接拿下满分的成绩。
    6.webp

    其次就是编程能力,相较于o3和4o,GPT-5在思考模式加持之下,达到了74.9%的水平。
    7.webp

    除此之外,这个模型在多种多模态评测中表现出色,覆盖了图像、视频、空间理解和科学推理等方面。
    更强的多模态能力,意味着ChatGPT在处理图片和其他非文字信息时更聪明了——比如看懂图表、总结一张演示照片的内容,或者回答关于图示的问题。
    8.webp

    而且比较罕见的是,第三方的大模型竞技场(Imarena.ai)也是及时跟进,直接发声表明:“全方面第一”
    具体而言,竞技场涉及的内容包括:文本、Web开发、视觉、编程、数学、创造力、长查询等。
    9.webp

    由此可见,GPT-5从目前评测标准来看,确实是AI大模型的卫冕之王。

       再看效果
    成绩是一方面,但实际效果才是硬道理。
    深谙此理的Sam Altman在自己的X账号上也是立马跟进,发布了由GPT-5生成的效果:
    10.webp

    并且Altman还表示,有GPT-5权限的用户,只需发送“use beatbot to make a sick beat to celebrate gpt-5”即可体验。
    不得不说,营销这块,Altman还是非常手拿把掐的。
    不过在直播的现场演示过程中,GPT-5还是有不少惊艳的表现在身上的。
    例如让GPT-5生成一个学语法的APP,效果是这样的:
    11.webp

    不要以为是简单的网站,除了可以完成市面上AI的交互之外,它在里面还可以内嵌一个小游戏(点击“Mouse&Cheese”):
    12.webp

    并且若是想改变APP里面的内容,只要一句话,瞬间(现场实测)就可以改变布局:
    13.webp

    对于更加庞大且复杂的项目,例如现场OpenAI展示了用GPT-5编写的代码:
    14.webp

    在运行之后,便得到了一个3D效果的“世界”:
    15.webp

    总而言之,从现场效果来看,GPT-5也是担得起“最聪明、最强编程”的大模型。

       “观众”们买单吗?
    从目前X上“观众”的反馈来看,讨论最激烈的就是前面我们提到的图表bug。
    甚至有网友做了一张简单粗暴的Excel表格来讽刺这次的失误:
    16.webp

    不过另一方面,老东家微软CEO火速出面站台,并配有一个“爱心”图片以表支持:
    17.webp

    再如开发者们常用的VS Code,官方也是Day 0无缝衔接GPT-5:
    18.webp

    不过对于普罗大众来说,反馈声音最大的莫过于:“说好的免费,我的ChatGPT咋没有呢?”
    总而言之,用户到底买不买单,实测效果到底有没有那么神,需要让子弹再飞一会了。
    参考链接:
    1、https://openai.com/index/introducing-gpt-5/
    2、https://x.com/EgeErdil2/status/1953505551570415718
    • 打卡等级:功行圆满
    • 打卡总天数:834
     楼主| 发表于 2025-8-7 09:55 | 显示全部楼层
    啥巴子叫GTP5?
    回复 支持 反对

    使用道具 举报

    • 打卡等级:功行圆满
    • 打卡总天数:833
    发表于 2025-8-7 10:13 | 显示全部楼层
    就在明天凌晨1点?又怎么了?难道还能把天捅下来?
    回复 支持 反对

    使用道具 举报

    • 打卡等级:功行圆满
    • 打卡总天数:834
    发表于 2025-8-7 12:45 | 显示全部楼层
    手机被控:村里除名:我和谁干:跟谁干:[心]
    回复 支持 反对

    使用道具 举报

    • 打卡等级:功行圆满
    • 打卡总天数:834
    发表于 2025-8-7 19:41 | 显示全部楼层
    给梁文峰团体及国内其他攻关队伍加油,这座山我们必须翻过去。
    回复 支持 反对

    使用道具 举报

    • 打卡等级:功行圆满
    • 打卡总天数:834
    发表于 2025-8-8 00:23 | 显示全部楼层
    哈哈哈哈。
    回复 支持 反对

    使用道具 举报

    • 打卡等级:功行圆满
    • 打卡总天数:834
    发表于 2025-8-8 02:54 | 显示全部楼层
    GPT6会是院士级别的吗?
    回复 支持 反对

    使用道具 举报

    • 打卡等级:功行圆满
    • 打卡总天数:834
    发表于 2025-8-8 06:47 | 显示全部楼层
    不怕被其他大模型蒸馏,然后说遥遥领先吗
    回复 支持 反对

    使用道具 举报

    • 打卡等级:功行圆满
    • 打卡总天数:834
    发表于 2025-8-8 07:00 | 显示全部楼层
    ::
    回复 支持 反对

    使用道具 举报

    • 打卡等级:功行圆满
    • 打卡总天数:833
    发表于 2025-8-8 07:02 | 显示全部楼层
    很羡慕,也祝贺,希望政府加快我们的实力,为民谋福。
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    文字版| 手机版| 小黑屋| RSS| 举报不良信息| 精睿论坛 ( 鄂ICP备07005250号-1 )

    GMT+8, 2026-7-1 07:30 , Processed in 0.267697 second(s), 5 queries , Gzip On, Redis On.

    Powered by VC52.CN

    快速回复 返回顶部 返回列表