夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 80|回复: 3

[数码资讯] 阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:854
发表于 2025-7-26 08:58 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
在 2025 世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰昨天在上海正式发布了新一代基础大模型 ——Step 3,将于 7 月 31 日面向全球企业和开发者开源。

据官方介绍,Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。Step 3 采用 MoE 架构,总参数量 321B,激活参数量 38B。



Step 3 拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。

Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的 SOTA 成绩。



官方称,目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。在架构设计阶段,Step 3 便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3 实现了行业领先的推理解码效率。

根据原理分析,Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。
  • 打卡等级:已臻大成
  • 打卡总天数:672
发表于 2025-7-26 09:07 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:856
发表于 2025-7-26 10:43 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:841
发表于 2025-7-26 11:44 | 显示全部楼层
感谢分享。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版| 手机版| 小黑屋| RSS| 举报不良信息| 精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-30 16:01 , Processed in 0.209541 second(s), 4 queries , Gzip On, Redis On.

Powered by VC52.CN

快速回复 返回顶部 返回列表