找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 51|回复: 7

[科技新闻] 华为发布新技术 AI推理生态要变天?

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-12 17:54 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp

图源:视觉中国

文丨雅萱
编辑丨叶锦言
出品丨深网·腾讯新闻小满工作室
2025年普遍被业界视为AI应用的落地元年,当人工智能领域的竞争焦点从模型能力转向场景应用落地时,推理技术作为连接模型与最终应用的关键环节,直接决定了AI应用的体验与效能。
中信建投在2025WAIC期间发布的白皮书指出,AI正从训练向推理的结构性转变而快速增长(如国内某头部互联网公司每三个月Token消耗接近翻一倍,5月底为16.4万亿Token)。在这样的大背景下,AI推理体验的重要性愈发凸显。
推理体验直接关系到用户与AI交互时的感受,包括回答问题的时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200Tokens/s区间(时延 5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。
8月12日,华为数据存储产品线总裁周跃峰博士在2025金融AI推理应用落地与发展论坛上发布了AI推理创新技术UCM(推理记忆数据管理器)。
“这项技术以优化KV Cache管理为中心,融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。”周跃峰说。
过去提升AI推理性能主要依赖增加昂贵的高带宽内存(HBM)和服务器内存(DRAM),UCM进一步引入专业的外置存储作为第三级记忆,形成三级存储架构。
“实时、高频访问的极热数据存储于HBM,短期/较热数据存储在服务器DRAM中,其他数据存储于专业外置存储,最大化利用不同存储介质的优势,从而提升整个AI推理系统的效率和性能。”周跃峰说。
2.webp


3.webp


据华为官方信息显示,UCM开源计划将于今年9月在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。
对于华为UCM架构的推出,中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,“由于HBM价格昂贵,主流大模型和AI芯片大厂为突破显存瓶颈,开始采用外置存储解决长序列推理问题已成为业界共识,其中KVCache成为推理架构优化的关键。”
除华为UCM架构外,英伟达也于今年3月推出了用于扩展推理AI模型的低延迟分布式推理框架NVIDIA Dynamo,包含NVIDIA Dynamo 分布式 KV 缓存管理器。
作为 AI 芯片的 “算力粮仓”,近两年,高带宽存储器(HBM)的价格和市场都呈现爆发式增长。
数据显示,HBM价格比标准的DRAM要贵得多,大约是DDR5的5倍;而据分析机构 Yole 数据,2023 年 HBM出货量同比激增 187%,2024 年增幅进一步扩大至 193%,增速远超整体 DRAM 市场。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-12 18:18 | 显示全部楼层
用过国内AI问答,等半天还答非所问,国外200Tokens/s快得像坐高铁,咱这60Tokens/s慢得像自行车,华为这UCM技术听着能治这毛病
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-12 20:42 | 显示全部楼层
又要遥遥领先了?
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-12 21:08 | 显示全部楼层
不就是用硬盘做虚拟内存吗
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-12 22:45 | 显示全部楼层
华为加油👍💪👏华为加油👍💪👏
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-12 23:03 | 显示全部楼层
天天吹上天
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-13 09:07 | 显示全部楼层
即使再厉害,不能民用也白搭,你听过华为的ai牛的很,你用过吗?在哪里?你听过华为的算力显卡多么牛x超越这个那个,你能买到吗?
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-13 11:08 | 显示全部楼层
疯狂堆料,大模型还抄阿里的,遥遥领先
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-9-14 18:24 , Processed in 0.197685 second(s), 7 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表