夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 239|回复: 12

[科技新闻] 2025云栖大会:阿里云的全栈AI战略与激进布局

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-24 16:26 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp


文|晓静
编辑|沈月
在2025云栖大会上,阿里巴巴集团CEO吴泳铭公布了公司的AI战略核心方向。他首次明确提出了阿里巴巴对人工智能发展的三大关键判断:
第一,通用人工智能(AGI)的实现已成为确定性趋势,而能够自我迭代、全面超越人类智能的超级人工智能(ASI)才是终极目标;
第二,为迎接ASI时代的到来,阿里云已战略升级为"全栈人工智能服务商",并正在实施三年3800亿元的AI基础设施建设计划,未来还将持续追加投入;
第三,到2032年,阿里云全球数据中心能耗规模将较2022年提升10倍,这意味着公司算力基础设施将实现指数级扩张,为超级人工智能的发展提供坚实基础。
吴泳铭演讲结束之后,阿里股票跳涨超过4%,至下午13:30,涨幅达6.65%。在最近一个财季中,阿里云智能集团收入同比增加26%,管理层在财报电话会议中表示,AI相关收入已连续八个季度保持三位数同比增长。自Q2财报发布之后,阿里重回市场焦点,其中一条主线就是轰轰烈烈的AI叙事。
吴泳铭认为,超级AI云需要超大规模的基础设施和全栈的技术积累,未来全世界可能只会有5-6个超级云计算平台。如今,阿里巴巴正以激进投入和全面布局,力争占据其中一席。
这一战略也清晰具象地展现在杭州云栖小镇现场,前方人潮涌动,参展商达500多家。今年的云栖大会现场设有三大展馆,1号馆主题是人工智能+,主要为AI应用开发生态;2号馆为计算馆,主要展示云技术基座;3号馆则是前沿应用,主题是Agent和具身智能。此外,和2024年云栖大会大同小异的是,展商多为阿里合作伙伴,整个展区也是阿里AI生态的小缩影。
从模型、到算力、到应用,阿里确实在全栈的路上越走越远,但这背后也注定是资本开支持续和巨大的投入。云栖大会现场,阿里云智能首席技术官周靖人进行了长达一小时的技术发布,详细介绍了通义大模型系列、AI基础设施及开发平台的多项重要更新。本文将复盘本次云栖大会呈现的技术进展与战略布局,梳理阿里AI发展的激进版图。  
2.webp


图:云栖大会现场

一、大模型方面:开源的通义千问和AI时代的Android

吴泳铭在主题演讲中,将大模型明确定义为新一代的操作系统,而通义大模型想做的是“AI时代的Android”。在云栖大会上,阿里一次性发布了多项重要的模型更新:
1)基础模型与多模态模型

  • Qwen3-Max:旗舰大模型,主打推理、Agent工具调用与Coding;预训练数据量达36T tokens。在大模型用Coding解决真实世界问题的SWE-Bench Verified测试中,Instruct版本获得69.6分,位列全球第一梯队;在聚焦Agent工具调用能力的Tau2-Bench测试中,Qwen3-Max取得74.8分,超过Claude Opus4和DeepSeek-V3.1。
  • Qwen3-Next:面向“超长上下文+超大参数”时代的新架构,模型总参数80B仅激活 3B ,性能可媲美千问3旗舰版235B模型。针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采用了混合注意力机制、高稀疏度 MoE 结构、多token 预测(MTP)机制等核心技术,模型训练成本较密集模型Qwen3-32B降低超90%,
  • Qwen3-Coder:编程专项模型升级,强调速度、鲁棒性与安全性。
  • Qwen3-VL(视觉理解,开源):在多模态推理、视觉Agent与视觉编程上增强,扩展3D Grounding与百万tokens上下文。在视觉感知和多模态推理方面,在32项核心能力测评中超过Gemini-2.5-Pro和GPT-5。Qwen3-VL拥有视觉智能体和视觉Coding能力,能看懂图片,还能像人一样操作手机和电脑,自动完成许多日常任务。
  • Qwen3-Omni(全模态):在“听-说-写-视听”混合训练下,兼顾语音/音视频与文本/图像性能稳定。可像人类一样听说写,应用场景广泛,未来可部署于车载、智能眼镜和手机等。用户还可设定个性化角色、调整对话风格,打造专属的个人IP。类似于人类婴儿一出生就全方位感知世界,Qwen3-Omni一开始就加入了“听”、“说”、“写”多模态混合训练。在预训练过程中,Qwen3-Omni采用了混合单模态和跨模态数据。
3.webp


2)生成式图像/视频与语音

  • 通义万相 Wan 2.5-preview:通义模型家族中的视觉基础模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型。支持文生视频、图生视频、文生图和图像编辑,视频生成能力从5秒提升至10秒,并支持1080P 24fps视频生成。此次,通义万相2.升级了图像生成能力,可生成中英文文字和图表,支持图像编辑功能,输入一句话即可完成P图。
4.webp



  • 通义百聆(Fun-ASR / Fun-CosyVoice):全新的语音大模型。包括语音识别大模型Fun-ASR、语音合成大模型Fun-CosyVoice。Fun-ASR基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性;Fun-CosyVoice可提供上百种预制音色,可以用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等场景。
二、Agent开发与运行平台方面:阿里云百炼发布全新Agent开发框架

阿里在本届云栖把“模型服务 + Agent 开发”合并为一条主线来发布:面向企业工程化的高代码框架 ModelStudio-ADK首次发布,低代码平台 ModelStudio-ADP同步升级;模型侧以 Qwen3 等为核心扩容;运行侧以无影 AgentBay 做算力与工具调度的底座。官方口径称,过去一年百炼平台的日均模型调用量增长约 15 倍。
ModelStudio-ADK 面向企业级 Agent 的开发与部署,支持自主决策、多轮反思、循环执行等通用能力,基于通义开源的 AgentScope,可用于深度研究、硬件代理、复杂检索等应用,并提供云端组件化开发与部署能力。阿里云表示,借助该框架可在较短时间内完成如 Deep Research 之类项目的原型搭建。
模型层面,百炼继续接入并发布 Qwen3 系列等模型,重点提升推理与规划效率;平台目前可一键调用包括 Qwen、Wan、DeepSeek 在内的 200 余款模型。
组件与运行能力,百炼集成了工具连接(MCP Server)、多模检索(RAG Server)、执行隔离(Sandbox Server)、记忆管理(Memory Server)与支付订阅(Pay Server)等企业级组件,其中 Pay Server 与支付宝联合推出,用于 Agent 的计费与结算。基于 ADK 的示例应用包括 DeepResearch、Agentic-RAG、Computer-Use Agent,提供在线体验与代码下载。
ModelStudio-ADP 聚焦低代码场景,提供模板化编排与部署。阿里云称平台已有超 20 万开发者创建了数十万级 Agent。
面向运行时底座,无影 AgentBay 新增自进化引擎、自定义镜像、安全围栏与内存状态管理等能力,目标是在云端更稳定地调度算力、存储与工具链,减轻本地设备限制。现场,阿里还展示了“无影 Agentic Computer”,强调与云端状态与“记忆”打通以承载更长链路的 Agent 工作流。
三、基础设施方面:以通义为核心的操作系统和以AI云为核心的下一代计算机

阿里云在本届云栖把“软硬一体”的AI体系做了一次成套升级:通义作为核心能力持续演进,AI云被明确为“下一代计算机”的承载形态。官方披露,过去一年 AI 算力提升超过 5 倍、AI 存力提升超过 4 倍。
5.webp


图:阿里云CTO周靖人

先看服务器。
新一代“磐久 128”超节点 AI 服务器亮相,单柜可容纳 128 颗加速芯片,支持多种 AI 芯片形态;配合自研 CIPU 2.0 与 EIC/MOC 网卡,目标是在高密度部署下兼顾带宽与时延。按阿里云公布的口径,在同等算力规模下可把推理效率做出明显提升。
6.webp


图:“磐久 128”超节点 AI 服务器

网络方面推出HPN 8.0,高带宽与训推一体化是关键词。存储网络带宽提高到 800Gbps,GPU 互联带宽到 6.4Tbps,可支撑万卡级别的稳定互联与调度。
存储系统也做了针对性改造。并行文件存储 CPFS 的单客户端吞吐提升至 40GB/s,面向训练阶段的数据高速读取;表格存储 Tablestore 用作 Agent 的记忆与知识库;对象存储 OSS 新增 Vector Bucket,专门承载向量数据,并结合 MetaQuery 的语义检索与内容感知,便于快速搭建 RAG 类应用。
通用计算产品线也同步推进。基于“飞天 + CIPU”的体系,第九代企业级实例引入英特尔与 AMD 的新平台,覆盖离线分析、视频转码等高并发场景。
在弹性与调度上,容器服务 ACK 新增“灵骏节点池”,加入模型感知路由、多角色推理负载管理与故障自愈;ACS 强化网络拓扑感知与 Serverless GPU 弹性,支持更高并发的沙箱启动,并通过智能休眠/唤醒把 Agent 的使用成本压低。
AI 平台层,PAI 与通义模型做了联合优化。训练侧围绕 MoE、DiT等路径做并行与通信策略升级;推理侧通过权重管理与路由策略把吞吐做高、时延做低,扩容速度也随之加快。整体目标是让“模型—平台—算力”以同一套设计原则协同工作。
7.webp


在云栖大会现场,作者沟通了多位参会嘉宾,询问他们“最期待在云栖大会收获什么”。答案出奇地相似:参会者希望看到好的行业应用案例,找找灵感和启发,以及寻找AI的落地契机。
其中还有一位参会者提到,“希望看到更多阿里内部如何把AI用起来的案例,不仅仅是阿里如何通过AI赚钱,而是阿里这样一家大公司,如何因为AI重构组织流程、重新获得新的增长点。”
在2024年的云栖大会上,吴泳铭说过一句话,生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级App,而是接管数字世界、改变物理世界。
阿里在AI上的投入,短期内已经受到了资本市场的关注和认可,但是,AGI之路才开始,ASI是更宏大的理想。随着全球AI竞争进入白热化阶段,阿里这场豪赌能否成功,将取决于其能否真正打通从模型到应用的全栈能力,并在全球范围内建立可持续的AI生态。
相关阅读:
相关阅读:
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-24 17:11 | 显示全部楼层
一唱一和,文章词用的真好
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-24 18:17 | 显示全部楼层
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-24 19:10 | 显示全部楼层
孙正义又只能拍大腿!
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:410
发表于 2025-9-24 19:58 | 显示全部楼层
吴泳铭将AI比作新时代的“水电煤”,把大模型定义为下一代操作系统,这个定位既清晰又宏大。但现实是AGI尚未实现,ASI更像科幻概念,阿里需要证明自己不仅能画饼,更能把饼做实。
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-24 19:58 | 显示全部楼层
通义开源路线像极了AI时代的“安卓战略”,但谷歌安卓的成功靠的是全球生态,阿里能否复制这种成功?目前下载量6亿次、衍生模型17万个的数据很亮眼,但最终衡量成功的不是模型数量,而是有多少应用真正改变了行业🤔
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-24 20:00 | 显示全部楼层
最让我震撼的是“AI需要原始数据而非二手数据”的观点。这揭示了当前AI的局限性——我们训练AI的方式就像让学生只读教科书而不接触现实世界。如果阿里真能解决物理世界数据获取问题,确实可能实现跨越式发展。
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:410
发表于 2025-9-24 20:00 | 显示全部楼层
作为AI开发者,我第一时间试用了通义千问Next模型。架构创新确实能感受到,但周靖人说的“模型持续学习”还没看到。希望阿里不要只顾着发模型,更要把开发者工具链做好,让百炼平台真能成为AI时代的应用商店。
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-24 20:00 | 显示全部楼层
23分钟=2200亿,这可能是史上最贵演讲按分钟计费版。建议下次演讲开到半夜,这样阿里市值就能超过苹果了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:410
发表于 2025-9-24 20:01 | 显示全部楼层
这场AI竞赛越来越有意思了。开源确实能快速占领市场,但如何商业化是个难题。看看谷歌安卓和苹果iOS的差异,也许未来会是“通义安卓” vs “GPT iOS”的格局?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-20 23:44 , Processed in 0.246310 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表