马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
ZP独家获悉, AI 芯片及系统架构研发商 “ 上海昉擎科技 ” 于近日完成 Pre-A3 轮融资,新引入投资人国开科创、钧山资本、建发新兴投资、多维资本,多维资本担任本轮融资财务顾问并担任后续融资独家财务顾问。某头部 VC 机构、华业天成、蔚来资本、广发信德、三七互娱等多位老股东进行超额加注。上海昉擎科技近三个月完成多轮融资,历史投资人包括头部产业资本及财务投资机构。
当英伟达用 200 亿美元收购 Groq 的消息震动硅谷时,一位曾主导华为麒麟 SoC 研发、执掌寒武纪技术架构的中国芯片专家,正试图用一套全球首创的分布式计算技术架构,回答一个更大的命题:在算力狂奔的时代,中国能否诞生一个定义下一代 AI 硬件系统的公司?
领航者梁军:见过高山,更能带队登顶的稀缺算力领路人
在国产 AI 算力突围的赛道上,真正兼具顶尖技术品味与产业落地能力的领路人,堪称凤毛麟角,而昉擎科技 CEO 梁军,正是这样一位 “ 见过高山、还亲自领队攀登 ” 的稀缺存在。深耕芯片行业二十余载,梁军的履历自带行业标杆属性,每一步都踩在国产芯片发展的关键节点上。
早年深耕华为海思期间,他以总架构师的身份主导海思麒麟 SOC 芯片研发,亲手搭建起核心技术体系,见证并参与了国产芯片从追赶至突破的关键历程,全球首先在海量发货的手机 SoC 中集成 NPU 并取得巨大商业成功; 2017 年加入寒武纪后,他出任 CTO ,主导推出首款 7nm AI 训练芯片思元 290 及后续系列产品 370 、 590 等,将 AI 芯片技术从实验室推向规模化应用场景。
不同于单纯的技术研发者,梁军既深谙底层架构的核心逻辑,又懂产业落地的痛点与路径,这种 “ 技术 + 产业 ” 的双重积淀,让他在 AI 算力赛道中具备了独一无二的视野与判断力。
如今选择再次创业,不是简单复制过往路径,而是站在更高维度 —— 这一次,他要做的不是 “ 又一款芯片 ” ,而是一个 AI 时代全新的计算系统范式。
执掌昉擎科技一年多的时间里,梁军带领公司完成多轮融资,头部战略方与财务投资机构纷纷入局加持,既是对梁军行业影响力与技术判断力的最高背书,更是对昉擎全新架构路线、算力破局潜力的高度认可。
算力需求爆发:国产窗口期来临,昉擎走出差异化破局之路
当下, AI 正以前所未有的速度爆发,大模型的快速迭代与场景落地使得推理需求激增,随之而来的是巨大的 AI 算力缺口,国产 AI 算力芯片迎来了历史性的发展窗口期。
纵观海内外市场,当前算力市场仍由英伟达主导, GPGPU 架构占据主流,但行业变革的暗流已在涌动 —— 海外诸多初创企业凭借新型架构试图破局,均斩获了资本市场的高度认可。
Groq 主攻 “ 可重构计算流处理器 ” 技术路线,估值飙升至 200 亿美元,最终被英伟达收购,相较前轮融资付出 3 倍溢价; Cerebras 通过晶圆级芯片实现超大规模并行计算,最新估值超 220 亿美元,相较几月前,估值增长 3 倍; Tenstorrent 则以 “ 数据流 +RISC-V” 混合架构吸引 AMD 前 CTO Jim Keller 加盟,分别累计融资近 20 亿美元,成为市场瞩目的新星。
与此同时, AI 正从云端向边缘深度渗透, AI 计算的分布式与 C 端场景化趋势愈发明显。开源项目 Clawdbot (后更名 OpenClaw )的爆火,意外带动了 Mac mini 热销,极大的加速了 Agent 应用的推广和普及,揭开了 AI 行业下一个十年的面纱:大模型和运行大模型的硬件成为智能化社会的基础设施, Agent 应用对低时延和低成本 token 的强需求,正在推动整个 AI 行业发生深刻的变化。
对此,昉擎表示:“ AI 推理系统正在发生快速改变,针对低延迟优化的推理系统将迅速成为新的产业和市场热点,以满足 Agent 应用对低时延和低成本 token 的强需求”。昉擎科技的布局,从一开始就与市面玩家截然不同 —— 昉擎不追求单一芯片的参数突破,而是以 “ 定义创新系统 ” 为目标,通过全新的分布式计算架构,开辟一条区别于所有同行的差异化破局之路。梁军认为“上下文相关”和“上下文无关”解耦的分布式计算架构将成为新的面向低延迟的推理系统的基础性架构。这一技术路线选择,源于他对计算范式转移的深刻洞察:在 AI 模型大行其道的今天,计算的本质正在从 “ 以计算为中心 ” 转向 “ 以 Memory 为中心 ” ,但这一事实还未被广泛认知。
核心架构革新: “ 解耦 ” 的智慧,重新定义可扩展系统
昉擎科技的技术内核,是一套名为 “ 上下文相关 ” ( context aware )与 “ 上下文无关 ” ( context free )解耦的分布式计算架构。
该全球首创技术架构直指 Transformer 模型的核心效率痛点。在传统的 Transformer 设计中,负责记忆和上下文的注意力机制( Attention )与负责逻辑和知识的前馈神经网络( FNN )被串联在同一层中。这意味着,两种不同的计算需求在同一个物理芯片上需要竞争计算资源,存储容量和存储带宽。
昉擎的解法是将两者彻底分离:把 FNN 与 Attention 解耦为两个独立模块,分配给最适合的硬件架构做分布式处理。这意味着,系统被分解为 “ 上下文相关 ” 与 “ 上下文无关 ” 两部分,两者之间通过明确定义的接口通信,系统的扩展从此从一个维度变成了多个维度。
“ 芯片设计的第一优先级,应从追求单一芯片性能、集成度的提升,改为优先追求一个可扩展的系统设计。 ” 梁军强调 。当视角从芯片上升到系统,新的可能性便浮现出来。昉擎科技认为:如果做一下对比,对输入输出的处理部分更像是冯诺伊曼架构里的处理器,对权重相关的处理部分更像是传统处理器里的 Memory ;传统意义上的 Memory 有 2 个属性,容量和带宽,新的 Memory 增加了 2 个新的属性:计算语义和通信,变成了 4 个维度。当采用了分离式架构以后,两个组件在 4 个维度上采用不同的方式设计和做系统扩展,会创造出新的 AI 系统;以分离式架构为基础搭建的,面向低延迟设计的推理系统,因为更好的匹配了 Agent 应用的需求,将快速成为新的产业和市场热点。
端侧 AI 革命引领:让每个家庭、每个人都拥有 “ 大模型大脑 ”
在梁军的蓝图中,这套分离式架构在端侧依托 “ 上下文相关 ” 与 “ 上下文无关 ” 的解耦设计,昉擎将分布式计算架构延伸至端侧,彻底改变现有 AI 硬件生态,让 “ 大模型普惠化 ” 真正成为可能,基于分离式架构设计的系统会发展出新型的个人 AI 计算机。
在家庭场景中,电视、空调、扫地机器人、智能音箱等设备虽内置小芯片,但受限于算力与内存,无法运行哪怕是最轻量的大模型。试想未来家里放置一个小型 “ 家庭 AI 计算中心 ”—— 可能是一个不起眼的小盒子,所有家用智能设备上的小芯片负责将物理世界的输入 token 化,以及将模型输出的 token 转换成对物理世界的输出,而基于分离式架构设计的 AI 推理系统则统一放在这个小盒子中。通过 Wi-Fi ,家中的所有智能设备都可以调用大模型能力, AI 算力将随处可用。
在 C 端个人穿戴场景下,智能手表、戒指、 AR 眼镜等微型设备受体积、功耗与散热限制,几乎不可能集成强算力芯片。而试想未来一枚名片大小的 “ 个人计算平台 ” 可随身携带,作为共享的 AI computer 。所有穿戴设备只需负责数据采集,输入数据 token 化,以及将模型输出 token 转换成物理信号输出,复杂推理全部交由这张 “ 卡片 ” 完成。未来,这张卡片或许不仅是算力载体,更可集成数字身份、健康档案、 AI Agent 人格等,成为新时代的 “ 数字身份证 ” 或 “ 个人智能中枢 ” 。
在梁军看来, “ 当把第一优先级改为追求可扩展的系统设计之后,会颠覆现有的 AI 硬件设计思路,引领全新的系统形态,创造出新的市场。 ”
结语
从麒麟到寒武纪,再到今天的昉擎,梁军一直在攀登。这一次,他的目标不再是追赶者眼中的 “ 高山 ” ,而是一座尚未被定义的山峰。当旁人还在追赶算力峰值、比拼 TOPS 数字时,昉擎选择了一条更艰难但也更值得的路:定义一个属于中国原创架构的 AI 算力新时代。
这不是一场简单的国产替代,而是一次从底层逻辑出发的范式重构。它不依赖先进制程,不迷信单一芯片性能,而是通过重新组织计算、存储与通信的关系,释放出前所未有的效率与灵活性。
这场静水深流的革命,或许将真正让 AI 走进千家万户、融入每个人的数字生命。 |