超3000万颗出货!这家可重构AI芯片公司凭什么能领跑国产算力?
“我们正处在一个AI模型爆炸的年代,模型的迭代速度已经从过去的以年、以月为单位,进化到今天开始以周为单位进行演进。”清微智能副总裁陈逸伦在ICCAD 2025高峰论坛的演讲中指出,从GPT-5、Qwen到DeepSeek等大模型的快速迭代,背后是对计算能力永无止境的苛求。多份权威研究显示,自2010年以来,AI模型训练所需要的计算量大概以每年4-5倍的速度在增长,这已远超传统摩尔定律的发展轨迹。
更值得关注的是推理算力需求的爆发性增长。
“一年以前,AI还是一个聊天工具,今天已经进化成可以自主完成非常复杂多任务的AI Agent(智能体)。”陈逸伦分享道,在国内市场,截至今年6月底,日均Token处理量已突破30万亿,过去18个月内增长了300倍。
清微智能副总裁陈逸伦
面对如此迅猛的增长,传统GPU架构正面临严峻挑战。
据最新报道,谷歌正在向Meta公司销售其自研的TPU芯片,而Meta计划最早明年从谷歌云租赁TPU算力,2027年起将谷歌的TPU整合到其数据中心内。受此消息影响,GPU龙头的英伟达市值一夜蒸发千亿美金。
显然,非GPU芯片的增长势头已十分明确,而基于非GPU路线的可重构计算架构,正凭借技术、政策与市场的多重支撑,成为未来中国AI算力技术的核心发展趋势之一。
“若按照当前趋势持续扩张,预计到2030年,前沿AI的算力集群成本将超过1000亿美元。”陈逸伦表示,这不仅是资金挑战,更是能源、效率、供应链的全面挑战。探索更高效、更具性价比的新计算架构已不是可选项,而是关乎产业可持续发展的必答题。
可重构计算是全球产业共识
可重构计算架构技术兼具通用芯片灵活性与专用集成电路高效性的优点,能根据不同的算法和应用需求灵活配置硬件资源,带来更高有效的算力和更低的功耗。《国际半导体技术路线图》曾表示,可重构技术是最具前景的未来计算架构。
陈逸伦在演讲中强调,“我们的架构核心是可重构数据流,它就像一个乐高积木一样,能够让芯片的硬件能够像AI算法一样动态重构,从而实现专用的高性能,同时也能保证通用的灵活性。”
“在海外高端芯片受限后,基于可重构等新架构的国产AI加速芯片,迎来了‘换道超车’最佳历史机遇期。”陈逸伦表示。
目前,清微智能TX81芯片面向智算中心等大规模AI应用场景,以独特“C2C算力网格技术”为核心,构建出高带宽、低延迟的数据流通路。相较于依赖外部交换机的传统方案,清微在扩展性、灵活性和传输效率上实现了架构级的代际提升。
搭载TX81芯片的REX1032训推一体服务器可支持万亿以上参数大模型部署,整体解决方案成本相比同行业产品降低50%,能效比提升3倍。
商业化层面,在国产算力芯片领域,清微智能已取得扎实进展。
陈逸伦告诉TechSugar,目前清微智能可重构芯片累计出货已超过3000万颗。而在云端AI芯片方面,清微智能AI算力卡销量超2万张。
据IDC最新数据统计,2025年上半年,清微智能在国产非GPU(含可重构新架构及AISC)加速卡销量中位列第六,已成功跻身国产算力第一梯队。
11月17日,新华社发布《北京何以成为“人工智能第一城”》一文,明确指出北京已构建自主可控的AI“芯片矩阵”,昆仑芯、寒武纪、摩尔线程、清微智能等四大国产明星企业的核心产品实现性能领先。
在产品规划上,陈逸伦透露,明年计划推出性能更高的TX82系列产品。
“目前,我们的大算力芯片已实现主流模型稳定运行,在国内行业落地情况良好,走了一条与 GPU 不同的技术路线。”陈逸伦表示。
让CUDA用户“无感”迁移
陈逸伦强调,可重构技术路径并非清微智能独辟蹊径,而是全球产业共识。他指出,可重构计算在国际上被列为未来关键的共性技术,也是中国新一代人工智能发展规划的重点支持方向。从国外的斯坦福孵化的Sambanova,到谷歌的TPU,全世界众多顶尖科研机构和公司都在这个方向持续探索。
在生态建设方面,面对“90% AI开发者仍习惯CUDA”的现实,清微智能采取了"三层兼容"策略,与传统CUDA生态形成差异化优势。
具体来说,陈逸伦表示:
[*]第一层兼容是英伟达CUDA的API兼容,像cuDNN(专为深度学习设计的库)、cuBLAS(用于线性代数运算的库)用户都可以使用,同时,清微智能和英伟达CUDA生态的兼容也在持续完善;
[*]第二层是“Triton兼容”,这也是OpenAI主推的开源编译器,行业内主流大模型厂商都在向Triton做迁移,清微也在联合智源研究院,积极参与国内Triton生态的建设工作;
[*]第三层就是在芯片最底层,类似英伟达PTX那一层,用户可以用RISC-V的指令集去做整个芯片的编程,目前RISC-V开源生态也比较繁荣,对于用户来说更容易进行性能极致调优。
此外,像一些主流的神经网络框架,比如PyTorch,TensorFlow等,清微智能也都做了完整兼容适配,保证框架上编程用户做到无感迁移。因此,通过拥抱开源Triton+RISC-V生态,同时也兼容CUDA,清微智能可以为不同类型客户提供适配方式。
“我们希望能够做到客户是对底层架构是无感知的,所以我们在中间做了相应的封装。"陈逸伦表示。
从长期来看,随着国内 AI 应用基于国产芯片开发,可重构架构的差异化优势在于,既能通过兼容现有生态快速切入市场,又能依托本土生态建设形成长期壁垒,最终在 AI 推理、算力供给中实现平衡,为用户提供高性价比的算力解决方案。
陈逸伦强调,“我们认为只要持续投入资源,生态建设将逐步完善。”
可重构等芯片创新空间可持续5-10年
对于AI算力市场的竞争,陈逸伦信心十足。
“在我们看来,可重构计算+3D Chiplet+晶圆级集成至少还可以探索很多年,这相当于‘芯片界的电磁弹射’,每一步都在对软件、硬件作重新定义,在这条路上有更广阔的发展空间。”陈逸伦表示,这些领域的工程创新空间至少可持续 5-10 年,这相当于“芯片界的电磁弹射”。
在陈逸伦看来,国内的架构创新空间巨大,国产替代、自主创新已经是大势所趋,且刻不容缓。而基于可重构等新架构国产AI加速卡芯片,已经迎来了换道超车的最佳机遇。而清微智能的可重构技术体系涵盖动态可重构计算(如搭积木般构造电路)、数据流计算(数据在芯片内部流动,不依赖外部存储交互)、3D DRAM Chiplet 等底层技术,未来还将探索晶圆级芯片等前沿方向。
清微智能所代表的可重构计算路径,正为中国算力自主可控开辟出一条切实可行的创新之路。 专业人士 加油!伟大的中国科学家研究团队和中国清微智能电子科技有限公司的设计可重构AI芯片的科研团队。加油中国!!![点赞][点赞][缅怀][缅怀][缅怀][奋斗][奋斗][奋斗][心][烟花][万众一心]
页:
[1]