阿里除夕夜或将开源Qwen3.5模型 采用原生多模态架构
随着农历除夕的到来,阿里巴巴旗下的通义千问团队即将发布新一代开源大模型Qwen 3.5。目前该模型系列的相关代码已提交至Hugging Face与GitHub仓库,标志着这一备受期待的AI技术即将正式面向全球开发者开放。Qwen 3.5 在架构设计上实现了显著进化。它采用了全新的混合注意力机制(Hybrid Attention),将线性注意力与标准注意力相结合,从而在保持强大推理能力的同时,大幅提升了长文本和复杂任务的处理效率。
与前代模型相比,Qwen 3.5是一款原生多模态模型。它能够直接理解并处理文本、图像、音频以及视频数据,无需依赖外部插件或子模型进行转换。初步透露的模型规格包括9B(90亿参数)指令微调版以及35B-A3B(基于MoE架构)的中型版本,后者在数学推理与编程能力上表现尤为出色。
当前的中国 AI 市场竞争已进入白热化阶段。除阿里外,DeepSeek 计划推出其 V4 模型,字节跳动也在升级其豆包系列。行业分析人士认为,阿里选择在除夕夜这一关键节点开源 Qwen 3.5,旨在通过技术领先地位获取春节期间的流量峰值,并巩固其在全球开源社区的影响力。 春节到,复制口令打开元宝App,红包抢起来! CZ9659 y:/CYGVDLX573 复制分享!春节打开元宝App,抢红包啦! HU7337 N:/G3G1EF7PBI 套路[哭笑] APP下了,却没有喝到奶茶,怎么解决[哭笑] 豆包更适合中国人 难了,现在有豆包又有千问[哭笑] 还没有完全普及就开始收费了,太急了,他以为他是谁啊。 做模型总比卖菜强,与民争利非君子所为。[点赞]
页:
[1]