qqwa1234 发表于 2026-2-16 22:09

除夕夜再丢王炸模型 !千问着实太能卷了

2月16日17:13,距离春晚启动只有几小时,千问再丢王炸:上线全新一代大模型Qwen3.5-Plus。


从名字看,Qwen3.5-Plus只是Qwen3.0的优化版,但在技术结构层面,千问3.5实现了从纯文本模型到原生多模态模型的代际提升(因此也有理由相信,Qwen4.0会藏着更大的惊喜)。
此前,Qwen 3模型预训练是在纯文本Tokens上进行的,Qwen 3.0-Plus的最大革新是“开眼”,其基于视觉和文本混合token进行预训练,同时还新增了中英文、多语言、STEM和推理等数据,让“睁开眼睛”的大模型学会了更密集的世界知识和推理逻辑。与此同时,Qwen 3.0-Plus实现了对Transformer经典架构的重大创新突破,包括应用自创的门控技术成果、训练稳定优化以及多 token 预测等系列技术。
直接看结果:评测结果显示,Qwen 3以不到40%的参数量,获得了超万亿的Qwen3-Max基座模型才拥有的顶尖性能,在推理、编程、Agent智能体等全方位基准评估中均表现优异。榜单数据看图吧。


千问Qwen基础模型的实力有目共睹。前段时间发布的Qwen-Image-2.0,以媲美nano banana pro的实测表现震惊业界,其除了可吞下多达1000token的长指令外,还能渲染数百字的汉字书法且不存在“鬼画符”的行业常见问题。如果用户输入的指令简略,Qwen-Image-2.0还会自动填充指令到更详细的程度,进而生成更好的结果,这展现出Qwen在多模态上的独特优势,即同时处理文字、图片、声音、视频等内容。


在雷科技看来,千问在除夕夜发布Qwen3.5-Plus绝非偶然。前段时间,千问发布Qwen-Image-2.0、字节发布Seedance 2.0视频大模型,引发了全球AI行业的高度关注。在几大巨头外,“AI小龙”们也没闲着,2 月 11 日晚,DeepSeek 新模型版本全面上线,继续把长上下文与复杂任务能力往前推(真正的大家伙可能也在这几天亮出来);几乎同一时间,智谱推出新一代旗舰 GLM-5,强调 Agent 与编程能力;MiniMax 也带来了 MiniMax M2.5,延续多模态与应用导向路线。


中国AI巨头们狂发大模型“神仙斗法”,与AI红包大战成为这届春节的两条主线。即将到来的春晚被称为首届AI春晚,除了字节(豆包)将上台撒钱外,追觅、MOVA、魔法原子、首驱、宇树科技等AI硬科技玩家也将登台献艺。


这其实体现出中国AI产业发展的主旋律:一边是疯狂研发基础技术,与漂亮国的OpenAI、Google们竞争,另一边则是强化AI技术产品化、工程化、工业化应用,让AI技术从实验室走向真实场景,惠及所有人。看到如此努力的大模型们,你还认同此前传遍全网的“美国巨头卷模型,中国巨头只会发红包”的谬图吗?

qqwa1234 发表于 2026-2-17 00:30

Qwen4.0会有啥新突破?

ycp123 发表于 2026-2-17 00:30

积极欣赏

yzszh64 发表于 2026-2-17 11:24

感谢分享。

hcyw2008 发表于 2026-2-17 13:22

感谢分享
页: [1]
查看完整版本: 除夕夜再丢王炸模型 !千问着实太能卷了