夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 88|回复: 5

[科技新闻] DeepSeek又一核心成员离职,入职智驾创企担任首席科学家

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2026-1-2 10:03 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
智东西(公众号:zhidxcom)
编译 | 刘煜
编辑 | 陈骏达
智东西4月14日报道,4月12号,在智能电动汽车发展高层论坛上,第三方智能驾驶解决方案供应商元戎启行CEO周光首次证实,DeepSeek多模态核心研究员阮翀已加盟该公司,并担任其首席科学家。周光称,阮翀将在2026年的北京车展首次公开发表演讲。
早在今年1月份,腾讯汽车媒体就曾援引独立信源消息,称阮翀已正式加盟元戎启行。不过彼时元戎启行并未对此作出官方回应。
元戎启行的新成员阮翀,他于2018年从北京大学毕业,并且同时拥有计算机科学学士学位和计算语言学硕士学位。其中属于计算语言学范畴的自然语言处理(NLP)是他硕士期间的研究方向。
1.webp


本科期间,阮翀以访问学者身份赴美国卡内基梅隆大学(CMU)交流,历时约4个月。在CMU时他师从Victor Adamchik教授,围绕格罗比纳基(Groebner Basis)开展研究,成功实现用最少数量的多项式方程对数独规则进行代数建模,其相关成果是计算代数相关领域的原创性突破。
2.webp


据领英公开信息查证,从2017年3月开始,阮翀在做智能输入法、AI语言技术的公司Kika Tech(触宝)实习,实习共计约4个月。
在Kika Tech实习期间,他以第一作者身份在2018年计算语言学国际会议(CICLING)发表论文《Sparse Word Representation for RNN Language Models on Cellphones》,完成了口头报告。
3.webp


结束上一段实习之后,阮翀接着去到网易有道信息技术(北京)有限公司开始了其5个月的实习。实习期间,他参与实现iPhone 6及以上设备端0.1秒/句的离线翻译性能,该成果最终集成至有道翻译官APP的离线翻译功能,成功完成了产品化落地。
4.webp


阮翀于2023年加入了DeepSeek担任研究员,他曾参与了DeepSeek-VL/VL2以及Janus系列等多模态模型的研发。
据DBLP(计算机科学文献数字图书馆)记录,他与DeepSeek创始人梁文锋共同署名发表了9篇论文。阮翀发表的这些论文为Deepseek大模型推理、高效注意力机制等核心技术突破作出了关键贡献。
阮翀以DeepSeek-VL模型研究负责人的身份参与了题为《DeepSeek-VL: Towards Real-World Vision-Language Understanding》的论文研究。
该研究聚焦真实场景下的视觉与语言理解难题,针对文档、图表、OCR以及网页截图等复杂实际场景,实现了DeepSeek-VL细粒度图文理解能力,同时通过优化训练策略,一定程度上避免了多模态模型常见的语言能力退化问题
5.webp


之后,阮翀亦以负责人的身份参与了《DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding》一文的研究工作。
该研究面向高阶多模态理解任务,提出了混合专家(MoE)架构的视觉语言模型DeepSeek-VL2,通过动态分块视觉编码与高效MoE语言主干设计,在DeepSeek-VL基础上进一步提升DeepSeek-VL2在真实场景下的理解能力与推理效率,在主流多模态基准上取得了一定程度上的领先性能。
6.webp


同时,阮翀还作为作者之一,发表了题为《Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation》的Janus模型相关论文。
该研究提出了一套解耦视觉编码的统一多模态框架Janus,通过分别构建面向理解与面向生成的独立视觉编码通路,在同一自回归架构下同时实现了强大的多模态理解与高质量图像生成能力,有效解决了单一编码器难以兼顾两类任务的技术瓶颈。
7.webp


在阮翀发表的多篇论文中,他参与撰写的一篇题为《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》的论文,获得了2025年NLP与计算语言学领域的顶级学术会议ACL的最佳论文奖
8.webp


而后,他参与撰写的另一篇论文《DeepSeek-R1: Incentivizing Reasoning in LLMs through Reinforcement Learning》,于同年9月刊登于国际权威期刊《自然》(Nature),并登上当期封面
9.webp


除上述研究外,阮翀还以第三作者身份,撰写了题为《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures》的文章。
从论文内容可见,阮翀深度参与了DeepSeek-V3面向H800集群的整体方案设计,围绕计算、内存与通信等关键硬件瓶颈开展架构优化工作。
他不仅参与MoE混合专家架构的工程化落地,解决大规模训练中计算与通信的效率平衡问题,还在MLA等新型注意力机制的设计与实现中承担核心工作,为突破模型硬件协同瓶颈、提升大模型规模化训练与推理效率提供了关键技术支撑。
10.webp


可见,阮翀在AI大模型底层技术领域拥有宝贵的技术开发经验。
阮翀此次加入的元戎启行公司成立于2019年,主要为车企设计智驾系统
元戎启行已与多家车企建立合作,现已有25万辆搭载其城市领航辅助驾驶方案的车辆进入消费者市场,覆盖长城吉利以及smart多个品牌。
截至目前,元戎启行已完成6轮融资,累计融资金额超7亿美元(约合人民币47.82亿元)。今年4月初,据36氪汽车报道,元戎启行已向港交所秘密递交上市材料,计划于今年年内在港交所挂牌上市。
结语:大模型人才跨界合作,打通AI与自动驾驶技术壁垒

目前,传统智能驾驶多采用感知、预测、规划、控制分模块独立优化的技术路线,存在信息割裂、迭代效率偏低、数据利用率不高等痛点。
阮翀作为AI大模型领域核心人才加盟元戎启行,或可凭借其在多模态对齐、大模型推理效率优化及稀疏架构设计等方面的深厚积累,在一定程度上为该公司VLA基座模型的规模化量产落地提供技术支撑,从而增强其产品的市场竞争力。
  • 打卡等级:功行圆满
  • 打卡总天数:833
发表于 2025-11-13 04:29 | 显示全部楼层
内弋是小米的长项。小米一贯的手法。有本事到国外挖人才去啊,不要拆中国人企业墙。
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2025-11-20 15:14 | 显示全部楼层
我正在做情侣用品,只要不加盟,自己做还是可以的,我去年开的店,多边做边学习,渠道想要的可以拿去,个人觉得新手缺的都一点,坚持,第二点自学能力,第三点渠道,除了不是同城,我都乐意分享看到就回
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2026-1-21 11:31 | 显示全部楼层
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:833
发表于 2026-3-17 09:46 | 显示全部楼层
这类广告太荒唐了。
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2026-4-14 10:23 | 显示全部楼层
基础设施不完备,注定的选择,这是回归,本来美国那样脱实向虚的市场就是畸形的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-21 04:56 , Processed in 0.293066 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表