找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 15|回复: 2

[数码资讯] 算法融合人类经验提升智驾性能,清华研究揭示人类与智驾算法视觉注意力的本质差异

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:726
发表于 2026-2-22 09:47 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
清华大学智能产业研究院(AIR)今日宣布,其团队在自然子刊《npj Artificial Intelligence》上发表研究,揭示了人类与智驾算法视觉注意力的本质差异。



清华 AIR 团队通过对比 36 名驾驶员(18 名专家 / 18 名新手)的眼动数据与算法表现,首次量化人类驾驶注意力的三阶段模型。实验要求参与者完成危险检测、可用性识别及异常检测三类任务,数据显示人类任务准确率分别为 0.88、0.86 和 0.98。



研究将人类视觉注意力划分为扫描(刺激驱动)、检查(语义评估)、重新评估(任务驱动)三阶段,其中检查阶段平均持续 705.75 毫秒(专家)和 622.52 毫秒(新手)。当将该阶段注意力特征融入 AxANet 等算法后,异常检测准确率从 0.724 提升至 0.736,轨迹规划误差降低 11.1%(0.72 米 → 0.62 米)。在视觉语言模型测试中,仅细粒度任务(如 3D 描述)因存在“接地鸿沟”获得显著提升。

清华研究人员指出,算法难以自主获取人类通过经验赋予的语义优先级能力。研究提出双阶段伪注意力生成方案,仅需 5 名驾驶员眼动数据即可实现算法优化,使中等规模模型(59.10M 参数)无需大规模预训练即可提升语义理解能力。该方案已在 UniAD 等车载实时系统验证可行性。
  • 打卡等级:自成一派
  • 打卡总天数:186
发表于 2026-2-22 10:24 | 显示全部楼层
希望尽快实现量产
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:728
发表于 2026-2-22 11:40 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-2-22 12:11 , Processed in 0.127755 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表