找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 34|回复: 5

[数码资讯] 微软发布 Harrier 系列嵌入 AI 模型,MTEB-v2 基准测试超越谷歌夺冠

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:772
发表于 2026-4-9 08:23 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
微软必应(Bing)团队于 4 月 7 日发布博文,宣布为满足现代 AI 智能体系统对信息处理的高标准需求,开源推出业界领先的文本嵌入模型系列 Harrier,该模型在多语言 MTEB-v2 基准测试中排名第一。

IT之家注:嵌入模型是一种将文本、图像等高维数据转换为低维向量表示的技术,捕捉数据的语义特征,让相似内容在向量空间中距离更近。

在 AI 领域,它是搜索引擎、推荐系统和智能体进行信息检索、语义理解和知识推理的基础组件,直接决定了系统处理信息的质量与效率。

针对 AI 系统从单纯问答向执行操作转变过程中的“落地”难题,微软 Harrier 系列模型进一步提升嵌入质量,显著提升首次检索的事实准确率,降低系统延迟与成本,并有效减少模型幻觉,从而增强用户信任。

此次发布的 Harrier 系列包含三个版本:Harrier-OSS-v1-27B、Harrier-OSS-v1-0.6B 和 Harrier-OSS-v1-270M。所有型号均支持超过 100 种语言,具备 32k 上下文窗口,并能为任意输入生成固定尺寸的嵌入向量。

技术实现上,团队构建了可扩展的数据管道,利用 GPT-5 生成了超 20 亿个弱监督数据样本用于对比预训练,以及超 1000 万个高质量样本用于微调。

在训练策略上,团队为适配低端设备的部署需求,基于 E5 及 GritLM 等前期成果,在旗舰模型训练完成后,通过知识蒸馏技术推出了 Harrier-OSS-v1-0.6b 与 Harrier-OSS-v1-270m 两个轻量级版本。

在权威的多语言 MTEB-v2 基准测试中,Harrier 模型成功超越谷歌 Gemini Embedding 2,位列行业第一。



与竞品相比,Harrier 模型不仅性能优异,更采用完全开源策略。开发者可在无许可限制的情况下使用该模型,从而轻松提升 AI 应用的检索质量与语义理解能力。





基于 Harrier 的技术积累,微软正开发全新的检索服务。该服务将提供更优质的检索质量、更强的语义理解能力以及更稳健的上下文选择,未来将率先应用于必应搜索,以提升用户交互体验。
  • 打卡等级:已臻大成
  • 打卡总天数:467
发表于 2026-4-9 08:28 | 显示全部楼层
看看
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:471
发表于 2026-4-9 09:52 | 显示全部楼层
谢谢楼主分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:774
发表于 2026-4-9 09:56 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:761
发表于 2026-4-9 10:12 | 显示全部楼层
谢谢分享。
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:198
发表于 2026-4-9 11:32 | 显示全部楼层
111111
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-9 14:18 , Processed in 0.173640 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表