笑忘心 发表于 2025-5-8 13:23

1/8成本比肩Claude 3.7,Mistral Medium 3来了

用1/8成本比肩Claude 3.7,刚刚,“欧洲OpenAI”Mistral AI发布多模态新模型。MistralMedium3,主打编程和多模态理解,且在性能和成本间进行了平衡。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2Fbdc1b741j00svxdz9003pd000oo013im.jpg&thumbnail=660x2147483647&quality=80&type=jpg

官方称,在各类基准测试中,Mistral Medium 3性能达到或超越Claude Sonnet 3.7的90%,且成本大大降低。Claude 3.7 Sonnet的价格为每百万输入token 3美元,每百万输出token 15美元,而Mistral Medium 3:每百万输入token仅0.4美元,每百万输出token 2美元整体性能,不管是和领先开源模型Llama 4 Maverick还是和企业级模型Cohere Command A相比,Mistral Medium 3都能打得有来有回。目前,Mistral Medium 3 API已在Mistral La Plateforme和Amazon Sagemaker上线,不久后还将在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。
具备一系列企业级能力
下面具体来看看基准测试。Mistral Medium 3在编程和STEM任务中尤为突出。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2F84e2c2f3j00svxdz9002bd000u000nxm.jpg&thumbnail=660x2147483647&quality=80&type=jpg

官方原话是“其性能甚至接近非常大且运行速度慢得多的竞争对手”。不过呢,既不开放模型权重,也没有透露模型大小https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2F1c8817d0j00svxdz9000od000oa0064m.jpg&thumbnail=660x2147483647&quality=80&type=jpg

另外,Mistral AI还发布了第三方人类评估。人类评估中,Mistral Medium 3依旧是在编程方面占优势。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2Feb3fcf49j00svxdz90013d000u000i4m.jpg&thumbnail=660x2147483647&quality=80&type=jpg

在多模态和其他人语言任务中,相比Llama 4 Maverick,Mistral Medium 3的表现也占上风。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2Ff0e9e55fj00svxdz9001fd000u000htm.jpg&thumbnail=660x2147483647&quality=80&type=jpg

除了测试数据之外,官方还特别强调了其适应企业环境的能力,包括:

[*]混合部署或本地 / 虚拟私有云(VPC)内部署
[*]定制化后期训练
[*]与企业工具和系统集成

企业可以轻松将智能全面集成到系统中,借助Mistral的应用AI解决方案,该模型可以持续进行预训练、全面微调,并融入企业知识库,使其成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。官方称,金融服务、能源和医疗保健领域的客户正在使用该模型测试,通过深入的背景信息来丰富客户服务、实现业务流程的个性化,并对复杂的数据集进行分析。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2F2032d4c3j00svxdz9001ld000u000jdm.jpg&thumbnail=660x2147483647&quality=80&type=jpg

另外,他们还推出了Le Chat Enterprise,这是一项面向企业的聊天机器人服务,提供了AI Agent建造器之类的工具,并将Mistral的模型与Gmail、Google Drive、SharePoint等第三方服务集成。据了解,Le Chat Enterprise将很快支持 MCP。Mistral Medium 3发布后引发大批网友关注,有网友为其“高性价比”点赞。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2F15fab9a6j00svxdz9000wd000oc006wm.jpg&thumbnail=660x2147483647&quality=80&type=jpg

不过也有不少网友吐槽模型没说开源结果又高调地和开源模型比较,有点奇怪。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2Ffb423e09j00svxdz90010d000om007um.jpg&thumbnail=660x2147483647&quality=80&type=jpg

还有行动派网友,想看什么自己比较。StabilityAI创始人翻出了Gemini 2.5 Flash的基准测试结果:https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2F7463f3dfj00svxdz9001nd000h100p0m.jpg&thumbnail=660x2147483647&quality=80&type=jpg

看后表示:

[*]与Gemini 2.5 Flash竞争是多么困难,Gemini 2.5 Flash成本比Mistral Medium 3低70%。
[*]期待开源模型的发布,这是Mistral的关键优势。

https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2Fabdb4d38j00svxdz9000yd000u0008em.jpg&thumbnail=660x2147483647&quality=80&type=jpg


One More Thing
继三月份推出Mistral Small、今日推出Mistral Medium后,Mistral AI透露接下来几周正着手开发“大型”项目。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0508%2Ff43995f3j00svxdz9000sd000u0006fm.jpg&thumbnail=660x2147483647&quality=80&type=jpg

com2 发表于 2025-5-8 19:36

谢谢楼主分享!

waluheke 发表于 2025-5-8 22:19

厉害
页: [1]
查看完整版本: 1/8成本比肩Claude 3.7,Mistral Medium 3来了