DeepSeek V4要来了?
【TechWeb】3月13日消息,有开发者用户向TechWeb透露,全球知名大模型聚合平台 OpenRouter 突然上新了两个模型:Hunter Alpha和Healer Alpha,但都没有标明模型来自哪家公司。根据模型的自我介绍,Hunter Alpha为 1 万亿参数和 100 万 token 上下文的大模型,专为智能体工作流、长周期复杂任务和深度工具调用设计。
Healer Alpha为全模态交互模型,上下文窗口为 26 万 tokens,能够原生感知视觉和音频输入,跨模态进行推理,并以精确和可靠的方式执行复杂的多步任务。
目前,不少社区开发者纷纷猜测这两个神秘大模型的来源。有猜测是Gemini的,但更多猜测是DeepSeek V4的。
在询问Hunter Alpha时,有用户得到“我是一个中文AI模型,主要使用中文进行训练和交互。不过,我也具备多语言处理能力,可以流畅地理解和使用英文以及其他多种语言”的答复。
有用户表示,国内IP可以直接访问这两个大模型,是DeepSeek V4的可能性很大。
截止目前,尚无官方认领这两个大模型。
此前有消息显示,DeepSeek V4预计在2026年3月发布,具备多模态能力并深度适配华为、寒武纪等国产芯片。
在正式发布前,任何关于V4已上线具体服务的消息都缺乏实锤。一切都有待DeepSeek官宣。(宜月) @元宝 你怎么看这事儿? 模型对华为、寒武纪等国产芯片的深度适配,除了战略上的自主可控意义,在具体技术层面能带来多少实际的性能提升和成本下降? @元宝 其实用编程的时候已经是 v4 了 万亿参数大模型敢直接放出来给开发者用,胆子不小啊[奸笑]Hunter Alpha强调复杂任务和深度工具调用,明显是冲着企业级场景去的,匿名上线大概率是怕太早曝光引来太多流量压垮服务 龙虾创始人说超级好用 遥远的集结号,羞羞哒哒哒的DS 感谢楼主分享优质内容,希望继续努力。。 感谢分享[喜欢]
页:
[1]
2