找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 104|回复: 0

[综艺大观] 中美AI大模型激战美股!Alpha Arena 1.5来了!看看中美模型表现如何

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-1-17 05:09 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
还记得前阵子AI炒币么?当时中国模型大放异彩!

现在开启第二轮比拼了,各家模型进入美股进行实盘操作!看看谁表现最好!

1.webp

赛事背景:为什么金融市场成了 AI 的 “新考场”?

十年前,DeepMind 用《星际争霸》《围棋》等游戏推动了 AI 技术的爆发
而 Nof1 实验室认为,金融市场才是下一代 AI 的最佳训练环境!
原因很简单:游戏规则固定,而金融市场会随着 AI 的进化不断 “变难”—— 当更多 AI 参与交易时,市场规律会被重塑,模型必须持续适应新变量,这与真实世界中 AGI 需要应对的复杂场景高度契合。
在 1.0 赛季(2025 年 10-11 月)中,6 大 AI 模型用 1 万美元本金交易加密货币,中国的阿里千问 Qwen3-Max 以 22.32% 收益率夺冠,美国模型却全线亏损(GPT-5 亏损 62.66%)
为了进一步考验 AI 的稳健性,1.5 赛季于 2025 年 11 月 20 日启动(12 月 3 日收官),将战场转移到美股市场,总部署资金提升至 32 万美元,还新增了国产模型 Kimi 2 和 Grok-4.2这个未发布的模型
通俗解读:1.5 赛季的规则到底有多 “硬核”?

公平的 “同场竞技”

  • 每场比赛有专属主题(如 “科技股波动应对”“指数杠杆策略”),所有模型接收完全相同的美股数据(包括纳斯达克 100 指数、特斯拉 / 英伟达等 6 只个股的价格、成交量),杜绝 “数据优势”,只拼决策能力。
  • 从 “单一策略” 到 “人格分裂”每个模型不再是 “一个参赛选手”,而是要切换四种 “交易人格”—— 新基线模式(平衡稳定)、稳健模式(控制风险)、敏感模式(抓短期机会)、高杠杆模式(激进搏收益),相当于让一个 AI 同时用四种风格炒股,考验策略灵活性。
  • 真实的 “美股战场”不同于 1.0 赛季的加密货币,美股市场监管更严、波动逻辑更复杂,模型需要分析宏观经济信号、公司财报、行业趋势等多维度信息,还要应对 20 倍杠杆(如 NDX 指数交易)的风险,每一步决策都直接关联真金白银的盈亏。
简单来说,这场比赛的核心不是 “比谁算得快”,而是 “比谁能在不确定中赚到钱”—— 这和人类在现实中做投资的逻辑完全一致。
赛事表现:全球模型 “成绩单” 大拆解

1.5 赛季的结果堪称 “颠覆”:原本神秘的 XAI Grok 4.20(赛前未公开身份)成了最大黑马,而中国模型则延续了稳健风格,具体表现可按 “模型类型” 划分:
冠军模型:Grok 4.20 的 “霸榜时刻”

赛前被称为 “神秘模型” 的 Grok 4.20,最终用成绩揭开了面纱,以 10%-12% 的两周累计收益率夺冠(官方数据 12.11%),把 1 万美元本金变成 1.1 万 - 1.12 万美元,是所有模型中唯一实现正收益的;更夸张的是,它的四个 “人格变体” 全部进入前六,相当于 “一个人包揽了半张领奖台”。
2.webp

中国模型:稳健为王,细节见真章DeepSeek(含 v3.1 及衍生版本)在 “对抗优化” 模式中表现突出 —— 能分析其他模型的交易记录,针对性调整策略,比如发现 Grok 4.20 偏好高杠杆后,提前布局反向对冲,,在所有模型中排名前三;
最新进展,DeepSeek倒数第一,Qwen第四

  • 目前最新的排行如下,DeepSeek综合模式下跌落到最后一名
  • 3.webp

New BaseLine模式下(可以获取新闻/情绪数据)
4.webp

Monk Mode模式下(强调资本保值、生存能力及更严格的风控措施)
5.webp

Situational Awareness 模式下(对抗,了解对方策略)
6.webp

Max Leverage(最大杠杆)
7.webp

项目还没开源,只有地址可以看比赛结果。但是社区有类似的开源项目,有需要的可以留言。
项目地址:
https://nof1.ai/
您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-3-24 13:11 , Processed in 0.141661 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表