找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 24|回复: 1

[科学观察] 马斯克的Grok“发疯”,奥特曼在线嘲讽,xAI紧急回应

[复制链接]
  • 打卡等级:自成一派
  • 打卡总天数:128
发表于 2025-5-16 22:23 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×


5 月 14 日凌晨,由马斯克的 xAI 推出的 AI 聊天机器人 Grok 出现故障,导致它在 X 平台上回复了大量与“南非白人种族灭绝”(white genocide)相关的信息,即使用户并没有询问此类话题。此外,Grok 还提及了反种族隔离时期的口号“消灭布尔人”(kill the Boer)。
这一事件引发广泛关注,OpenAI CEO 奥特曼显然也不打算放过这次机会,迅速嘲讽了 Grok:
“这事儿有好多可能的解释。我肯定xAI很快会给出一个完整又透明的解释。不过,(Grok 出现这种情况)只能放在南非“白人灭绝”的语境下才能真正理解。作为一个被编程设置为追求最大真相并遵循指令的 AI ……”


YC 创始人 Paul Graham 表示,“Grok 随意发表关于南非白人种族灭绝的观点,在我看来就像刚打了补丁后出现的 bug 行为一样。我真心希望不是这样。如果广泛使用的人工智能被控制者随意评论,那就太糟糕了。”


xAI 很快给出了回应,表示有人未经授权修改了 Grok 的回复提示词,导致它乱说话,以下是 xAI 的完整回应:
我们想向大家通报一下我们的 Grok 机器人昨天在 X 上发生的一起事件。
5 月 14 日凌晨 3 点 15 分左右(太平洋标准时间),有人未经授权修改了 Grok 在 X 平台上的回复提示词。这个修改让 Grok 在回复时专门扯上了一个政治话题,这事儿违反了 xAI 的内部政策和核心价值观。我们已经彻底调查了这件事,还正在实施一些措施,希望能提高 Grok 的透明度和可靠性。
接下来我们要做的事:


  • 从现在开始,我们把 Grok 的系统提示词全部公开在 GitHub 上。大家都可以去看,还能对我们做的每一次提示修改提出意见。我们希望这样能让大家更信任 Grok,相信它是一个追求真相的 AI。


  • 这次的事情绕过了我们原有的代码审查流程。以后,我们会再加一层把关,确保 xAI 的员工不能擅自修改提示,得经过审查才行。


  • 我们还会安排一个 24 小时值守的团队,专门盯着 Grok 的回复。要是自动化系统没发现的问题,这个团队能第一时间察觉并响应。




目前,Grok 已将系统提示公开发布在 GitHub 上,并表示将用于 Grok 聊天助手以及 X 和 grok 的各种产品功能的系统提示定期更新此存储库。



这一事件引发了业内更深层次的讨论。技术新闻网站 404 Media 引用了多位人工智能专家的观点,他们对 X 的 AI 机器人为什么会传播与马斯克政治观点相契合的偏执行为提出了各种理论。但具体是如何发生的,仍然是个谜。
正因如此,人工智能伦理学家和相关技术开发及应用的专家一直在强调对 AI 进行监管以及积极采取措施消除 AI 模型中偏见的必要性。因为如果不这样做,像 Grok 这样的 AI 工具就可能被设计成传播危险的、甚至是种族主义的宣传内容。业内人士称,“马斯克曾声称他的 AI 聊天机器人将摆脱所谓的‘政治正确思维病毒’。从某种程度来看,他似乎成功了,因为他的机器人在毫无意义地传播为支持种族隔离的南非白人辩护的谎言。”
参 考来源 :
https://x.com/sama/status/1923015309113397592?s=46
https://x.com/xai/status/1923183620606619649?s=46
https://www.msnbc.com/top-stories/latest/grok-white-genocide-kill-the-boer-elon-musk-south-africa-rcna207136

  • 打卡等级:自成一派
  • 打卡总天数:177
发表于 2025-5-16 23:03 | 显示全部楼层
谢谢楼主分享!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-5-19 09:01 , Processed in 0.189863 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表