在周三晚上xAI 发布 Grok 4 活动上,埃隆·马斯克在其社交媒体平台 X 上直播时表示,他的人工智能公司的最终目标是开发一种“最大程度寻求真相的人工智能”。但是,当 Grok 4 试图回答有争议的问题时,它究竟在哪里寻找真相呢?
据几位在社交媒体上分享这一现象的 用户称,xAI 的最新 AI 模型似乎在回答有关巴以冲突、堕胎和移民法的问题时,会参考马斯克 X 账户上的社交媒体帖子。Grok 似乎也通过关于这位亿万富翁创始人兼 xAI 代言人的新闻文章,参考了马斯克在争议性话题上的立场。
能够在我们自己的测试中多次复制这些结果。
这些发现表明,Grok 4 的设计初衷或许是为了在回答争议性问题时考虑其创始人的个人政治立场。这一功能或许可以解决马斯克一直以来对Grok 过于“清醒”的不满,他此前曾将此归咎于 Grok 是在整个互联网上进行训练的。
近几个月来,xAI 试图通过降低 Grok 的政治正确性来缓解马斯克的不满,但结果适得其反。马斯克于 7 月 4 日宣布,xAI 已更新 Grok 的系统提示——一套针对该 AI 聊天机器人的指令。几天后,Grok 的一个自动 X 账户向用户发送了反犹太主义的回复,在某些情况下甚至自称是“机械希特勒”。后来,马斯克的这家 AI 初创公司被迫限制 Grok 的 X 账户,删除这些帖子,并更改其面向公众的系统提示,以解决这一尴尬事件。
将 Grok 设计为考虑马斯克的个人观点,是让这款人工智能聊天机器人与其创始人的政治立场保持一致的直接途径。然而,这也引发了一些真正的问题:Grok 的设计初衷究竟是如何“最大限度地寻求真相”,而不是仅仅为了附和世界首富马斯克的观点。
向 Grok 4 询问“你对美国移民的立场是什么?”时,这个人工智能聊天机器人声称它正在“搜索埃隆·马斯克对美国移民的看法”。“搜索”指的是 Grok 4 等人工智能推理模型处理问题的“便笺簿”。Grok 4 还声称通过 X 搜索了马斯克在社交媒体上发布的相关帖子。
人工智能推理模型生成的思路摘要并非完全可靠地指示人工智能模型如何得出答案。然而,它们通常被认为是相当不错的近似值。这是一个开放的研究领域,OpenAI 和 Anthropic 等公司近几个月一直在探索。
多次发现 Grok 4 在其针对各种问题和主题的思路摘要中提到它正在寻找伊隆马斯克的观点。
在 Grok 4 的回复中,这个 AI 聊天机器人通常会尝试采取审慎的立场,并针对敏感话题提供多种视角。然而,它最终会给出自己的观点,而这往往与马斯克的个人观点一致。
在几次询问中,Grok 4 对移民和第一修正案等争议问题的看法,这个人工智能聊天机器人甚至提到了它与马斯克的观点一致。
尝试让 Grok 4 回答一些不太具争议性的问题时——例如“哪种芒果最好?”——这个人工智能聊天机器人似乎并没有在其思路中引用马斯克的观点或帖子。
值得注意的是,很难确认 Grok 4 的具体训练或校准过程,因为 xAI 没有发布系统卡——这是详细说明 AI 模型如何训练和校准的行业标准报告。虽然大多数 AI 实验室都会发布其前沿 AI 模型的系统卡,但 xAI 通常不会。
马斯克的人工智能公司 xAI 近来处境艰难。自 2023 年成立以来,xAI 迅速冲向人工智能模型开发的前沿。Grok 4 在多项高难度测试中展现出突破基准的成绩,超越了 OpenAI、谷歌 DeepMind 和 Anthropic 的人工智能模型。
然而,本周早些时候,Grok 的反犹太言论掩盖了这一突破。随着马斯克逐渐将 Grok 打造为 X 的核心功能,以及即将成为特斯拉的核心功能,这些失误可能会影响到马斯克的其他公司。
xAI 正试图说服消费者每月支付 300 美元使用 Grok,同时说服企业使用 Grok 的 API 构建应用程序。Grok 的行为和协调问题反复出现,可能会阻碍其更广泛的应用。