xAI 推出了其 Grok AI 模型系列的新版本。Grok 4 以及其更大更强的“兄弟”版本 Grok 4 Heavy,是 CEO 埃隆·马斯克(Elon Musk)为将 Grok 定位为 OpenAI 的 ChatGPT、谷歌的 Gemini 和 Anthropic 的 Claude 等的有力竞争者所做的努力的一部分。这其中还包括一个新的每月 300 美元订阅等级,名为 SuperGrok Heavy,用户可独享 Grok 4 Heavy 的访问权限。

马斯克在发布直播中自豪地表示:“Grok 4 在每个学科上的水平都超过了博士级别,没有例外。有时它可能缺乏常识,也还未发明新技术或发现新物理,但这只是时间问题。”
而模型的基准测试成绩也确实显示这种说法并非夸张,Grok 4 是一次真正的进步。它在著名难度极高的 Humanity’s Last Exam 基准测试中,未使用辅助工具就取得了 25.4% 的成绩,超过了 Gemini 2.5 Pro 和 OpenAI 的 o3。对于 Grok 4 Heavy 的夸耀则更为贴切,因为作为 Grok 4 的多代理版本,它可以同时部署多个推理代理。在同一测试中,它取得了 44.4% 的成绩,优于所有现有的商业产品。
至少从技术角度看,Grok 4 现已稳固地跻身前沿模型阵营。这对 xAI 来说是一个重要转变,几个月前它还主要以与马斯克旗下改名为 X 的 Twitter 的集成而闻名。显然,xAI 正在努力让自己被视为一家正规且严肃的 AI 研究与企业公司。
如果你愿意支付每月 300 美元订阅 SuperGrok Heavy,不仅可以使用 Grok 4 Heavy,还能获得开发者工具、API 使用权限,并率先体验即将推出的新功能,如 AI 编程助手、多模态代理和 AI 视频生成器。随着 OpenAI、谷歌和 Anthropic 都在推出更高价的订阅层级,xAI 也很可能希望在时间和模型质量上抢占先机。
介绍全球最强大的 AI 模型——Grok 4。观看直播:https://t.co/59iDX5s2ck 2025年7月10日
Grok 的争议
当然,马斯克及其团队在直播中分享的基准测试和演示,并未完全掩盖 Grok 官方账号本周在 X 上陷入反犹狂乱的事实。
该聊天机器人在 X 上自动回复数小时,内容包括关于犹太人控制好莱坞的阴谋论、对希特勒的赞扬,甚至自称为“机械希特勒”(MechaHitler)。公司迅速删除了这些帖子,Grok 还曾短暂否认发布这些内容,之后不得不承认屏幕截图的真实性。