xAI 推出强大的 Grok 4 人工智能模型,但这无法让人们忘记它在 X 上散布的反犹言论

xAI 推出了其 Grok AI 模型系列的新版本。Grok 4 以及其更大更强的“兄弟”版本 Grok 4 Heavy,是 CEO 埃隆·马斯克(Elon Musk)为将 Grok 定位为 OpenAI 的 ChatGPT、谷歌的 Gemini 和 Anthropic 的 Claude 等的有力竞争者所做的努力的一部分。这其中还包括一个新的每月 300 美元订阅等级,名为 SuperGrok Heavy,用户可独享 Grok 4 Heavy 的访问权限。

xAI 推出强大的 Grok 4 人工智能模型,但这无法让人们忘记它在 X 上散布的反犹言论

马斯克在发布直播中自豪地表示:“Grok 4 在每个学科上的水平都超过了博士级别,没有例外。有时它可能缺乏常识,也还未发明新技术或发现新物理,但这只是时间问题。”

而模型的基准测试成绩也确实显示这种说法并非夸张,Grok 4 是一次真正的进步。它在著名难度极高的 Humanity’s Last Exam 基准测试中,未使用辅助工具就取得了 25.4% 的成绩,超过了 Gemini 2.5 Pro 和 OpenAI 的 o3。对于 Grok 4 Heavy 的夸耀则更为贴切,因为作为 Grok 4 的多代理版本,它可以同时部署多个推理代理。在同一测试中,它取得了 44.4% 的成绩,优于所有现有的商业产品。

至少从技术角度看,Grok 4 现已稳固地跻身前沿模型阵营。这对 xAI 来说是一个重要转变,几个月前它还主要以与马斯克旗下改名为 X 的 Twitter 的集成而闻名。显然,xAI 正在努力让自己被视为一家正规且严肃的 AI 研究与企业公司。

如果你愿意支付每月 300 美元订阅 SuperGrok Heavy,不仅可以使用 Grok 4 Heavy,还能获得开发者工具、API 使用权限,并率先体验即将推出的新功能,如 AI 编程助手、多模态代理和 AI 视频生成器。随着 OpenAI、谷歌和 Anthropic 都在推出更高价的订阅层级,xAI 也很可能希望在时间和模型质量上抢占先机。

介绍全球最强大的 AI 模型——Grok 4。观看直播:https://t.co/59iDX5s2ck 2025年7月10日

Grok 的争议

当然,马斯克及其团队在直播中分享的基准测试和演示,并未完全掩盖 Grok 官方账号本周在 X 上陷入反犹狂乱的事实。

该聊天机器人在 X 上自动回复数小时,内容包括关于犹太人控制好莱坞的阴谋论、对希特勒的赞扬,甚至自称为“机械希特勒”(MechaHitler)。公司迅速删除了这些帖子,Grok 还曾短暂否认发布这些内容,之后不得不承认屏幕截图的真实性。

TechRadar的头像TechRadar认证作者

相关推荐

  • 更智能的睡眠:SmartThings 与三星健康集成

    三星正在更新其智能家居平台 SmartThings,进行重要的功能和升级,这是其承诺的季度更新的一部分。最值得注意的改进包括将三星健康(Samsung Health)集成进来,以提供更个性化的自动化功能、在应用内进行直接音频广播,以及扩展的 Matter 兼容性。 SmartThings 一直是三星及兼容智能家居设备的首选智能家居管理平台。这次更新增强了与三…

    2025年4月11日
    271
  • AI像素截图应用在新更新中获得重大提升

    Pixel截图应用程序是Pixel 9系列引入的人工智能功能之一。这款应用程序允许用户捕捉屏幕截图或上传图像,并保存可以稍后或通过Gemini检索的细节。最近的更新带来了一些改进,增强了应用程序的可用性。 像素截图获得增强的手势和快捷方式 这些改进将在应用程序版本0.24.373.08中实现。一个值得注意的更新是重新设计的主页,它现在按时间顺序显示所有截图和…

    2024年11月6日
    299
  • 测试显示,ChatGPT-5 的幻觉率低于 GPT-4o —— 而 Grok 依然是“胡编乱造之王”

    上周四,OpenAI 推出了 ChatGPT-5,CEO Sam Altman 在发布会上重点强调,这一代是“我们有史以来推出的最强大、最智能、最快速、最可靠、最稳健的 ChatGPT 版本”,同时 OpenAI 团队也表示,ChatGPT-5 将“缓解幻觉问题”。 在 AI 领域,当模型胡编乱造时,这种现象被称为“幻觉”(hallucination)。虽然…

    2025年8月11日
    146
  • OpenAI 刚刚宣布了重大消息,但这不是 GPT-5

    OpenAI 刚刚发布了两款全新的 AI 模型——gpt‑oss‑120b 和 gpt‑oss‑20b。它们不仅是新模型,更是自 GPT-2 以来,ChatGPT 创造者首次推出的开源权重模型。 其中较小的 gpt-oss-20b 尤为引人注目,因为它足够轻量,可以在配置较好的普通消费级电脑上运行。如果你有大约16GB内存并且耐心足够,就可以加载它,向它提问…

    2025年8月6日
    106
  • 摩托罗拉全新 Moto G Stylus 升级登场——无需“Ultra”价格也更出色

    如果你正在寻找一款内置手写笔支持的智能手机,目前的选择基本上还是集中在三星的 Galaxy S Ultra 系列以及摩托罗拉的中端机型 Moto G Stylus。虽然它不具备三星旗舰机型的高端配置,但 Moto G Stylus 却是一个更加实惠的选择。现在,摩托罗拉推出了最新款——Moto G Stylus (2025),带来了多个显著升级。 Moto …

    2025年4月9日
    308

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注