xAI的Colossus超级计算机集群使用了10万块英伟达Hopper GPU

英伟达揭示了xAI的“巨像”超级计算机集群是如何处理10万个Hopper gpu的——这一切都取决于该芯片制造商的Spectrum-X以太网网络平台。

该公司透露,Spectrum-X旨在通过其远程目录内存访问(RDMA)网络为多租户、超大规模的人工智能工厂提供大规模性能。

xAI的Colossus超级计算机集群使用了10万块英伟达Hopper GPU

该平台从一开始就部署在世界上最大的人工智能超级计算机“巨像”上。这家由埃隆·马斯克(Elon musk)所有的公司一直在使用该集群来训练其Grok系列大型语言模型(llm),这些模型为提供给X用户的聊天机器人提供动力。

该工厂与英伟达(Nvidia)合作仅用了122天就建成了,目前xAI正在对其进行扩建,计划部署总计20万颗英伟达Hopper gpu。

训练Grok需要强大的火力

Grok的人工智能模型非常大,Grok-1可以测量3140亿个参数,Grok-2在8月份推出时的表现超过了Claude 3.5 Sonnet和GPT-4 Turbo。

当然,训练这些模型需要显著的网络性能。使用Nvidia的Spectrum-X平台,xAI记录了零由于“流碰撞”或AI网络路径瓶颈而导致的应用程序遗留退化或数据包丢失。

xAI透露,Spectrum-X的拥塞控制功能使其能够保持95%的数据吞吐量。该公司补充说,这种级别的性能无法通过标准以太网在这种规模下提供。

TechRadar的头像TechRadar认证作者

相关推荐

  • 如果你的 Roku 主页突然变化,不用担心——一款更智能的新布局正在为幸运的少数用户进行测试

    如果你的 Roku 电视主页看起来像是一夜之间被重新设计了,不用担心:这只是意味着你是少数几位被选中体验可能是 Roku 电视界面下一代版本的用户。 正如 The Verge 报道,Roku 正在对少数用户测试重新调整过的主页,以评估他们是否喜欢这款设计。Roku 的 Preston Smalley 解释说,公司“正在尝试不同的主页功能设计方案”,“我们确实…

    2025年6月16日
    630
  • Android 16首个开发者预览版发布:有哪些新功能?

    谷歌正式发布了Android 16的首个开发者预览版,标志着其在加速Android设备操作系统更新方面的一项大胆新举措。我们已经详细探索了Android 16 DP1,以下是即将发布的下一个重大版本中的一些亮点功能。 Android 16何时发布? 根据谷歌的说法,首个开发者预览版标志着Android 16推出的起点,第二个开发者预览版定于12月发布。 第一…

    2024年11月28日
    531
  • 龙芯 7 奈米处理器采用 Tock-Tock2-Tick 策略,缩小与英特尔差距

    中国处理器(CPU)制造商龙芯科技声称在原始效能方面,正快速缩小与西方的差距。快科技报导,龙芯第四代产品采用「Tock-Tock2-Tick」策略来加速创新。 龙芯过去一直从英特尔摄取灵感,利用 Tick-Tock 策略,在过去三代 CPU 上进行创新。Tock 指架构创新,即围绕现有的处理制程设计新的晶片架构;Tick 代表将现有的架构移植到新的设计节点。…

    2024年11月1日
    730
  • Meta AI 登场,旨在对标 ChatGPT,并为你的 Ray-Ban Meta 智能眼镜带来全新的 AI 升级

    Meta AI 正在迈入自己的领域,推出了一款全新的独立应用程序。该应用由 Meta 最新的 Llama 4 AI 模型驱动,既是一个全新的产品,同时也取代了此前用于连接 Ray-Ban Meta 智能眼镜的 Meta View 应用。 Meta 正在大力推广这项产品,强调语音交互是与 AI 沟通最直观、最自然的方式。该应用支持免手操作的聊天功能,甚至还包括…

    2025年4月30日
    710
  • 新的三星三折叠手机泄露信息再次暗示了“G Fold”手机可能的尺寸

    三星确认正在研发一款三折叠手机,尽管我们还没有太多关于它的细节,但最新的泄露信息为我们提供了一些关于屏幕尺寸的更多信息。 这个消息来自知名博主数码闲聊站(通过 Notebookcheck),他说这款手机的主屏幕尺寸大约为 9.9 英寸。这比华为 Mate XT 三折叠手机的 10.2 英寸显示屏略小。 这也与之前关于这款三星设备的传闻相符:这些传闻预测主屏幕…

    2025年4月26日
    814

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注