xAI的Colossus超级计算机集群使用了10万块英伟达Hopper GPU

英伟达揭示了xAI的“巨像”超级计算机集群是如何处理10万个Hopper gpu的——这一切都取决于该芯片制造商的Spectrum-X以太网网络平台。

该公司透露,Spectrum-X旨在通过其远程目录内存访问(RDMA)网络为多租户、超大规模的人工智能工厂提供大规模性能。

xAI的Colossus超级计算机集群使用了10万块英伟达Hopper GPU

该平台从一开始就部署在世界上最大的人工智能超级计算机“巨像”上。这家由埃隆·马斯克(Elon musk)所有的公司一直在使用该集群来训练其Grok系列大型语言模型(llm),这些模型为提供给X用户的聊天机器人提供动力。

该工厂与英伟达(Nvidia)合作仅用了122天就建成了,目前xAI正在对其进行扩建,计划部署总计20万颗英伟达Hopper gpu。

训练Grok需要强大的火力

Grok的人工智能模型非常大,Grok-1可以测量3140亿个参数,Grok-2在8月份推出时的表现超过了Claude 3.5 Sonnet和GPT-4 Turbo。

当然,训练这些模型需要显著的网络性能。使用Nvidia的Spectrum-X平台,xAI记录了零由于“流碰撞”或AI网络路径瓶颈而导致的应用程序遗留退化或数据包丢失。

xAI透露,Spectrum-X的拥塞控制功能使其能够保持95%的数据吞吐量。该公司补充说,这种级别的性能无法通过标准以太网在这种规模下提供。

TechRadar的头像TechRadar认证作者

相关推荐

  • Moto AI登陆这些摩托罗拉设备

    继去年推出Moto AI并在本月初预览后,摩托罗拉正式开始向部分摩托罗拉智能手机推送Moto AI平台的测试版。首批功能基于AI技术,但目前仅限部分用户通过测试计划体验。 摩托罗拉是首批拥抱 AI 热潮的安卓制造商之一。虽然Moto AI在2023年首次公布,但其发布进度比三星和一加等竞争对手稍显缓慢。 摩托罗拉在X平台上表示,Moto AI的测试版已开始推…

    2024年11月28日
    1.0K
  • 据传,Steam Deck 2 和一款家用游戏主机正在开发中——而索尼可能正在助力将这款掌机变成我真正想要的便携式 PlayStation 游戏设备

    自 2022 年推出以来,Valve 的 Steam Deck 大获成功并不令人意外。它提供多种配置、价格亲民,加上备受欢迎的 SteamOS 系统,自然吸引了大量用户。而现在,有新的传言表明,Valve 对继任产品的计划可能比我们预期的还要宏大。 根据 NotebookCheck 报道,有传言称 Valve 正在研发 Steam Deck 的继任机型以及一…

    2025年7月23日
    576
  • 谷歌最新的 Gemini AI 模型意味着你的未来机器人管家即使没有 Wi-Fi 也能正常工作

    多年来,我们一直被承诺将拥有能够帮你叠衣服、切洋葱,甚至像我们最喜欢的古装剧中那样说出妙语连珠的机器人管家。但这些承诺从未提到一个问题——不小心拔掉路由器可能会让那个机械管家瘫痪。谷歌声称,其最新的 Gemini AI 模型解决了这个问题。 谷歌 DeepMind 推出了新的 Gemini 机器人端侧AI模型,旨在让机器人在电力中断和偏远地区工作时保持安全。…

    2025年6月26日
    505
  • Android 16开发者预览版发布:有什么新功能?

    Android 16比预期提前发布,开发者已可以访问预览版本。谷歌已正式发布Android 16开发者预览版,开发者和测试人员可以提前一窥即将发布的新特性和增强功能。继续阅读,了解此次重大更新中的新功能。 Android 16何时发布? 谷歌在11月推出了第一版Android 16开发者预览版,并在12月发布了第二版。虽然第三版的发布日期尚未确定,但它将过渡…

    2025年1月18日
    761
  • One UI 7:抢先预览最大的新功能

    基于Android 15的One UI 7更新已正式推迟至2025年初发布,尽管Beta测试计划可能会在12月启动。虽然新的消息已经展示了One UI 7的预览,官方的信息也开始浮出水面,确认了此次更新中最令人兴奋的新功能和变化。 One UI 7功能和兼容性 其他随Android 15发布的升级 One UI 7兼容性 在我们深入了解更多细节之前,先来看看…

    2024年12月1日
    923

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注