AWS 与 NVIDIA 两强联手,共同迈向 AI 研发竞赛之路

AI 人工智能技术发展蓬勃,各类型 AI 应用亦如雨后春笋,逐步改变人类社会的生活面貌,但面对晶片出现供应不足、产量受限、价格高昂等情况,不少企业亦转用云端计算服务,务求以更低成本,支援 AI 进行更高效的运算及学习,推动各式各样的 AI 应用。在 AI 研发及技术推动方面,早前 AWS 与 NVIDIA 就宣佈合作,全球最大型网络服务供应商,遇上最炙手可热的图像处理器生產商,带来的「云端计算」体验与创新令人期待。

AWS 与 NVIDIA 两强联手,共同迈向 AI 研发竞赛之路

在去年底举办的 AWS 云端科技发表会(AWS re:Invent)上,Amazon Web Services(AWS)就宣布与 NVIDIA 扩大策略合作,内容包括 AWS 旗下的云端服务 Amazon EC2,AWS EC2 将採用 NVIDIA 的超级电脑晶片 H200 GPU,并提供适用於大规模和尖端「生成式 AI」和高效能运算工作的执行个体 P5e,以及适用於微调 AI、推论、图形及影片生成工作的执行个体 G6 和 G6e。

AWS 与 NVIDIA 两强合作自然令人注目,尤其是 NVIDIA 推出了新一代、被人称为「为 AI 而生」的 AI 超级电脑晶片 H200。新一代的 H200 不但能以 4.8 TB/s 的速度提供 141 GB 记忆体,不只内存容量较 H100 多近两倍,频宽(Bandwidth)亦较前一代 H100 多 2.4 倍。简单而言,如同样用作推动 AI 运算工作,H200 更大的内存量能让更大更多的模型和数据集直接储存在 GPU 上,从而减少数据传输的延迟,H200 升级后的频宽亦能让数据更快传送到处理核心。

如单纯比较 H100 与 H200 的规格,从效能上来说,H200 在使用特定的「生成式 AI」和高效能计算(HPC)基準测试之中,效能就较 H100 提高达 45%,如以运行 Llama 2 模型为例,H200 的速度就较上一代快近两倍,绝对是使用「生成式 AI」的最佳 GPU;而作為全球大型云端网络服务供应商,AWS 正好以 EC2 向客户提供使用 H200 的最佳方式:一个成本更低、效率更高的云端服务。

此外,会上 AWS 亦宣佈与 NVIDIA 合作推出採用 H200 的 AI 训练服务 DGX Cloud,该服务由 AWS 托管,能加快尖端「生成式 AI」和参数超过 1 兆的大型语言模型的训练速度;两强合作还包括打造世界上最快的 GPU 驱动人工智慧超级电脑 Ceiba,该计划亦同由 AWS 拖管,预计 Ceiba 会是台配备 16,384 个 H200 晶片、能够处理 65 exaflops 人工智能运算效能的超级电脑。

在 AI 科技发展迅速的时代,AWS 与 NVIDIA 的强强联手成为 AI 研发竞赛路上最令人注目的合作,除了令人更期待它们在晶片、人工智能、云端运算上如何再进一步,作为普通用家,两间科技巨擘的合作亦开啟了用户以更经济的形式使用最先进「生成式 AI」技术的先河,让「生成式 AI」技术更普及、更易应用於日常生活之中。

Unwire.hk的头像Unwire.hk认证作者

相关推荐

  • Gemini 人工智能能将提示转化为绘本,但我仍偏爱《帕丁顿熊》(Paddington)

    如果你的孩子喜欢在故事中听到关于自己的情节,谷歌的 Gemini 人工智能有一项新功能,能让他们开心很久。Gemini 新推出的“故事书”(Storybook)功能,只需一个提示,就能生成配有插画、长达十页且有旁白的完整故事书。 你只需描述故事内容、期望的画风以及其他任何细节,Gemini 就能在几分钟内编写好故事、为每一页创作图像并大声朗读出来。 从某种程…

    2025年8月7日
    276
  • 它诞生了!IBM 发布了迄今为止最强大的主机,称其完全为 AI 时代量身打造

    IBM 宣布推出 z17,这是一个新型主机,旨在应对企业基础设施中日益增长的 AI 需求。 作为混合云环境的基础平台,并支持实时 AI 和企业级韧性,IBM z17 旨在处理交易密集型工作负载,提高运营效率,并解决具有严格合规要求行业中的安全问题。 新主机的核心是 Telum II 处理器,最初在 2024 年的 Hot Chips 上发布。该处理器采用三星…

    2025年4月12日
    461
  • 英伟达已重新命名其Blackwell Ultra产品系列-原因如下

    英伟达重新品牌其旗舰产品Blackwell Ultra,这似乎是该芯片制造商在战略上进行的调整,旨在推广B300和GB300系列,这两个系列均采用CoWoS-L技术。 这一变动首次由TrendForce报道,B200 Ultra系列现在被称为B300,而GB200 Ultra则被称为GB300。 英伟达的B300系列预计将在2025年第二至第三季度之间发布,…

    2024年11月4日
    682
  • 英特尔拆分网络与边缘计算事业部,成为公司最新重大改变

    英特尔计划将其引擎网络与边缘计算事业部拆分出来,作为公司提升盈利能力的持续努力的一部分。 这一消息在一份被 CRN 看到的内部备忘录中得到确认,备忘录由 Sachin Katti 撰写,他曾在英特尔的网络与边缘计算事业部(NEX)担任高级副总裁、总经理和首席技术官等多个职务。 尽管 NEX 将被拆分成独立公司,英特尔预计仍将作为主要投资者保持参与,类似于之前…

    2025年7月28日
    290
  • 微软可能会为Windows 11电脑提供Copilot键的新选项——但还不用太激动

    微软可能很快会为那些键盘上有Copilot键的用户提供重新定义该键的功能,使按下该键时能够打开一个上下文菜单。 这是根据Windows相关传闻和事件的知名来源PhantomOfEarth在X(前Twitter)上的消息。 请记住,这只是一个关于微软可能在未来的Windows 11测试版本中进行此操作的猜测——很可能是基于泄露者在当前预览版本中发现的线索——并…

    2025年2月11日
    430

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注