AWS 与 NVIDIA 两强联手,共同迈向 AI 研发竞赛之路

AI 人工智能技术发展蓬勃,各类型 AI 应用亦如雨后春笋,逐步改变人类社会的生活面貌,但面对晶片出现供应不足、产量受限、价格高昂等情况,不少企业亦转用云端计算服务,务求以更低成本,支援 AI 进行更高效的运算及学习,推动各式各样的 AI 应用。在 AI 研发及技术推动方面,早前 AWS 与 NVIDIA 就宣佈合作,全球最大型网络服务供应商,遇上最炙手可热的图像处理器生產商,带来的「云端计算」体验与创新令人期待。

AWS 与 NVIDIA 两强联手,共同迈向 AI 研发竞赛之路

在去年底举办的 AWS 云端科技发表会(AWS re:Invent)上,Amazon Web Services(AWS)就宣布与 NVIDIA 扩大策略合作,内容包括 AWS 旗下的云端服务 Amazon EC2,AWS EC2 将採用 NVIDIA 的超级电脑晶片 H200 GPU,并提供适用於大规模和尖端「生成式 AI」和高效能运算工作的执行个体 P5e,以及适用於微调 AI、推论、图形及影片生成工作的执行个体 G6 和 G6e。

AWS 与 NVIDIA 两强合作自然令人注目,尤其是 NVIDIA 推出了新一代、被人称为「为 AI 而生」的 AI 超级电脑晶片 H200。新一代的 H200 不但能以 4.8 TB/s 的速度提供 141 GB 记忆体,不只内存容量较 H100 多近两倍,频宽(Bandwidth)亦较前一代 H100 多 2.4 倍。简单而言,如同样用作推动 AI 运算工作,H200 更大的内存量能让更大更多的模型和数据集直接储存在 GPU 上,从而减少数据传输的延迟,H200 升级后的频宽亦能让数据更快传送到处理核心。

如单纯比较 H100 与 H200 的规格,从效能上来说,H200 在使用特定的「生成式 AI」和高效能计算(HPC)基準测试之中,效能就较 H100 提高达 45%,如以运行 Llama 2 模型为例,H200 的速度就较上一代快近两倍,绝对是使用「生成式 AI」的最佳 GPU;而作為全球大型云端网络服务供应商,AWS 正好以 EC2 向客户提供使用 H200 的最佳方式:一个成本更低、效率更高的云端服务。

此外,会上 AWS 亦宣佈与 NVIDIA 合作推出採用 H200 的 AI 训练服务 DGX Cloud,该服务由 AWS 托管,能加快尖端「生成式 AI」和参数超过 1 兆的大型语言模型的训练速度;两强合作还包括打造世界上最快的 GPU 驱动人工智慧超级电脑 Ceiba,该计划亦同由 AWS 拖管,预计 Ceiba 会是台配备 16,384 个 H200 晶片、能够处理 65 exaflops 人工智能运算效能的超级电脑。

在 AI 科技发展迅速的时代,AWS 与 NVIDIA 的强强联手成为 AI 研发竞赛路上最令人注目的合作,除了令人更期待它们在晶片、人工智能、云端运算上如何再进一步,作为普通用家,两间科技巨擘的合作亦开啟了用户以更经济的形式使用最先进「生成式 AI」技术的先河,让「生成式 AI」技术更普及、更易应用於日常生活之中。

Unwire.hk的头像Unwire.hk认证作者

相关推荐

  • 微软的人工智能助手Copilot几乎可以看到你在做什么

    微软(Microsoft)的人工智能助手Copilot将开始看到你在网上看到的东西。据x网站上的一篇文章称,这家科技巨头在一个月前对Copilot进行了重大改造,其中包括一项名为“Copilot Vision”的功能,该功能只针对注册了Copilot实验室实验中心的特定群体,但现在让人工智能能够看到你屏幕上的所有东西,这将是每个人的选择。 在收集了上个月左右…

    2024年11月5日
    808
  • Galaxy S25 Edge 定价泄露,预计不超越 Galaxy S25 Ultra

    三星今年早些时候预览了 Galaxy S25 Edge,但此后一直对其主要特性和定价保持沉默。不过,在该机即将发布之际,相关爆料不断流出。最新消息称,这款超薄 Galaxy 设备的定价已经被曝光,确认至少基础款不会像 Galaxy S25 Ultra 那样昂贵。 起初,多份报道援引欧洲零售商的信息称,Galaxy S25 Edge 的定价将介于 Galaxy…

    2025年4月29日
    473
  • ChatGPT 正变得越来越聪明,但它的幻觉也在 spiraling(失控)

    “聪明但不可信的人”一直是小说(和历史)中的常见角色。而根据 OpenAI 的一项调查,这种相关性或许同样适用于 AI。《纽约时报》报道指出,自 AI 聊天机器人诞生以来,幻觉(即捏造的事实)和彻头彻尾的虚假信息就一直存在。理论上,模型的不断改进应当能够减少这类现象的发生频率。 OpenAI 最新的旗舰模型 GPT o3 和 o4-mini 旨在模仿人类的逻…

    2025年5月7日
    680
  • 华硕警告:AiCloud 路由器出现新安全漏洞——目前已知信息如下

    华硕(Asus)已经为其路由器固件中的一个严重级别漏洞推出补丁,该漏洞可能被用于远程代码执行(RCE)攻击。鉴于潜在风险,强烈建议用户立即进行更新。 在一份发布的安全公告中,华硕表示已修复 CVE-2025-593656 —— 这是一个影响部分路由器 AiCloud 远程访问/云功能的严重认证绕过漏洞。 问题源自该功能与 Samba 文件共享代码的交互出现缺…

    2025年11月28日
    227
  • 你现在可以使用 Google Docs 编辑客户端加密的微软 Word 文件了

    谷歌宣布了其在线办公套件即将推出的一项实用新功能,用户将能够在 Google Docs 界面中查看和编辑客户端加密(Client-Side Encryption,CSE)的微软 Word (.docx) 文件。 该功能的优势在于,编辑后的文件仍将以原始Word格式保存,使用户能够在 Google Workspace 中继续使用熟悉的 Word 工具和格式。 …

    2025年5月21日
    490

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注