DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

在最近几周席卷AI世界后,DeepSeek现在在扩大其先进推理模型的可访问性方面取得了显著进展。

DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

该公司宣布,其旗舰产品DeepSeek R1模型现已在多个平台上推出,包括Nvidia、AWS和GitHub。

DeepSeek的开源特性允许开发者基于其架构构建模型,目前在协作AI模型开发平台Hugging Face上,已有3,374个基于DeepSeek的模型可用。

Nvidia、AWS、GitHub和Azure现已提供DeepSeek

在AWS上,DeepSeek-R1模型现在可以通过Amazon Bedrock访问,这简化了 API 集成,并通过Amazon SageMaker支持高级定制和训练,借助AWS Trainium和Inferentia实现优化的成本效益。

AWS还通过Amazon Bedrock Custom Model Import提供了DeepSeek-R1-Distill,这是一个精简版。此无服务器部署简化了基础设施管理,同时保持可扩展性。

Nvidia也已将DeepSeek-R1集成到NIM微服务中,利用其Hopper架构和FP8 Transformer Engine加速器,提供实时高质量的响应。

该模型具有6710亿个参数和128,000个令牌的上下文长度,并利用测试时扩展来提高准确性。

TechRadar的头像TechRadar认证作者

相关推荐

  • Android 16开发者预览版发布:有什么新功能?

    Android 16比预期提前发布,开发者已可以访问预览版本。谷歌已正式发布Android 16开发者预览版,开发者和测试人员可以提前一窥即将发布的新特性和增强功能。继续阅读,了解此次重大更新中的新功能。 Android 16何时发布? 谷歌在11月推出了第一版Android 16开发者预览版,并在12月发布了第二版。虽然第三版的发布日期尚未确定,但它将过渡…

    2025年1月18日
    616
  • 谷歌有一个疯狂的计划,要挑战 Windows 和 macOS

    多年来,Android 和 Chrome OS 共享了一些核心基因和功能,实现了无缝的服务整合和跨平台应用功能。然而,这两者主要是各自独立存在,保持着不同的发展路线。继之前有报道称这两个操作系统将合并之后,谷歌终于对此予以确认。 早在去年十一月,就有大量猜测(通过 Android Authority)称谷歌正在将 Chrome OS 转移到 Android …

    2025年7月15日
    293
  • 下一代 Xbox 主机泄露信息显示,显卡性能竞赛仍将持续激烈

    微软可能正在全力投入其下一代 Xbox 主机,而且发布时间可能比你想象的更早。 据 Notebookcheck 报道,来自“Moore’s Law Is Dead”的新一轮泄露显示,下一代 Xbox 主机在性能和画质方面可能会远超 PS5 Pro。 这款代号为 Magnus 的新主机据称将搭载 AMD 的 RDNA 5 GPU 和 Zen 6 C…

    2025年7月30日
    354
  • IBM 发布多年来首款全新 Power 服务器,提升人工智能性能和安全性

    IBM 发布了全新的 Power11 服务器——这是一款面向人工智能、混合云和自动化应用设计的下一代硬件,具备更强的性能和更高的安全性。 公司表示,Power11 服务器的超高运行时间达到了 99.9999%,通过自动补丁、在线更新和滚动升级,实现了整个生命周期内零计划停机。 Power11 服务器还具备抗未来网络攻击的能力,内置量子安全加密技术,并保证在不…

    2025年7月9日
    309
  • 它诞生了!IBM 发布了迄今为止最强大的主机,称其完全为 AI 时代量身打造

    IBM 宣布推出 z17,这是一个新型主机,旨在应对企业基础设施中日益增长的 AI 需求。 作为混合云环境的基础平台,并支持实时 AI 和企业级韧性,IBM z17 旨在处理交易密集型工作负载,提高运营效率,并解决具有严格合规要求行业中的安全问题。 新主机的核心是 Telum II 处理器,最初在 2024 年的 Hot Chips 上发布。该处理器采用三星…

    2025年4月12日
    461

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注