DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

在最近几周席卷AI世界后,DeepSeek现在在扩大其先进推理模型的可访问性方面取得了显著进展。

DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

该公司宣布,其旗舰产品DeepSeek R1模型现已在多个平台上推出,包括Nvidia、AWS和GitHub。

DeepSeek的开源特性允许开发者基于其架构构建模型,目前在协作AI模型开发平台Hugging Face上,已有3,374个基于DeepSeek的模型可用。

Nvidia、AWS、GitHub和Azure现已提供DeepSeek

在AWS上,DeepSeek-R1模型现在可以通过Amazon Bedrock访问,这简化了 API 集成,并通过Amazon SageMaker支持高级定制和训练,借助AWS Trainium和Inferentia实现优化的成本效益。

AWS还通过Amazon Bedrock Custom Model Import提供了DeepSeek-R1-Distill,这是一个精简版。此无服务器部署简化了基础设施管理,同时保持可扩展性。

Nvidia也已将DeepSeek-R1集成到NIM微服务中,利用其Hopper架构和FP8 Transformer Engine加速器,提供实时高质量的响应。

该模型具有6710亿个参数和128,000个令牌的上下文长度,并利用测试时扩展来提高准确性。

TechRadar的头像TechRadar认证作者

相关推荐

  • iOS 18.2:苹果揭示用户如何提前测试新的人工智能功能

    虽然苹果将于 本周发布带有第一波Apple Intelligence功能的iOS 18.1 ,但它还提供了有关iOS 18.2更新的详细信息,该更新已确认将在“未来几周”发布。它还指出了用户如何通过更新访问新的人工智能功能,包括Image Playground和Image Wand (iPadOS)。 苹果上周向开发者发布了iOS 18.2和iPadOS 1…

    2024年10月29日
    638
  • 微软研究声称 AI 仍然难以调试软件

    尽管生成式 AI 正在越来越多地融入编程工作流程,但微软的最新研究表明,在调试方面,大型语言模型仍然难以满足要求。 研究表明,即便是先进的模型,在处理对于经验丰富的开发者来说相当简单的调试任务时,依然存在困难,这突显了人类程序员的重要性。 然而,AI 似乎确实有着可靠的应用场景,谷歌现在声称,大约 25% 的新代码是 AI 生成的。Meta 也指出了 AI …

    2025年4月11日
    772
  • 联发科新款CPU让折叠智能手机更具性价比

    联发科最近宣布了两款新的5G智能手机芯片。新的Dimensity 7400和6400承诺为入门级智能手机提供足够的性能,同时不会牺牲电池续航。如你所料,随着现代科技发布的普遍趋势,这些芯片也配备了执行人工智能所需的相关处理资源。不过,7400X型号的规格暗示,未来可能会有价格亲民的折叠屏智能手机。 就在我们以为“人工智能革命”相关芯片发布的热潮已经过去时,联…

    2025年2月28日
    661
  • 谷歌超级强大的arm处理器现已上市,但这款数据中心的神秘芯片永远不会上市销售,谷歌也不会透露它有多少核

    谷歌在Google Next ’24上发布了Axion处理器,展示了基于Neoverse V2架构的定制arm cpu,旨在支持广泛的数据中心工作负载,包括web服务器、媒体处理和人工智能应用程序。 谷歌的主要云计算竞争对手亚马逊和微软已经有了自己的基于Arm技术的cpu,但在发布会上,谷歌表示,其芯片的性能将比目前的Arm实例提高30%,与类似…

    2024年11月6日
    579
  • Apple 将收购 Pixelmator 人气图片编辑工具纳入旗下

    虽然 Adobe 的 Photoshop 和 Lightroom 相当普及,但仍然有一些优秀的竞争对手。其中 Pixelmator 最近宣佈与 Apple 达成收购协议,将会被纳入旗下。 Pixelmator 现时的 Pixelmator Pro、Pixelmator for iOS 和 Photomator 都是相当受欢迎的 Photoshop/Light…

    2024年11月3日
    588

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注