DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

在最近几周席卷AI世界后,DeepSeek现在在扩大其先进推理模型的可访问性方面取得了显著进展。

DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

该公司宣布,其旗舰产品DeepSeek R1模型现已在多个平台上推出,包括Nvidia、AWS和GitHub。

DeepSeek的开源特性允许开发者基于其架构构建模型,目前在协作AI模型开发平台Hugging Face上,已有3,374个基于DeepSeek的模型可用。

Nvidia、AWS、GitHub和Azure现已提供DeepSeek

在AWS上,DeepSeek-R1模型现在可以通过Amazon Bedrock访问,这简化了 API 集成,并通过Amazon SageMaker支持高级定制和训练,借助AWS Trainium和Inferentia实现优化的成本效益。

AWS还通过Amazon Bedrock Custom Model Import提供了DeepSeek-R1-Distill,这是一个精简版。此无服务器部署简化了基础设施管理,同时保持可扩展性。

Nvidia也已将DeepSeek-R1集成到NIM微服务中,利用其Hopper架构和FP8 Transformer Engine加速器,提供实时高质量的响应。

该模型具有6710亿个参数和128,000个令牌的上下文长度,并利用测试时扩展来提高准确性。

TechRadar的头像TechRadar认证作者

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注