DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

在最近几周席卷AI世界后,DeepSeek现在在扩大其先进推理模型的可访问性方面取得了显著进展。

DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

该公司宣布,其旗舰产品DeepSeek R1模型现已在多个平台上推出,包括Nvidia、AWS和GitHub。

DeepSeek的开源特性允许开发者基于其架构构建模型,目前在协作AI模型开发平台Hugging Face上,已有3,374个基于DeepSeek的模型可用。

Nvidia、AWS、GitHub和Azure现已提供DeepSeek

在AWS上,DeepSeek-R1模型现在可以通过Amazon Bedrock访问,这简化了 API 集成,并通过Amazon SageMaker支持高级定制和训练,借助AWS Trainium和Inferentia实现优化的成本效益。

AWS还通过Amazon Bedrock Custom Model Import提供了DeepSeek-R1-Distill,这是一个精简版。此无服务器部署简化了基础设施管理,同时保持可扩展性。

Nvidia也已将DeepSeek-R1集成到NIM微服务中,利用其Hopper架构和FP8 Transformer Engine加速器,提供实时高质量的响应。

该模型具有6710亿个参数和128,000个令牌的上下文长度,并利用测试时扩展来提高准确性。

TechRadar的头像TechRadar认证作者

相关推荐

  • HTC与谷歌合作:智能眼镜的新纪元?

    谷歌似乎正在重新点燃其在智能眼镜领域的雄心,而这一次,它带来了强大的合作伙伴。与HTC的全新合作不仅确保了获得关键专利,还引入了经验丰富的XR开发者。对于曾经设想由计算机眼镜塑造未来的科技巨头来说,这一合作标志着迈出了大胆的一步。那么,我们是如何走到今天的?接下来会发生什么? 起步艰难:谷歌早期的眼镜实验 早在2012年,Google Glass就承诺带来一…

    2025年1月27日
    629
  • 西部数据计划明年推出 40TB 硬盘,采用 HAMR 技术并融合闪存技术

    西部数据(Western Digital)近日举行了一场投资者大会,主要聚焦其未来十年内如何大幅提升硬盘存储容量的战略规划。 WD 展示了一条清晰的技术发展路线图,从能量辅助垂直磁记录(ePMR)过渡到热辅助磁记录(HAMR),最终迈向热点磁记录(HDMR),目标是在未来实现超过 100TB 的硬盘容量。 根据西部数据的规划,到 2026 年,其硬盘容量将通…

    2025年4月24日
    681
  • NVIDIA 加入道琼斯工业平均指数 取代 Intel 原有位置

    近几年 NVIDIA 随着 AI 需求上升而股价暴涨,同时 Intel 则一直下跌,美国道琼斯工业平均指数昨天就宣佈,将会以 NVIDIA 取代 Intel 的位置。 根据 S&P Dow Jones 的声明,NVIDIA 将於 11 月 8 日取代 Intel 加入道琼斯工业平均指数,反映 AI 的蓬勃发展和半导体产业的重大变化。消息公布后,Int…

    2024年11月3日
    427
  • Nvidia 前工程师发现至今最大质数,长达 4,100 万位数

    NVIDIA 前软体工程师 Luke Durant 发现迄今已知最大质数:(2^136,279,841)-1,长达 4,100 万位数。 质数只能被自身和 1 整除,无法被除 1 和本身外的自然数整除,所有人求学阶段都背过 100 内质数表:2、3、5、7、11、13、17、19 等。 为了搜寻巨大质数,一群志愿者团队合作投入“网际网路梅森质数大搜寻”(Gr…

    2024年10月25日
    565
  • 你的 AirPods 可能很快就会拥有这些炫酷新功能

    除了下周苹果全球开发者大会(WWDC)上将发布的 iOS 26 及其他苹果生态系统的重大软件更新外,AirPods 也可能迎来重要的功能升级。最新消息显示,苹果计划为其无线耳机启用多项新功能,其中包括将 AirPods 变成 iPhone 的相机遥控器。 Apple Watch 上的相机遥控功能是其经典且实用的功能之一,允许用户通过蓝牙在近距离内无线控制 i…

    2025年6月6日
    462

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注