Claude Opus 4.5 现已上线,在日常任务和编程挑战中“实质性更优秀”

Anthropic 正在对其最新一代 Claude 系列 AI 模型做出一个重要承诺。该公司表示,全新的 Claude Opus 4.5 “在实质上优于”此前的版本 —— 这一点颇为有趣,特别是考虑到 Anthropic CEO 在谈论 AI 未来时所持的悲观态度。

Claude Opus 4.5 现已上线,在日常任务和编程挑战中“实质性更优秀”

这次针对公司旗舰级人工智能引擎的升级现已向 Claude Pro 用户和企业客户开放,它毫不掩饰自己的雄心。新模型旨在具备更强的推理能力、更高的任务完成效率,并能在用户真实提出的任务清单中表现得更加稳定可靠。此外,Anthropic 也宣称它在编程方面的表现将远超竞争对手。

Claude Opus 4.5 是继中型模型 Claude Sonnet 和轻量级 Claude Haiku 4.5 发布之后推出的版本。根据负责 Claude.ai 产品的 Scott White 所说,团队对这一成果及快速迭代速度“感到难以置信的兴奋”。

这种兴奋如今被注入到了一个模型中。Anthropic 表示,新版本能够更快写代码、解决更困难的推理问题,并以更好的一致性处理多步骤工作流程,同时减少计算资源消耗。Claude Opus 4.5 的目标不是在图灵测试晚宴中取胜,而是成为那个默默让你的工作更轻松、或至少能展现其强大解题能力的模型。

对于日常用户来说,最直接的差别可能在于模型在处理实际任务时几乎没有阻力。Claude 4.5 应该能够执行你的提示,无论它们起初多么零散混乱。比如让它将一个大纲整理成格式化的幻灯片,它都能轻松完成。

将 Opus 4.5 与早期版本以及来自 OpenAI、Google 等竞争对手的模型区分开来的,是 Anthropic 对大规模可用性的关注。在幕后,团队一直在优化 Claude,使其能够更高效地处理更长的上下文、更复杂的提示以及连锁任务,同时无需大幅增加成本和时间。这种组合可能让它特别具有吸引力。

Claude 的实力

真正的亮点可能在于这一版本在处理多模态任务上的表现。虽然它还不能像处理视频或音频输入那样完全多模态,但 Opus 4.5 在生成可视化输出(如图表和表格)以及理解复杂格式要求方面表现更好。

一个更微妙但可能更重要的升级,是 Claude 与其他应用和服务的交互能力。Anthropic 指出,4.5 在需要充当代理并调用其他工具、按步骤执行指令以及在复杂思路链中保持上下文时,表现得更出色。

需要明确的是,没有任何 AI 模型能够做到完美。即便是 Claude 4.5 仍然存在盲点和偶尔的瑕疵。但其承诺在于让你在日常使用中真正感受到进步——这是“在模型帮助下完成工作”和“花更多时间修正它试图做的事”之间的区别。

其开发速度令人惊讶。Claude 4.0 仅在几个月前推出时就收获了广泛好评,而现在 4.5 已经发布,5.0 很可能也不远了。这种迭代周期可能让人感觉有些压倒性,但也显示了技术上的快速进步,以及一个日趋成熟的市场——升级不仅仅是为了炫技。

如果 Claude Opus 4.5 能够达到预期,它不需要通过炫目的功能赢得用户。它会通过每一次都高质量地完成工作来取胜,并且足够流畅,让你几乎不会意识到它是 AI。对于一个号称“实质性更优秀”的模型来说,这或许才是最具意义的成果。

TechRadar的头像TechRadar认证作者

相关推荐

  • Insta360 为其旗舰 360 相机推出重大固件更新和全新配件,让这款最佳相机变得更出色

    我是 Insta360 X5 的超级粉丝,在我今年早些时候的评测中称它为“目前市场上最出色的全能360相机”。它的大型图像传感器让我成为首个愿意在夜间使用的 360 相机用户,镜头比以往更坚固(如果损坏也更易更换),简单的操作和 AI 辅助编辑让使用体验非常愉快。 但 Insta360 并没有满足于 X5 现有的成就。继几周前发布的令人印象深刻的 Insta…

    2025年7月16日
    461
  • 新的无风扇冷却技术通过将冷却功耗降低90%来提高AI工作负载的能源效率

    惠普企业(HPE)最近举办了2024年人工智能日活动,推出了业界首个100%无风扇直接液冷架构。 运行大规模人工智能工作负载的组织现在正在寻找更高效的解决方案来管理其基础设施的能源需求,惠普率先推出了直接液体冷却技术,这已成为冷却高性能人工智能系统的最有效方法之一。这种方法使惠普能够交付绿色500强名单上十大最节能超级计算机中的七台。 100%无风扇直接液冷…

    2024年11月10日
    731
  • 专门做家务的 AI 机械人模型 π0 影片示范洗衣服、折叠衣服、收拾凌乱桌面

    AI在围棋对弈、医学研发等复杂领域中,屡次展现出超越人类的能力,但在简单的日常任务上,机器仍面对挑战。为了解决此一难题,专注于基盘模型和学习演算法开发的公司 Physical Intelligence,经过 8 个月的研究,推出一项帆用机械人基盘模型「π0」,目标是支援多种任务的机械人操作需求。今次他们就示范了利用机械人来折叠衣服、收拾台面、组装箱子。 Ph…

    2024年11月3日
    1.1K
  • 小米智能手环9即将发布?

    今年9月,小米推出了物美价廉的智能手环9,这是一款功能丰富的健身追踪器。在国际市场发布之后,小米现在似乎准备向全球市场推出一款更实惠的智能手环9 Active。 小米智能手环9 Active的全球可用性和定价 一些认证和列表暗示即将在全球上市的Smart Band 9 Active。值得注意的是,Tech Outlook最近在马来西亚发现了型号为M2435B…

    2024年11月6日
    776
  • Gemini将控制Galaxy设备上的三星应用

    Gemini现在处于安卓生态系统的前沿,深度集成了谷歌的应用和服务。然而,它与第三方应用的功能仍然有限——目前是这样。不过,这种情况可能会随着即将发布的Galaxy S25发生变化,泄露的资料显示Gemini将控制三星的原生应用。 知名博主Chun Bhai最近在X平台上分享了截图,展示了Gemini与三星设备上应用互动的新功能。这些应用包括三星笔记、三星日…

    2025年1月19日
    740

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注