GPT-5 刚刚以新的世界纪录时间通关了《精灵宝可梦:红》——Claude、Gemini 和 ChatGPT o3 望尘莫及

在完成初代《精灵宝可梦:红》的速度比拼中,目前出现了新的冠军——由 ChatGPT-5 暂时夺得桂冠,完全碾压了其他对手。

GPT-5 刚刚以新的世界纪录时间通关了《精灵宝可梦:红》——Claude、Gemini 和 ChatGPT o3 望尘莫及

OpenAI 最新的 GPT-5 模型,仅用 6,470 步 就通关了这款 1998 年的 Game Boy 经典游戏,打破了此前由 ChatGPT-o3 创下的 18,184 步 的纪录。

如果难以想象主角小赤(Red)在打败“四天王”前要走多少步的话——6,470 步大约相当于 7 天的游戏时长,而 o3 模型则需要超过 15 天才能完成。

这与今年早些时候形成了鲜明对比,当时 Gemini 2.5 和 Claude 3.7 Sonnet 还在苦苦竞争,光是能否打通游戏都是个问题,更别提以极快的速度完成了。

Anthropic 曾将《精灵宝可梦》作为基准测试,用来展示其最新 Claude 模型的实力,并配合 YouTube 视频,由开发者们解释为什么 GameFreak 这款标志性的系列作品是评估 AI 问题解决能力的理想方式。

而如今,仅仅过了几个月,AI 模型就能以越来越快的速度通关这些经典游戏——而且它们的表现只会持续提升。

所有 AI 通关《精灵宝可梦》的尝试都在 Twitch 等平台进行直播,例如 “GPT_Plays_Pokemon” 这样的频道,已经拥有了稳定的观众群和订阅者。

TechRadar的头像TechRadar认证作者

相关推荐

  • iPhone跳出Alert警告通知该怎么办?解决方法一次看懂

    最近有不少 iPhone 用户反应,在使用 LINE 或 LINE Pay 的过程中,手机会随机出现「Alert」警告通知,且不止最新的 iPhone 16 系列有这个问题,就连 iPhone 15、iPhone 14,甚至是旧款的 iPhone 手机都有这个状况,担心自己的手机是否遭到骇客攻击或入侵!以下针对此问题提出几个解决方法,若你正好遇到「Alert…

    2024年10月26日
    458
  • Windows记事本即将变得更加有用

    微软正在将人工智能功能引入其简单的记事本应用程序,该应用程序以其纯文本功能而闻名,例如保存在. txt文件中。 名为重写的新功能将允许您生成替代文本以满足您的特定需求。您可以将文本修改为更长、更短,或者以特定的语气或格式书写。该功能将生成三种变体供您选择,如果没有结果符合您的标准,您还可以选择重试。 微软在其视窗内幕博客上表示,该功能通过突出显示您想要的文本…

    2024年11月9日
    509
  • 做任务赚佣金的正规平台(2025年做任务赚佣金奖励最高的正规平台)

    2025年,做任务赚钱赚佣金依旧备受追捧,被认为是当下利用手机赚钱最快的方式之一。许多任务平台不仅免费开放,而且操作十分简便,收益到账速度也非常快,因此受到了广大用户的青睐。只要你拥有一部智能手机,并选择一个靠谱的任务平台,就能通过完成任务来赚取佣金。这些平台的任务大多是一单一结,基本上当天操作完毕就能拿到收益,并快速提现到微信或支付宝。即使是新手用户,只要…

    2025年3月15日
    572
  • 赚钱小游戏无广告无门槛提现(没有门槛挣钱快的赚钱游戏软件)

    到了2025年,依然有不少人希望通过玩游戏来实现边玩边赚的目标。然而市面上的许多游戏不是广告频繁,就是设置了高门槛,比如需要氪金或者具备高超操作技巧。很多人玩着玩着就发现,不但体验差,最后也没挣到几块钱,实在是得不偿失。尤其那些几分钟就强制插入广告的视频游戏,既浪费时间又扰乱体验,更谈不上靠它们赚钱。 但好消息是,目前仍有一些真正不需要广告、不设门槛的赚钱游…

    2025年4月12日
    558
  • 2025年十大良心赚钱软件排行榜(十款真正良心靠谱的赚钱软件排名)

    在当今社会,想通过手机APP赚钱,最重要的就是选择一个值得信赖的平台。信任度直接决定了一个APP的可靠性,如果用户对某款APP存在怀疑,往往意味着该平台可能存在不规范操作,比如拖欠用户的收益或者设计套路欺骗用户。因此,我们需要远离这类不值得信任的软件。为了帮助大家快速找到可靠的赚钱APP,小编特意整理了2025年十大良心赚钱软件排行榜,这些软件得到了广泛认可…

    2025年3月23日
    658

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注