人工智能对许多人来说听起来很像人类,但通常你可以很快分辨出自己是否在与 AI 模型互动。然而,这种情况可能会发生变化,因为 OpenAI 的新 GPT-4.5 模型通过让人们在五分钟的对话中误以为它是人类,成功通过了图灵测试。并不是只有少数人,而是 73% 的加利福尼亚大学圣地亚哥分校研究参与者。

事实上,GPT-4.5 的表现超越了一些真正的人类参与者,这些人被指控在盲测中被误认为是 AI。不过,AI 做出如此逼真的人类模仿,甚至比实际人类还要“人性化”,这说明了机器的聪明才智,或者说是人类的笨拙。
参与者进行了两次连续的对话,一次与人类,一次与聊天机器人,他们并不知道哪个是哪个,然后必须在事后识别出 AI。为了帮助 GPT-4.5 成功,模型被赋予了一个详细的人格,模仿一系列提示。它被要求表现得像一个年轻、有点笨拙但精通互联网的内向者,带有干涩的幽默感。
有了这一点对人性的微小引导,GPT-4.5 变得出奇地有说服力。当然,一旦提示被移除,AI 回到空白的人格和历史时,幻觉就会崩溃。突然间,GPT-4.5 只能骗过 36% 的受试者。这一下急剧的下降告诉我们一个关键的事实:这不是一个正在觉醒的思维。这是一个扮演角色的语言模型。当它忘记了自己的角色设定时,它就只是另一个自动完成功能。
聪明并非意识
这一结果无疑是历史性的。自从艾伦·图灵在 1950 年提出,认为一台能够进行足够自然对话并被误认为是人类的机器,可能拥有人的智能以来,这一命题便一直受到讨论。哲学家和工程师们一直在争论图灵测试及其含义,但突然间,理论变得更加真实。
图灵并没有将通过他的测试等同于证明机器具备意识或自我意识。这并不是图灵测试真正衡量的内容。准确捕捉人类对话的氛围是巨大的成就,而 GPT-4.5 通过实际的人类互动表现出色,甚至能讲出一些令人略感尴尬的轶事。但如果你认为智能应该包括真正的自我反思和情感连接,那么你可能并不担心 AI 会渗透到人类社会中。
GPT-4.5 在发言之前不会感到紧张。它不在乎是否欺骗了你。这个模型并不为通过测试而自豪,因为它甚至不知道什么是测试。它只“知道”某些事情,就像字典知道单词的定义一样。这个模型只是一个充满可能性的黑匣子,穿着一件舒适的语言外衣,让你感到轻松自在。