OpenAI 刚刚发布了两款全新的 AI 模型——gpt‑oss‑120b 和 gpt‑oss‑20b。它们不仅是新模型,更是自 GPT-2 以来,ChatGPT 创造者首次推出的开源权重模型。

其中较小的 gpt-oss-20b 尤为引人注目,因为它足够轻量,可以在配置较好的普通消费级电脑上运行。如果你有大约16GB内存并且耐心足够,就可以加载它,向它提问,并且真实地看到它是如何推导出答案的。相比之下,120b 这个更大的模型仍然需要强大的硬件或云端支持。
这两个模型是 OpenAI 新一轮鼓励开发者探索模型并为普通用户进行商业化的举措的一部分。多年来,开发者和好奇的人终于可以在自己的设备上下载并运行 OpenAI 的模型,检查它们的思维过程,并自由地进行二次开发。它们可通过 Hugging Face 和 AWS 获取,且采用 Apache 2.0 许可协议。
开源权重意味着这些模型提供了透明度和独立性,这种程度的开放自 ChatGPT 首次走红以来并不多见。整个推理过程都是实时可见的,你可以清楚地看到模型的“逻辑”如何引导它最终的回答选择以及决策过程。
这对 OpenAI 来说是一个重大转变。过去几年,OpenAI 限制了最强大工具的访问权限,只提供 API 端点和付费方案。现在,它稍稍回归到了 GPT-2 时代的开放方式,但这次的模型远比当年更强大。尽管如此,这个轻量模型还不足以让所有人都急于用它来替代 ChatGPT 应用。
开源权重的优势
这种新模型提供的灵活性可能会成为 OpenAI 的一大优势,因为开源权重模式正在变得越来越受欢迎。DeepSeek、Meta 和 Mistral 最近也都以某种形式发布了开源模型,但大多数都是半开源,意味着训练数据未公开,或者有严格的使用条款和限制。
gpt-oss 模型则直接公开了权重和许可,虽然训练数据仍为专有。OpenAI 的 gpt-oss 模型不仅兼容其广泛使用的界面,还让人们更深入地了解模型的决策过程,彰显其独特性。