OpenAI新的AI强化微调(Reinforcement Fine-Tuning)可能会改变科学家使用其模型的方式

OpenAI的12天活动第二天,相较于第一天面向消费者的OpenAI o1模型推出,更加关注企业需求,内容也变得不那么炫目。

OpenAI新的AI强化微调(Reinforcement Fine-Tuning)可能会改变科学家使用其模型的方式
(图片来源:Getty Images)

相反,OpenAI宣布计划发布强化微调(Reinforcement Fine-Tuning, RFT),一种让开发者定制其AI模型的方法,旨在使OpenAI的算法适应特定任务,特别是一些更为复杂的任务。此举标志着OpenAI从第一天的面向消费者的更新,转向了更加关注企业应用的方向。你可以将RFT看作是一种通过改进AI模型推理过程来提升其表现的方法。通过使用开发者提供的数据集和评估标准,OpenAI的平台能够在不依赖昂贵的后续经验强化的情况下,训练其专用AI。

RFT可能会对法律和科学领域中的AI工具大有裨益。OpenAI在直播中强调了由汤普森路透社使用RFT技术构建的CoCounsel AI助手,以及RFT如何帮助伯克利实验室的研究人员研究罕见的遗传病。然而,这些商业合作关系在短期内对普通用户,尤其是使用ChatGPT或其他OpenAI产品的用户,影响不大。

企业还是消费者

如果你更关注消费者方面的内容,不要灰心。虽然第二天的内容偏向企业应用,但很容易想象OpenAI会尽量在12天内覆盖尽可能广泛的新闻。未来几天很可能会有更多面向消费者的新闻发布,或许是交替发布的模式,或者其他某种形式。

不过,至少OpenAI的结尾笑话比昨天的要有趣一些。AI描述了自动驾驶汽车在旧金山的流行,圣诞老人也想跟上潮流,制作一辆自动驾驶雪橇。问题是,这辆雪橇总是撞到树上。问题出在哪里呢?他没有“松”(pine)调他的模型。也许ChatGPT为TechRadar的编辑Lance Ulanoff制作的图像能更好地传达这个幽默。

OpenAI新的AI强化微调(Reinforcement Fine-Tuning)可能会改变科学家使用其模型的方式
(图片来源:ChatGPT)
TechRadar的头像TechRadar认证作者

相关推荐

  • Perplexity反驳新闻媒体指控,认为媒体公司只希望生成式AI消失

    AI企业擅自取用版权内容训练AI模型的问题一直是个极具争议的话题。早前受到多间媒体公司控告侵权的AI搜寻引擎Perplexity就在博客发驳,认为这些媒体公司只希望用公开的新闻报导来赚钱,并不希望生成式 AI技术存在。 AI搜寻引擎初创Perplexity早前在博客回应News Corp提出的诉讼(Forbes、The New York Times和Wire…

    2024年10月28日
    181
  • 微软的人工智能助手Copilot几乎可以看到你在做什么

    微软(Microsoft)的人工智能助手Copilot将开始看到你在网上看到的东西。据x网站上的一篇文章称,这家科技巨头在一个月前对Copilot进行了重大改造,其中包括一项名为“Copilot Vision”的功能,该功能只针对注册了Copilot实验室实验中心的特定群体,但现在让人工智能能够看到你屏幕上的所有东西,这将是每个人的选择。 在收集了上个月左右…

    2024年11月5日
    165
  • 这款奢华无线耳机将管式放大器高保真音响系统直接放在你的头上,并提供非常强大的高解析音频支持

    我们曾见过一些耳机放大器中使用小型真空管,承诺带来更温暖、更沉浸的音频体验,但新的Écoute真空管耳机决定跳过中间环节,将整个高保真系统直接放在你的头上。这款耳机在耳罩中内置了一颗Korg Nutube P61,带来正宗的管式音效和A/B类放大。 我们第一次在Kickstarter上看到了这款耳机,项目远超其融资目标。现在它们可以通过常规渠道购买,尽管价格…

    2025年1月30日
    108
  • 微软研究声称 AI 仍然难以调试软件

    尽管生成式 AI 正在越来越多地融入编程工作流程,但微软的最新研究表明,在调试方面,大型语言模型仍然难以满足要求。 研究表明,即便是先进的模型,在处理对于经验丰富的开发者来说相当简单的调试任务时,依然存在困难,这突显了人类程序员的重要性。 然而,AI 似乎确实有着可靠的应用场景,谷歌现在声称,大约 25% 的新代码是 AI 生成的。Meta 也指出了 AI …

    2025年4月11日
    102
  • 我将Mistral AI的新应用Le Chat与ChatGPT进行了对比,结果它表现得令人惊讶地好

    法国人工智能开发公司Mistral AI已将其AI聊天机器人Le Chat推向移动设备。Le Chat是欧洲对美国如ChatGPT和Google Gemini以及中国工具如DeepSeek的替代品。 尽管Mistral在人工智能开发者中已经建立了自己的地位,但这是他们首次真正尝试面向消费者的聊天机器人。自然,我想亲自测试一下,看看它的表现如何。虽然这些AI助…

    2025年2月12日
    139

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注