OpenAI o1 是什么？如何运作的

2024年9月20日上午8:55 • 工具软件

https://u.jd.com/daBByyr

https://u.jd.com/d67YrPi

OpenAI o1 可以通过复杂的任务进行推理，并解决比以前的科学、编码和数学模型更难的问题。

它是如何运作的

通过训练模型学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。

模型在物理、化学和生物学方面具有挑战性的基准任务上的表现与博士生类似。

作为早期模型，它尚不具备 ChatGPT 的许多有用功能，例如浏览网页以获取信息以及上传文件和图像。

对于许多常见情况，GPT-4o 在短期内将更加强大。

在国际数学奥林匹克（IMO）资格考试中，GPT-4o 只正确解决了 13% 的问题，而推理模型的得分为 83%。

他们的编码能力在竞赛中得到评估，并在 Codeforces 竞赛中达到了第 89 个百分点。

它是给谁用的

如果您正在解决科学、编码、数学和类似领域的复杂问题，这些增强的推理能力可能特别有用。

医疗保健研究人员可以使用 o1 来注释细胞测序数据，物理学家可以使用 o1 生成量子光学所需的复杂数学公式，所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。

OpenAI o1-mini

还发布了OpenAI o1-mini ，这是一种更快、更便宜的推理模型，在编码方面特别有效。

作为较小的模型，o1-mini 比 o1-preview 便宜 80%

如何使用OpenAI o1

从今天开始**，ChatGPT Plus 和 Team**用户将能够访问 ChatGPT 中的 o1 模型。
o1-preview 的每周速率限制为 30 条消息，o1-mini 的每周速率限制为 50 条。

符合API 使用第 5 层资格的开发人员今天可以开始使用 API 中的两种模型进行原型设计，速率限制为 20 RPM。

接下来是什么

除了模型更新之外，希望添加浏览、文件和图像上传等功能。

除了新的 OpenAI o1 系列之外，还计划继续开发和发布 GPT 系列中的模型（还有活）。

Jim Fan 的评价

你并不需要一个巨大的模型来进行推理。大量的模型参数用于存储和记忆事实，从而在类似 Trivia QA 这样的基准测试中表现出色。
大量的计算资源正在从前/后训练转移到推理服务。大语言模型本质上是基于文本的模拟器。通过在模拟器中模拟多种策略和场景，模型最终将收敛到有效的解决方案。
OpenAI 很可能早已发现推理扩展的规律，而学术界最近才开始深入研究。上个月有两篇论文相隔一周在 Arxiv 上发表：
- 《Large Language Monkeys: Scaling Inference Compute with Repeated Sampling》。Brown 等人发现，DeepSeek-Coder 在 SWE-Bench 基准测试中的准确率从单次采样的 15.9% 提升至 250 次采样的 56%，超越了 Sonnet-3.5。
- 《Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters》。Snell 等人指出，PaLM 2-S 在数学问题上的表现，通过测试时的搜索策略，击败了一个大 14 倍的模型。
将 o1 投入生产要比在学术基准测试中取得成功更具挑战性。对于现实世界中的推理问题，如何判断何时停止搜索？奖励函数应该如何定义？成功的标准是什么？何时应该在循环中调用像代码解释器这样的工具？如何权衡这些 CPU 过程的计算成本？他们的研究报告并没有透露太多细节。
Strawberry 可能会迅速演变为一个数据驱动的良性循环。如果搜索得到正确答案，那么整个搜索过程就会成为一个微型的训练数据集，其中包含正负奖励信号。

这将反过来增强未来版本 GPT 的推理核心，类似于 AlphaGo 的价值网络——用于评估每个棋盘位置的优劣——随着蒙特卡洛树搜索生成越来越多精细的训练数据而不断优化。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun299496.html

O1 OpenAI 运作

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

Unriddle：AI 论文写作工具

上一篇 2024年9月20日上午8:50

Microsoft确认 Windows 12 今年不会发生

下一篇 2024年2月10日上午10:21

Indigo关于发布会预测的整理

Indigo关于发布会预测的整理 GPT-4 的新版应该会按照参数规模不同分化成多个版本，这个和 Claude 还有 Gemini 多版本的逻辑一样；前两周出现在 llmsys …

工具软件 2024年5月20日
工具软件

OpenAI 让您无需注册即可使用 ChatGPT

OpenAI 正在消除使用 ChatGPT 的所有障碍，甚至不需要注册。该公司周一宣布，它允许用户无需注册即可开始使用聊天机器人。这里的目的是“让任何对人工智能能力感到好奇的人都能…

2024年4月6日
工具软件

新的 OpenAI 语音引擎项目

新的 OpenAI 语音引擎项目据报道，OpenAI正在开发一个新的语音引擎项目，该项目已通过最近的“语音引擎”商标申请得到暗示。该商标表明该项目可能涉及语音和语音识别、处理命令…

2024年3月26日
工具软件

Open Interpreter 开源O1语音智能助手

Open Interpreter 开源O1语音智能助手一个完全开源的可以控制家里电脑的AI语音设备O1，介绍视频已翻译。它可以看到你的屏幕内容学习使用你常用的应用，并且你无论在哪…

2024年3月26日
工具软件

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期 OpenAI 首席技术官（CTO） Mira Murati 在接受《华尔街日报》采访时，对 OpenAI …

2024年3月15日
工具软件

OpenAI 终于推出了 GPT 商店：一个自定义的 GPT 共享平台

经过几个月的延迟，OpenAI 终于向 GPT Store 敞开了大门——这是一个供用户查找用户创建的流行自定义版本的 ChatGPT 的平台。自引入自定义 GPT 构建器以来，…

2024年1月15日
工具软件

OpenAI 终于推出了 GPT 商店：一个自定义的 GPT 共享平台

经过几个月的延迟，OpenAI 终于向 GPT Store 敞开了大门——这是一个供用户查找用户创建的流行自定义版本的 ChatGPT 的平台。自引入自定义 GPT 构建器以来，…

2024年1月12日
工具软件

Open AI将成为美国二大最有价值的初创公司，仅次于SpaceX

Open AI将成为美国二大最有价值的初创公司，仅次于SpaceX 上周有消息说OpenAI正在初步讨论以1000亿美元或以上的估值筹集新一轮资金，同时2023年的利润将会达到16…

2024年1月2日
工具软件

从初学者到专业人士：2024 年 ChatGPT 精通指南

ChatGPT 是 OpenAI 的革命性语言模型，风靡全球。它能够生成逼真的文本、翻译语言、编写不同类型的创意内容以及以信息丰富的方式回答您的问题，开辟了一个充满可能性的新时代。…

2023年12月29日
工具软件

2023 年的 AI 突破、发展和工具

在过去的一年里，人工智能（AI）在科技领域取得了长足的进步，改变了我们与数字设备和内容互动的方式。OpenAI、Microsoft、谷歌等主要科技公司在 2023 年一直处于这…

2023年12月21日
ChatGPT 一周岁了：OpenAI 开创性聊天机器人的历史

ChatGPT 上线 2022 年 11 月 30 日，OpenAI 向全世界免费推出了 ChatGPT，作为研究预览的一部分。在短短两个月的时间里，它积累了超过1亿的月度用户，成…

2023年12月2日 • 工具软件
工具软件

OpenAI 正式宣布 Sam Altman 回归担任首席执行官

OpenAI 正式宣布 Sam Altman 回归担任首席执行官在过去几周的惨败之后，OpenAI正在经历重大的领导层变动，Sam Altman恢复了首席执行官的职位，Mira …

2023年12月1日
工具软件

如何结合 OpenAI Assistant API 和 Zapier 实现无代码自动化

由于人工智能的爆炸式增长，现在可以创建人工智能助手来帮助完成这些平凡的任务，使您能够专注于业务或个人生活中更重要的领域。如果您想了解如何将 OpenAI Assistant API…

2023年11月28日
工具软件

OpenAI Load Balancer：Open AI API 负载均衡

OpenAI Load Balancer：Open AI API 负载均衡它是一个Python库,用于在多个端点之间分配API请求(支持OpenAI和Azure)。它实现了轮询负…

2023年11月27日
开源模型提供类似OpenAI的用户界面工具OpenGPTs

这是一项开源工作，旨在创造与 OpenAI 的 GPT 类似的体验。它建立在 LangChain、LangServe 和 LangSmith 之上。这使您可以更好地控制您使用的 L…

工具软件 2023年11月23日
webcamGPT 是一组工具和示例，展示如何使用 OpenAI 视觉 API 对图像、视频文件和网络摄像头流运行推理。

webcamGPT 是一组工具和示例，展示如何使用 OpenAI 视觉 API 对图像、视频文件和网络摄像头流运行推理。请记住，存储库仍在建设中安装 pip install w…

工具软件 2023年11月23日
工具软件

准备好与 ChatGPT 进行数小时的对话了吗？

OpenAI 对其 ChatGPT 平台进行了重大更新，使所有用户都可以免费使用语音功能。这一重大增强功能允许用户使用语音与 ChatGPT 互动，这是以前仅限于付费订阅者的功能。…

2023年11月23日
工具软件

如何使用 ChatGPT Vision 在 Zapier 自动化中阅读和理解图像

您是否曾经想过创建一个能够读取和理解图像并最终根据它所看到的内容采取行动以帮助提高您的生产力或业务工作流程的自动化？也许将照片上传到您的 Google Drive，系统会立即启动，…

2023年11月21日
最新资讯

OpenAI 创办人 Sam Altman 加入 Microsoft 内部 AI 团队

Microsoft宣布OpenAI的共同创办人Sam Altman将领导Microsoft新成立的内部AI团队。此消息传出后，引起业界广泛关注。 =三星Altman被迫离开了Op…

2023年11月20日
微软Microsoft

OpenAI 解雇 Sam Altman 微软等投资者力促复职

OpenAI最大投资者，包括对该公司投资超过100亿美元的微软公司，正与包括Thrive Capital及Tiger Global Management在内的投资者合作，力促将于上…

2023年11月19日
工具软件

OpenAI 因现有用户使用量激增而暂停新的 ChatGPT Plus 注册

OpenAI 的 ChatGPT 是最受欢迎的聊天机器人之一，为用户提供对 GPT 3.5 和 GPT 4 的访问，具体取决于您是否为该服务付费。为了能够访问 GPT 4，这是 O…

2023年11月15日
工具软件

使用 OpenAI API 密钥创建 GPT 自定义操作

如果您一直在尝试在新的 ChatGPT 探索部分创建一些 OpenAI 自定义 GPT，该部分现在可供 ChatGPT Plus 和企业用户使用。您可能已经看到一个部分，您可以在其…

2023年11月14日
工具软件

OpenAI CEO谈GPT-5透露微软加大投资计划

OpenAI CEO Sam Altman透露正积极寻求来自最大投资者Microsoft的进一步资金支持。公司CEO Sam Altman认为，这将推动他创造人工通用智能（AGI）…

2023年11月14日
工具软件

OpenAI希望Microsoft用更多资金支持其类人“超级智能”项目

OpenAI老板Sam Altman告诉Microsoft，他的AI公司正在寻求更多的资金支持来开发“超级智能”工具。他还强调了通用人工智能（AGI）的发展及其安全和有益的实施，…

2023年11月14日
工具软件

OpenAI 宣布建立数据合作伙伴关系，利用多样化的全球数据进行 AI 训练

领先的人工智能研究实验室 OpenAI 最近启动了 OpenAI 数据合作伙伴计划。这项新计划旨在鼓励与各种组织合作，为人工智能模型训练创建公共和私有数据集。该计划的主要目标是提高…

2023年11月11日