来创建具有交互式用户界面的

ujjal22 · Post by **ujjal22** » Tue Jan 07, 2025 6:03 am

对于要求更高的任务，更高的推理选项使模型的执行水平可与 o3 本身相当，但成本仅为 o3 的一小部分。这种灵活性对于处理不同用例的开发人员和研究人员尤其有吸引力。

O3 迷你基准测试

O3 迷你基准测试。来源：OpenAI

现场演示展示了 o3 mini 如何兑现其承诺。例如，在编码任务中，o3 mini 的任务哥伦比亚电话数据是生成 Python 脚本本地服务器以进行测试。尽管任务很复杂，但该模型表现良好，证明了其解决复杂编程挑战的能力。

在现场演示期间使用 o3 mini 创建的交互式 UI

在现场演示期间使用 o3 mini 创建交互式 UI。来源：OpenAI

我们将 o3 mini 视为盈利能力和性能必须保持一致的场景的实用解决方案。

深思熟虑的一致性：安全测试的创新
OpenAI 采取了积极主动的方式对 o3 和 o3 mini 进行安全测试，允许研究人员在模型全面发布之前进行公共安全评估。

OpenAI 的 o3 安全策略的一个核心特征是深思熟虑的协调，这是一种超越传统安全方法的方法。下图显示了协商对齐与其他方法（例如RLHF（带有人类反馈的强化学习）、RLAIF（带有 AI 反馈的强化学习）以及推理时间细化技术（例如 Self-REFINE））的不同之处。

深思熟虑的对齐 vs rlhf vs rlaif vs 推理时间细化技术

来源：OpenAI

在深思熟虑的对齐中，模型并不简单地依赖静态规则或偏好数据集来确定提示是安全还是不安全。相反，它利用其推理能力来实时评估指示。上图说明了这个过程：

训练数据生成：与人类输入直接通知模型的 RLHF 不同，深思熟虑的对齐使用推理模型来生成特定提示的思想链 (CoT)。这些 CoT 结果提供了指导训练过程的细致入微的推理模式，帮助模型更有效地理解上下文和意图。
推理时间：在推理过程中，推理模型评估提示并提供思路链及其答案的解释。此步骤允许模型动态评估提示的意图和上下文，识别静态规则可能错过的潜在隐藏风险或歧义。
O3发布日期
目前，o3 和 o3 mini 尚未广泛使用，但 OpenAI 已通过其安全测试计划向研究人员开放了访问权限。

至于公开可用性，OpenAI 分享了一个暂定时间表。 o3 mini 预计将于1 月下旬推出，为推理任务提供经济高效的选择。 o3 的全面发布将在不久后进行，尽管 OpenAI 强调其时间表取决于安全测试阶段获得的反馈。

我们认为这种谨慎的做法是积极的一步，优先考虑彻底的评估和与用户需求的深思熟虑的一致性，同时在整个开发过程中保持透明度。

结论
O3 和 o3 mini 强调了人工智能系统日益复杂的情况以及负责任的发布所带来的挑战。虽然基准令人印象深刻，但我们更感兴趣的是这些模型提出的问题：它们在现实世界中的表现如何？安全措施是否足够强大，足以解决大规模的边缘情况？

谨慎部署 OpenAI 是一种方法，但在能力和责任之间取得适当的平衡将取决于这些模型的最终使用和评估方式。