OpenAI Codex 是什么?AI 编程的起点

CodexOpenAI 于 2021 年发布的代码生成模型,基于 GPT 架构在海量开源代码上微调而成。它能将自然语言描述转化为可执行代码,是 GitHub Copilot 的底层引擎,也是 AI 编程时代的开创者。虽然独立的 Codex API 已停用,但其理念已融入 GPT-4o 等新一代模型。本文带你了解 Codex 的原理、演进,以及如何通过 AI的那些事儿 在国内使用 AI 编程能力。

阅读时长:约 7 分钟 难度:入门 含实战代码

发布: 更新:

Codex 的定义与背景

OpenAI Codex 是一个专门为代码生成任务训练的AI模型。它基于 GPT-3 架构,在 GitHub 上数十亿行公开代码上进行微调,能够:

  • 将自然语言指令翻译为代码(如"写一个快速排序函数"→ Python 代码)
  • 补全部分代码(给出函数签名,生成函数体)
  • 解释已有代码的功能
  • 在不同编程语言之间翻译代码

Codex 支持 Python、JavaScript、TypeScript、Go、Ruby、PHP、Shell 等 12+ 种编程语言,其中 Python 能力最强。

Codex 的核心能力

自然语言→代码

用中文或英文描述需求,Codex 直接生成对应代码。理解上下文,能处理复杂的多步骤编程任务。

代码补全

根据已有代码上下文,预测并补全后续代码。这正是 GitHub Copilot 的核心体验——边写边补。

Bug 修复

给出有问题的代码,Codex 能识别错误并生成修复方案。理解代码逻辑,不只是文本匹配。

代码解释

将复杂代码翻译为自然语言解释,帮助理解他人代码或遗留系统。

Codex 的演进历程

Codex 的发展反映了 AI 编程能力的快速进化:

  • 2021年8月:OpenAI 发布 Codex,提供独立 API(code-davinci-002、code-cushman-001)
  • 2021年10月:GitHub Copilot 技术预览版上线,底层使用 Codex
  • 2022年6月:GitHub Copilot 正式商用
  • 2023年3月:OpenAI 停用独立 Codex API,代码能力整合到 GPT-3.5/GPT-4
  • 2024-2025:GPT-4o、Claude Sonnet 4 等模型的代码能力远超原始 Codex

如今,"Codex"更多是一个历史概念——AI 编程能力已成为所有顶级大模型的标配。

Codex vs 现代模型:代码能力对比

Codex (2021)

HumanEval 通过率 28.8%。仅支持代码任务,上下文窗口 4K-8K token。已停用。

GPT-4o (2024)

HumanEval 通过率 90%+。通用多模态,128K 上下文。代码+对话+视觉全能。

Claude Sonnet 4 (2025)

SWE-bench 顶级表现。200K 上下文,擅长大型代码库理解和重构。

GPT-5 (2025)

最新一代,代码推理能力再次飞跃。支持复杂系统设计和架构级编程。

结论:现在不需要专门的"代码模型",通用大模型的编程能力已远超当年的 Codex。

GitHub Copilot:Codex 的最大遗产

Codex 最重要的应用是驱动了 GitHub Copilot——全球最流行的 AI 编程助手:

  • IDE 集成:VS Code、JetBrains、Neovim 等主流编辑器内实时补全
  • 上下文感知:理解当前文件、项目结构、注释意图
  • 多语言支持:几乎所有主流编程语言
  • 持续进化:底层模型已从 Codex 升级到 GPT-4o 级别

通过 AI的那些事儿,你也可以将 Copilot 类工具(如 Cursor、Cline)接入中转站,在国内流畅使用 AI 编程。

现在怎么用 AI 写代码?

虽然 Codex API 已停用,但 AI 编程能力比以前更强、更易用:

  • Chat API:通过 GPT-4o / Claude 的 Chat Completions 接口,在 system prompt 中指定编程任务
  • IDE 工具:Cursor、GitHub Copilot、Cline、Windsurf 等,配置中转站地址即可使用
  • Agent 模式:让 AI 自主规划、编写、测试代码,完成复杂开发任务

通过 AI的那些事儿,国内直连调用,无需代理。

实战:用 GPT-4o 实现 AI 编程

Python 示例:自然语言生成代码

from openai import OpenAI

client = OpenAI(
    api_key="你的Key",
    base_url="https://api.example.com/v1"  # AI的那些事儿中转
)

# 用自然语言描述编程需求
r = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "你是一个资深程序员,根据用户需求生成高质量代码。只输出代码和必要注释。"},
        {"role": "user", "content": "写一个 Python 函数,实现 LRU 缓存,支持 get 和 put 操作,O(1) 时间复杂度"}
    ],
    temperature=0.2
)
print(r.choices[0].message.content)

Node.js 示例:代码审查与优化

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "你的Key",
  baseURL: "https://api.example.com/v1",
});

const code = `
function findDuplicates(arr) {
  let result = [];
  for (let i = 0; i < arr.length; i++) {
    for (let j = i + 1; j < arr.length; j++) {
      if (arr[i] === arr[j] && !result.includes(arr[i])) {
        result.push(arr[i]);
      }
    }
  }
  return result;
}`;

const r = await client.chat.completions.create({
  model: "gpt-4o",
  messages: [
    { role: "system", content: "审查代码,指出性能问题并给出优化版本。" },
    { role: "user", content: code }
  ],
});
console.log(r.choices[0].message.content);

常见问题

OpenAI Codex 是什么?

Codex 是 OpenAI 于 2021 年发布的代码生成模型,基于 GPT-3 在海量开源代码上微调。它能将自然语言转化为代码,是 GitHub Copilot 的底层引擎,开创了 AI 编程时代。

Codex 和 GPT-4o 写代码有什么区别?

Codex 是早期专用代码模型(HumanEval 28.8%),已于 2023 年停用。GPT-4o 是通用多模态模型,代码能力远超 Codex(HumanEval 90%+),同时还能处理对话、图像等任务。现在用 GPT-4o 写代码是更好的选择。

Codex API 还能用吗?

不能。OpenAI 已于 2023 年 3 月停用独立的 Codex API(code-davinci-002 等)。代码生成能力已整合到 Chat Completions API,使用 GPT-4o 等模型即可。通过 AI的那些事儿可在国内直连调用。

国内怎么用 AI 写代码?

通过 AI的那些事儿 调用 GPT-4o 或 Claude 的 Chat API 生成代码;或将 Cursor、Cline 等 IDE 工具的 API 地址配置为中转站,即可在国内流畅使用 AI 编程。

GitHub Copilot 和 Codex 是什么关系?

GitHub Copilot 是微软/GitHub 推出的 AI 编程助手产品,最初底层使用 OpenAI Codex 模型。现在 Copilot 已升级到 GPT-4o 级别模型,但"Codex"这个名字仍与 AI 编程紧密关联。

国内直连 AI 编程,代码零改动

通过 AI的那些事儿调用 GPT-4o / Claude,获得比 Codex 强 3 倍的代码生成能力。