OpenAI Codex 是什么?AI 编程的起点
Codex 是 OpenAI 于 2021 年发布的代码生成模型,基于 GPT 架构在海量开源代码上微调而成。它能将自然语言描述转化为可执行代码,是 GitHub Copilot 的底层引擎,也是 AI 编程时代的开创者。虽然独立的 Codex API 已停用,但其理念已融入 GPT-4o 等新一代模型。本文带你了解 Codex 的原理、演进,以及如何通过 AI的那些事儿 在国内使用 AI 编程能力。
发布: 更新:
Codex 的定义与背景
OpenAI Codex 是一个专门为代码生成任务训练的AI模型。它基于 GPT-3 架构,在 GitHub 上数十亿行公开代码上进行微调,能够:
- 将自然语言指令翻译为代码(如"写一个快速排序函数"→ Python 代码)
- 补全部分代码(给出函数签名,生成函数体)
- 解释已有代码的功能
- 在不同编程语言之间翻译代码
Codex 支持 Python、JavaScript、TypeScript、Go、Ruby、PHP、Shell 等 12+ 种编程语言,其中 Python 能力最强。
Codex 的核心能力
自然语言→代码
用中文或英文描述需求,Codex 直接生成对应代码。理解上下文,能处理复杂的多步骤编程任务。
代码补全
根据已有代码上下文,预测并补全后续代码。这正是 GitHub Copilot 的核心体验——边写边补。
Bug 修复
给出有问题的代码,Codex 能识别错误并生成修复方案。理解代码逻辑,不只是文本匹配。
代码解释
将复杂代码翻译为自然语言解释,帮助理解他人代码或遗留系统。
Codex 的演进历程
Codex 的发展反映了 AI 编程能力的快速进化:
- 2021年8月:OpenAI 发布 Codex,提供独立 API(code-davinci-002、code-cushman-001)
- 2021年10月:GitHub Copilot 技术预览版上线,底层使用 Codex
- 2022年6月:GitHub Copilot 正式商用
- 2023年3月:OpenAI 停用独立 Codex API,代码能力整合到 GPT-3.5/GPT-4
- 2024-2025:GPT-4o、Claude Sonnet 4 等模型的代码能力远超原始 Codex
如今,"Codex"更多是一个历史概念——AI 编程能力已成为所有顶级大模型的标配。
Codex vs 现代模型:代码能力对比
Codex (2021)
HumanEval 通过率 28.8%。仅支持代码任务,上下文窗口 4K-8K token。已停用。
GPT-4o (2024)
HumanEval 通过率 90%+。通用多模态,128K 上下文。代码+对话+视觉全能。
Claude Sonnet 4 (2025)
SWE-bench 顶级表现。200K 上下文,擅长大型代码库理解和重构。
GPT-5 (2025)
最新一代,代码推理能力再次飞跃。支持复杂系统设计和架构级编程。
结论:现在不需要专门的"代码模型",通用大模型的编程能力已远超当年的 Codex。
GitHub Copilot:Codex 的最大遗产
Codex 最重要的应用是驱动了 GitHub Copilot——全球最流行的 AI 编程助手:
- IDE 集成:VS Code、JetBrains、Neovim 等主流编辑器内实时补全
- 上下文感知:理解当前文件、项目结构、注释意图
- 多语言支持:几乎所有主流编程语言
- 持续进化:底层模型已从 Codex 升级到 GPT-4o 级别
通过 AI的那些事儿,你也可以将 Copilot 类工具(如 Cursor、Cline)接入中转站,在国内流畅使用 AI 编程。
现在怎么用 AI 写代码?
虽然 Codex API 已停用,但 AI 编程能力比以前更强、更易用:
- Chat API:通过 GPT-4o / Claude 的 Chat Completions 接口,在 system prompt 中指定编程任务
- IDE 工具:Cursor、GitHub Copilot、Cline、Windsurf 等,配置中转站地址即可使用
- Agent 模式:让 AI 自主规划、编写、测试代码,完成复杂开发任务
通过 AI的那些事儿,国内直连调用,无需代理。
实战:用 GPT-4o 实现 AI 编程
Python 示例:自然语言生成代码
from openai import OpenAI
client = OpenAI(
api_key="你的Key",
base_url="https://api.example.com/v1" # AI的那些事儿中转
)
# 用自然语言描述编程需求
r = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "system", "content": "你是一个资深程序员,根据用户需求生成高质量代码。只输出代码和必要注释。"},
{"role": "user", "content": "写一个 Python 函数,实现 LRU 缓存,支持 get 和 put 操作,O(1) 时间复杂度"}
],
temperature=0.2
)
print(r.choices[0].message.content)
Node.js 示例:代码审查与优化
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "你的Key",
baseURL: "https://api.example.com/v1",
});
const code = `
function findDuplicates(arr) {
let result = [];
for (let i = 0; i < arr.length; i++) {
for (let j = i + 1; j < arr.length; j++) {
if (arr[i] === arr[j] && !result.includes(arr[i])) {
result.push(arr[i]);
}
}
}
return result;
}`;
const r = await client.chat.completions.create({
model: "gpt-4o",
messages: [
{ role: "system", content: "审查代码,指出性能问题并给出优化版本。" },
{ role: "user", content: code }
],
});
console.log(r.choices[0].message.content);
常见问题
OpenAI Codex 是什么?
Codex 是 OpenAI 于 2021 年发布的代码生成模型,基于 GPT-3 在海量开源代码上微调。它能将自然语言转化为代码,是 GitHub Copilot 的底层引擎,开创了 AI 编程时代。
Codex 和 GPT-4o 写代码有什么区别?
Codex 是早期专用代码模型(HumanEval 28.8%),已于 2023 年停用。GPT-4o 是通用多模态模型,代码能力远超 Codex(HumanEval 90%+),同时还能处理对话、图像等任务。现在用 GPT-4o 写代码是更好的选择。
Codex API 还能用吗?
不能。OpenAI 已于 2023 年 3 月停用独立的 Codex API(code-davinci-002 等)。代码生成能力已整合到 Chat Completions API,使用 GPT-4o 等模型即可。通过 AI的那些事儿可在国内直连调用。
国内怎么用 AI 写代码?
通过 AI的那些事儿 调用 GPT-4o 或 Claude 的 Chat API 生成代码;或将 Cursor、Cline 等 IDE 工具的 API 地址配置为中转站,即可在国内流畅使用 AI 编程。
GitHub Copilot 和 Codex 是什么关系?
GitHub Copilot 是微软/GitHub 推出的 AI 编程助手产品,最初底层使用 OpenAI Codex 模型。现在 Copilot 已升级到 GPT-4o 级别模型,但"Codex"这个名字仍与 AI 编程紧密关联。
国内直连 AI 编程,代码零改动
通过 AI的那些事儿调用 GPT-4o / Claude,获得比 Codex 强 3 倍的代码生成能力。