Codex新手保姆级教程：新手从安装到跑通第一个项目！

原创

测试开发技术

发布于 2026-06-01 09:11:31

2.1K0

文章被收录于专栏：AI编程AI编程

近期，Codex 在 AI 圈热度一路飙升，几乎刷屏。打开某号、某音、某站等平台随处可见相关讨论，到处都在聊 Codex，俨然成为 AI 圈的「现象级工具」。

但我相信更多的朋友和我之前一样，第一次听到 Codex，第一反应不是 “哇，好强”，而是：

这玩意到底从哪开始用？一会儿说 Claude Code，一会儿说 Codex，彻底晕了😷

功能很像、宣传都很猛，很容易把新手绕进去。

所以，这篇教程不讲跑分、不讲复杂原理，只讲新手第一次真正上手时，最需要搞懂、最需要掌握的东西。

废话不多说，我们直接开始。

Codex介绍

Codex 是 OpenAI 于 2025 年推出的 AI 编程智能体，到 2026 年已成为开发者圈子里最热门的生产力工具之一。

它和我们日常使用的聊天机器人有着本质区别，不只是简单问答对话，还能直接读取本地项目文件、编辑文档与代码、执行系统命令、操控各类软件，同时支持联网检索信息、网上查资料这些工作，它都能包揽，还能持续跟进长期复杂任务、自动完成一系列操作。

不少人会把它和 Claude Code 作对比，两者能力上相近，但 Codex 搭配了完整的可视化界面，操作一目了然，更适合新手小白用户使用。

1. 安装Codex

一切的前提，是先要把CodeX安装到你的本地电脑。

当然还有一个提前：就是需要有魔法和ChatGPT账号，这个大家只能自己去想办法解决了，如果是AI进化社的成员，之前有教程专门讲过。

基本流程是：

1. 打开官方入口。
2. 下载 Windows 或Mac版 Codex 桌面App。
3. 按提示安装。
4. 打开 Codex。
5. 用 ChatGPT / OpenAI 账号登录。

具体操作：

1、我们可以直接去OpenAI的Codex官网下载安装，访问：https://openai.com/zh-Hans-CN/codex/，Mac和Windows都有，我就用Mac做个演示，点击下载安装。

2、下载好dmp安装包后，双击打开，把Codex拖到应用程序中。

首次启动时，macOS 可能提示「无法验证开发者」，进入「系统设置 → 隐私与安全性」，点击「仍要打开」安装这件事本身不复杂，最重要的是别乱下载。建议只从 OpenAI 官方入口下载。

3、打开Codex，用ChatpGPT帐号登录，也可以使用其他方式使用Codex，比如API key。

如果你只是体验，优先用账号登录，不要一上来研究 API Key。

免费账号能不能用，要看当时官方开放策略和额度。长期使用，通常还是建议至少准备 Plus 或更高套餐。因为 Codex 一旦进入项目、读文件、改文件、跑长任务，消耗还是比较大。

2. 先别急着提问、干活

如果你只把 Codex 当成 ChatGPT 的另一个入口，那它确实就是一个聊天框。

但 Codex 真正厉害的地方，不是“回答问题”，而是“能直接进入项目文件，扮演你的工作助手帮你做事”。

比如，它可以做这些事：

• 读取你指定的本地文件。
• 修改项目里的文档和代码。
• 运行终端命令。
• 打开网页查资料。
• 通过插件处理文档、表格、PPT。
• 用 Skills 按固定流程完成任务。
• 通过 MCP 连接外部工具。
• 在 IDE 或云端继续处理项目。

对于新手来讲，要先建立一个重要的意识：

不要一上来就用“Codex 直接开发项目”，而是要先学会了解它。

2.1 Codex 不同使用方式

Codex 可以在多个入口使用，比如桌面App、CLI、Web/Cloud、IDE extension 等。具体口和按钮名称会实时更新，以自己当前看到的界面为准。

小白先看这张表就够了：

使用方式	解释	适合谁	小白建议
Codex 桌面App	装在电脑上的 Codex 工作台	想管理本地项目的人	主推，从这里开始
Codex Web / Cloud	在网页或云端委托任务	想让任务离开本地持续跑的人	后面再学
Codex CLI	命令行里的 Codex	会终端的人	小白先不用
IDE / VS Code 扩展	在代码编辑器里用 Codex	写代码、改网页、改项目的人	有项目后再用
GitHub 里的 Codex	在代码仓库里委托任务	管 GitHub 仓库的人	后期再学

建议先把桌面 App 这条路跑通，后面去 VS Code、Cloud、GitHub 都会顺很多。

2.1 了解 Codex 基本组成

打开 Codex 桌面 App，进来后，界面长这样，我们先带大家快速认识一下各个区域。

中间这一大块，就是我们平时的工作区，左侧栏包含两个主要入口：Chat（对话） 和 Project（项目）。

• 对话：对话适合不需要绑定到特定文件夹的任务，与 ChatGPT 网页端对话体验基本一致，适合处理日常的、一次性的问答和简单任务。每个对话相互独立，不共享工作目录。
• 项目：项目才是Codex真正的主战场，适合需要操作本地文件的任务，例如生成代码、编写文档、制作 PPT、完成报告。选一个本地文件夹作为项目目录，Codex就会以这个文件夹为工作区间，所有生成的文件都会自动存进去。一个项目里可以开多个对话，每个对话是一条独立的任务线，它们共享同一个文件夹里的文件，但记录互相隔离。通过项目方便统一管理多个子任务。

我们可以在左侧项目这边点击这个加号新建文件夹，或者使用一个现有的。

Codex 桌面 App 的对话框与 ChatGPT 网页端类似，但额外提供了以下功能：

1. 添加上下文：可以附加文件、截图或其他参考内容
2. 选择模型：在不同模型之间切换
3. 选择工作目录：指定 Codex 在哪个本地文件夹下执行任务
4. 计模模式：计划模式就是只规划不动手，先帮你把方案理清楚，你确认了再开始做。每个稍微复杂一点的项目，我都推荐你先用这个模式过一遍。
5. 本地模式：分为本地 / 工作树 / 云端，决定文件改在哪里。

然后在对话框左下角有三档权限选择。

• 默认权限（最安全、最保守）：一般主要是能读取工作区内所有文件，但是修改文件、执行终端命令、联网全部需要你手动点击确认。简单来说，就是动个啥都需要你审批。适合新手刚上手、不熟悉 Codex时，或者对于一些陌生/重要/线上代码修改时。
• 自动审查（日常开发首选）：在默认权限基础上，内置自动风险判断，低风险操作自动放行，比如改普通代码、加注释、安装依赖、跑测试 / 构建。高风险操作仍会弹框确认，比如删除文件、rm -rf、提权等。适合日常开发，碰到有风险的操作会拦一下。小事自动过，大事问你，新手最推荐。
• 完全访问权限（最高权限、风险最大）：简单来说，可创建 / 修改 / 删除任何项目文件，无确认、无拦截、直接执行所有操作，AI 全权代理，全程不打扰，风险自担。几乎无安全限制，误操作可能导致文件丢失 / 项目损坏，一般适合那些高度信任的个人练习项目。

当然，用着用着，你可能会好奇自己还剩多少额度。

点左下角的设置，找到剩余额度，就能看到你5小时内还剩多少、这周还剩多少、啥时候刷新。

2.3 先做几个基础设置

到这里，先别急着让它改文件，先做设置。

Codex 的设置会随着版本变化，但小白可以先关注这几类设置。

你不需要把每个按钮都研究透。先把最影响使用体验和安全边界的地方搞清楚。

1、常规设置，将跟进行为，改为引导

跟进行为改成引导，这样在中途你想修改的时候就可以直接插入，而不是必须等着当前任务做完才能进行新一轮的对话。

image-20260531111919197

2、常规设置，发送方式改为组合键发送

开启按组合键发送的开关选项，默认为Enter发送。

因为你后面写项目需求时，经常会写很长：

• 项目目标。
• 输出格式。
• 不要做什么。
• 目录结构。
• 验证方式。

如果写一半按回车就发出去了，Codex 可能会拿着半截需求开始干活。（别问我是怎么知道的，我吃了很多次亏才想起来要设置一下😂）

3、先建项目目录

如果你是小白，很容易犯一个错误：什么都没配置好，就直接让它干活。

结果就是文件到处飞。先建项目，再开始。

先说结论：新手第一次用 Codex，最该先配置的不是模型，而是项目文件夹。

这一步是全文最重要的地方。

新手用 Codex，第一件事不是装插件，而是建立项目根目录。

你可以建一个这样的文件夹：

  ～/codex-projects

这个目录以后专门放 Codex 项目。

不要把项目直接放在：

• 桌面
• 下载目录
• 个人知识库目录
• 乱七八糟的位置

为什么？因为 Codex 会读文件、写文件、生成中间数据、跑脚本。

例如，如果你把项目塞进日常知识库，它可能把一堆日志、配置、代码、缓存都放进去。知识库就被污染了。

所以先建一个干净的项目根目录。

有了项目根目录，每个新项目再建一个独立文件夹。比如：

  ～/codex-projects/project1
～/codex-projects/project2
～/codex-projects/project3

4、设置Agent.md

接下来，设置AGENTS.md，也就是你给codex设置的家法规矩。

对于 Codex 而言，我们每开启一个新的对话窗口，它都会进入一个全新的上下文。它不记得之前发生了什么，对于整个项目的记忆都是空白的。

所以 Codex 提供了记忆系统来解决这样的问题：AGENTS.md 就是给 Codex 这类编码Agent看的项目说明文件，它可以描述项目结构、开发命令、测试要求、代码风格和协作边界。

AGENTS.md 的配置分为两个层级：全局级（影响所有项目）和项目级（仅影响当前文件夹）。建议先配置全局规则作为底线，再为特定项目补充专属要求。

如果想要全局生效，有以下两种方式：

1. 在系统的全局 Codex 文件夹里面找到 agents.md，它是你为codex提供的全局通用的规则。
2. 在 Codex 桌面 App 里面打开设置，找到“个性化”，在其中填写“自定义指令”。这里面设置的就是全局的 agents.md 文件。

设置全局文件后，对于所有的项目都会生效。这个设好了，不管你以后开多少个新对话，他都会记得。

比如，你可以自定义指令。

  请默认用中文回答。
如果涉及代码或命令，请先用大白话解释目的，再给具体操作。
如果要修改文件、运行命令、访问外部账号，请先告诉我风险。
如果我的需求信息不完整，请先问我缺什么，不要直接编。

AGENTS.md编写的模板格式推荐（或者直接让AI帮你生成）：

  # AGENTS.md

## 项目概览

- 项目类型：
- 主要语言：
- 关键目录：

## 常用命令

- 安装依赖：`...`
- 本地开发：`...`
- 运行测试：`...`
- 类型检查：`...`
- 格式化：`...`

## 代码规范

- 遵循现有代码风格。
- 不做无关重构。
- 新增功能必须补充或更新测试。

## 安全边界

- 不读取或提交 `.env`、密钥和私有凭据。
- 不执行删除生产数据的命令。
- 修改数据库迁移前先说明影响。

## 交付要求

- 说明改动文件。
- 说明验证命令和结果。
- 说明未验证项和剩余风险。

https://agents.md/

然后记忆的两个功能，我推荐都可以在设置下的个性化中打开。

针对于我们打开的项目，我们可以在项目根目录下创建一个 agents.md 的文件，它是 Codex 的记忆文件，Codex 在开始工作之前会先读取 agents.md 的内容。

1、在 agents.md 文件里面写入一些内容。

2、回到 Codex 对话窗口问它：“这是一个什么样的项目？”

从这里可以看出，Codex 会读取 agents.md 文件，把里面的内容自动带入到新的对话，作为它们的上下文。

当然，在当前目录根目录下创建 agents.md 只对当前文件夹生效，并不是全局生效的。

5、权限：不要一上来ALL IN

Codex 会请求权限，比如读文件、改文件、运行命令、访问网页、连接账号。

新手最容易犯的错误是：看到确认按钮就点。

不要这样。

第一次使用，建议只给当前项目文件夹权限。

如果看不懂权限请求，就直接问 Codex：

  请用小白能懂的话解释：你现在请求的权限会访问什么？为什么这个任务需要它？有没有更低风险的做法？

看到权限确认就点，这是最危险的习惯。

不懂就问它解释。

另外，很多新手一上来，就给了 Codex 完全访问权限，结果它误删了重要文件或把代码改得面目全非。建议始终从"默认权限"开始，熟悉它的行为模式后再逐步放开。

6、模型和推理强度：先默认，复杂任务再提高

小白不需要一上来研究每个模型。

建议：

• 普通问答：默认即可。
• 复杂项目：用更强模型或更高推理。

一句话：

小任务别浪费额度，大任务别省过头。

7、自动化先别急

Codex有一个听起来很诱人的功能：自动化，比如你可以用它：

• 每天自动总结。
• 每周自动检查。
• 定时抓资料。
• 到点继续写文章。
• 自动化测试。
• ...

但新手别急，先把手动流程跑通，再自动化。

如果你手动都没说清楚“输入是什么、输出到哪里、失败怎么办”，自动化只会把混乱定时重复一遍。

只有当一个工作流已经足够稳定、而且会重复发生时，才需要考虑把它交给 自动化来处理。

3. Codex进阶功能：插件、技能、MCP

小白最容易把 Plugin、Skill、MCP 混在一起，先别纠结技术定义，看这张表：

名词	小白理解	什么时候用
Plugin 插件	给 Codex 装能力包	做表格、PPT、文档、浏览器操作
Skill 技能	工作流说明书	固定写作流程、项目规范、测评流程
MCP	外部工具通道	连接更专业的本地或远程工具

你刚开始不需要全懂，记住一个顺序：

  先用 Codex桌面App自带能力
→ 不够再装插件
→ 重复任务沉淀成 Skill
→ 特殊工具再考虑 MCP

不要一上来装一堆插件、技能。

接下来，我们重点介绍一下 Codex 里的 Skills 和 Plugins，在codex里，都是从插件这个tab点进去，然后顶部就有tab可以切换插件和技能。

3.1 Skill 是什么、怎么用？

Skill 技能这个东西，字面意思，给Agent用的技能。

可以理解为一份让 Codex 稳定执行重复任务的操作手册或者说是工作流说明书。

Skill 很容易被说玄，其实它最适合小白理解成：一套固定工作流说明书。

比如你经常让 Codex 整理工具资料，每次都要说：

• 先问我缺什么信息。
• 再判断哪些资料已经够用。
• 再整理资料。
• 再生成对比表。
• 再写 Markdown 报告。
• 最后检查哪些信息还需要核实。

你每次都打一遍，很麻烦。

那就可以把它写成一个 Skill 或项目内流程文件。

当某个工作流已经很固定，就可以把它沉淀成一个 Skill，减少每次重复描述的成本。

一个 Skill 通常会包含：

1. 一个 SKILL.md 文件这里会写清触发场景、执行步骤、输出格式和注意事项。
2. 必要时配套脚本、模板或参考文件用来帮助 Codex 更稳定地完成任务。

Skill 常见使用方式是：

• 先准备或安装可用的 Skill。
• 在发起任务时明确说明你希望使用哪个 Skill。
• 让 Codex 按这个 Skill 的流程执行，再根据结果继续追问或迭代。

3.2 插件是什么，怎么用？

Plugin 更像一种打包和分发机制，用来把可复用工作流、应用集成、MCP 服务配置等能力组合起来，方便在项目或团队中统一安装和使用。

你可以把两者简单理解：

• Skill 是工作说明书，关注“这件事应该怎么做”。
• Plugin 是“装着说明书、工具和连接配置的工具箱”，关注“把哪些能力打包起来，方便安装和复用”。

所以 Skill 往往是具体流程本身，而 Plugin 更像承载这些流程和集成能力的安装单元。

有些插件里会包含一个或多个 Skills，也可能附带应用集成或 MCP 配置。这样团队在迁移环境时，不用手动一个个配置。

一句话概括：插件就是把一组技能、工具、配置打包起来的安装包，插件是比技能更牛逼更成熟的东西。

直接点击右上角的插件tab菜单，进入插件管理界面，批量管理你的插件和skills。（可按需安装对应的插件）

比如：

• 你要做 PPT，再考虑 Presentations。
• 你要处理 Excel，再考虑 Spreadsheets。
• 你要操作浏览器，再考虑 Browser 或 Chrome 相关能力。
• 你要控制电脑，再考虑Computer User，这个插件是Codex上最棒的能力之一，能通过视觉化的方式操控你电脑的。

每次只为一个明确任务装一个插件。比如你希望Codex能控制Chrome浏览器，则可以安装Chrome插件。

在Codex对话框中，可以直接从插件列表中选择已安装的插件

还可以使用@命令调出我们已安装的插件列表。

但需要注意，插件不是越多越好，而是越明确越好，先明确任务，再装插件。

3.3 MCP ：先知道，但不必急着装

MCP 是 Model Context Protocol。

这名字听起来很吓人。

小白可以先这样理解：MCP 是让 Codex 连接外部工具或外部资料的一种通道。

但对大多数小白来说，前期不用急着配 MCP。

为什么？因为你一开始最需要的是：

• 建好项目文件夹。
• 写好 AGENTS。
• 学会控权限。
• 学会让 Codex 解释它做了什么。

这些都不需要 MCP，所以小白顺序还是那句：

  插件优先，Skill 其次，MCP 最后。

什么时候再研究 MCP？

• 你明确知道要接哪个工具。
• 官方插件满足不了。
• 你需要在 VS Code / CLI 里接入某个资料源。

4. 跑通第一个小项目

现在，终于可以开发任务了。

由于额度关系（plus帐号到期了没续，现在用的是免费额度），接下来先带大家，直接开发一个小网页，走一遍流程。

当你建好一个项目文件夹之后。按一下左边的加号，打开计划模式的开关。计划模式就是只规划不动手，先帮你把方案理清楚，你确认了再开始做。

每个稍微复杂一点的项目，我都推荐你先用这个模式过一遍。

计划模式最大的价值不是"省时间"，而是强迫你把模糊需求转化为清晰指令。很多新手抱怨"Codex 不听话"，其实根源是自己的需求描述不够具体。计划模式相当于一个"需求预审"环节，帮你发现遗漏和矛盾。

打开以后对话框左边会出现一个小图标，说明你现在在计划模式下。

接下来，咱们跟Codex说：

  帮我做一个「狂师.AI进化社」介绍的网页，要好看，要有设计感，把功能、定位按层级分类展示出来。

把提示词发送给 Codex 后，它会先扫描你建好的项目文件夹，接着自动调用「brainstorming（头脑风暴）」和「frontend-design（前端设计）」两个内置技能：先拆解你的需求（比如 “狂师.AI 进化社” 的定位），再输出视觉风格选项（比如科技风、简约风、成长路线图风格），并主动询问你是否需要先生成视觉预览 —— 这一步建议新手一定要做，避免 AI 直接开发出的风格和你预期偏差太大。

打开方式，选择用Chrome浏览器打开

我选择C（成长路线图），接着它会先问你几个问题（问题我就不一个个放截图了）。

你直接点选回答就行，回答完以后，它会给你一份比较完整的方案计划。

当你确认没毛病之后，就可以开始实施。中间的开发过程我就不截图了，反正全自动的。

这种小网页，基本就是一遍成，做完之后，他就会给你提示，你可以直接用Codex的内置浏览器打开看看效果。

怎么样，效果还算不错吧。

如果你用的是Codex内置浏览器打开，还可以提供了一个非常实用的功能：批注。点开批注之后，你可以直接在页面上圈选任何元素，写上你的修改意见。比如说我想让他改成官方的logo，直接在页面上选中它，手动输入文字说明就行了，不用再截图或者用嘴去描述一大堆。（这里就不再演示了，感兴趣的同学，自行尝试吧）

写在最后

如果你能坚持读到这里，相信应该已经掌握了Codex的常用功能使用方法了。

概括起来，如果你是第一次用codex，按这四步检查

1. 先选工作模式：做代码、网站、脚本、仓库任务时选「适用于编程」；写文案、整理资料、做非代码任务时可以选「适用于日常工作」。
2. 先别急着开最大权限：刚开始建议让 Codex 只在当前工作区内读写文件，遇到联网、系统文件、危险命令时再单独审批。
3. 先配置工作目录：第一个任务尽量使用一个空文件夹或测试项目，不要直接把重要项目交给新手阶段的 Codex。
4. 先观察使用情况：如果任务经常中断、额度告急或模型响应变慢，再回到「使用情况」和套餐页面确认限制。

最后送给你一张清单。如果你是第一次用 Codex，照着勾就行。

  ## Codex 新手自检清单
- [ ] 从OpenAI官方入口安装 Codex（拒绝第三方安装包）；
- [ ] 清楚 Codex 桌面App/网页版/CLI/VS Code扩展的核心区别（新手先吃透桌面App）；
- [ ] 建立独立的项目根目录（如～/codex-projects），每个项目单独建文件夹；
- [ ] 创建AGENT.md文件
- [ ] 能分清插件/Skill/MCP的核心用途，不盲目安装；
- [ ] 仅授权Codex访问当前项目文件夹（不开放整个硬盘权限）；
- [ ] 明确要求Codex：“需求不全时先追问，不擅自编造内容”；
- [ ] 每次AI修改文件后，先让它解释“改了什么、为什么改”，再确认生效。

如果这张清单你都能勾上，恭喜你，你已经不是“打开 Codex 只会聊天”的小白了。

最后送一句话：

工具本身不产生价值，使用工具的方式才产生价值。

Codex 再强，也只是你手中的锤子。能不能盖出好房子，取决于你愿不愿意先学会画图纸。

现在，打开 Codex，开始你的第一个项目吧。🎯

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯云AI编程达人秀

openai

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

登录后参与评论

0 条评论

热度