
近期,Codex 在 AI 圈热度一路飙升,几乎刷屏。打开某号、某音、某站等平台随处可见相关讨论,到处都在聊 Codex,俨然成为 AI 圈的「现象级工具」。
但我相信更多的朋友和我之前一样,第一次听到 Codex,第一反应不是 “哇,好强”,而是:
这玩意到底从哪开始用?一会儿说 Claude Code,一会儿说 Codex,彻底晕了😷
功能很像、宣传都很猛,很容易把新手绕进去。
所以,这篇教程不讲跑分、不讲复杂原理,只讲新手第一次真正上手时,最需要搞懂、最需要掌握的东西。
废话不多说,我们直接开始。
Codex 是 OpenAI 于 2025 年推出的 AI 编程智能体,到 2026 年已成为开发者圈子里最热门的生产力工具之一。
它和我们日常使用的聊天机器人有着本质区别,不只是简单问答对话,还能直接读取本地项目文件、编辑文档与代码、执行系统命令、操控各类软件,同时支持联网检索信息、网上查资料这些工作,它都能包揽,还能持续跟进长期复杂任务、自动完成一系列操作。
不少人会把它和 Claude Code 作对比,两者能力上相近,但 Codex 搭配了完整的可视化界面,操作一目了然,更适合新手小白用户使用。
一切的前提,是先要把CodeX安装到你的本地电脑。
当然还有一个提前:就是需要有魔法和ChatGPT账号,这个大家只能自己去想办法解决了,如果是AI进化社的成员,之前有教程专门讲过。
基本流程是:
具体操作:
1、我们可以直接去OpenAI的Codex官网下载安装,访问:https://openai.com/zh-Hans-CN/codex/,Mac和Windows都有,我就用Mac做个演示,点击下载安装。

2、下载好dmp安装包后,双击打开,把Codex拖到应用程序中。

首次启动时,macOS 可能提示「无法验证开发者」,进入「系统设置 → 隐私与安全性」,点击「仍要打开」 安装这件事本身不复杂,最重要的是别乱下载。建议只从 OpenAI 官方入口下载。
3、打开Codex,用ChatpGPT帐号登录,也可以使用其他方式使用Codex,比如API key。

如果你只是体验,优先用账号登录,不要一上来研究 API Key。
免费账号能不能用,要看当时官方开放策略和额度。长期使用,通常还是建议至少准备 Plus 或更高套餐。因为 Codex 一旦进入项目、读文件、改文件、跑长任务,消耗还是比较大。
如果你只把 Codex 当成 ChatGPT 的另一个入口,那它确实就是一个聊天框。
但 Codex 真正厉害的地方,不是“回答问题”,而是“能直接进入项目文件,扮演你的工作助手帮你做事”。
比如,它可以做这些事:
对于新手来讲,要先建立一个重要的意识:
不要一上来就用“Codex 直接开发项目”,而是要先学会了解它。
Codex 可以在多个入口使用,比如 桌面App、CLI、Web/Cloud、IDE extension 等。具体口和按钮名称会实时更新,以自己当前看到的界面为准。
小白先看这张表就够了:
使用方式 | 解释 | 适合谁 | 小白建议 |
|---|---|---|---|
Codex 桌面App | 装在电脑上的 Codex 工作台 | 想管理本地项目的人 | 主推,从这里开始 |
Codex Web / Cloud | 在网页或云端委托任务 | 想让任务离开本地持续跑的人 | 后面再学 |
Codex CLI | 命令行里的 Codex | 会终端的人 | 小白先不用 |
IDE / VS Code 扩展 | 在代码编辑器里用 Codex | 写代码、改网页、改项目的人 | 有项目后再用 |
GitHub 里的 Codex | 在代码仓库里委托任务 | 管 GitHub 仓库的人 | 后期再学 |
建议先把桌面 App 这条路跑通,后面去 VS Code、Cloud、GitHub 都会顺很多。
打开 Codex 桌面 App,进来后,界面长这样,我们先带大家快速认识一下各个区域。

中间这一大块,就是我们平时的工作区,左侧栏包含两个主要入口:Chat(对话) 和 Project(项目)。
我们可以在左侧项目这边点击这个加号新建文件夹,或者使用一个现有的。

Codex 桌面 App 的对话框与 ChatGPT 网页端类似,但额外提供了以下功能:

然后在对话框左下角有三档权限选择。

rm -rf、提权等。适合日常开发,碰到有风险的操作会拦一下。小事自动过,大事问你,新手最推荐。当然,用着用着,你可能会好奇自己还剩多少额度。
点左下角的设置,找到剩余额度,就能看到你5小时内还剩多少、这周还剩多少、啥时候刷新。

到这里,先别急着让它改文件,先做设置。
Codex 的设置会随着版本变化,但小白可以先关注 这几类设置。
你不需要把每个按钮都研究透。先把最影响使用体验和安全边界的地方搞清楚。
跟进行为改成引导,这样在中途你想修改的时候就可以直接插入,而不是必须等着当前任务做完才能进行新一轮的对话。

image-20260531111919197
开启按组合键发送的开关选项,默认为Enter发送。

因为你后面写项目需求时,经常会写很长:
如果写一半按回车就发出去了,Codex 可能会拿着半截需求开始干活。(别问我是怎么知道的,我吃了很多次亏才想起来要设置一下😂)
如果你是小白,很容易犯一个错误:什么都没配置好,就直接让它干活。
结果就是文件到处飞。先建项目,再开始。
先说结论:新手第一次用 Codex,最该先配置的不是模型,而是项目文件夹。
这一步是全文最重要的地方。
新手用 Codex,第一件事不是装插件,而是建立项目根目录。
你可以建一个这样的文件夹:
~/codex-projects这个目录以后专门放 Codex 项目。
不要把项目直接放在:
为什么?因为 Codex 会读文件、写文件、生成中间数据、跑脚本。
例如,如果你把项目塞进日常知识库,它可能把一堆日志、配置、代码、缓存都放进去。知识库就被污染了。
所以先建一个干净的项目根目录。
有了项目根目录,每个新项目再建一个独立文件夹。比如:
~/codex-projects/project1
~/codex-projects/project2
~/codex-projects/project3接下来,设置AGENTS.md,也就是你给codex设置的家法规矩。
对于 Codex 而言,我们每开启一个新的对话窗口,它都会进入一个全新的上下文。它不记得之前发生了什么,对于整个项目的记忆都是空白的。
所以 Codex 提供了记忆系统来解决这样的问题:AGENTS.md 就是给 Codex 这类编码Agent看的项目说明文件,它可以描述项目结构、开发命令、测试要求、代码风格和协作边界。
AGENTS.md 的配置分为两个层级:全局级(影响所有项目)和项目级(仅影响当前文件夹)。建议先配置全局规则作为底线,再为特定项目补充专属要求。
如果想要全局生效,有以下两种方式:
设置全局文件后,对于所有的项目都会生效。这个设好了,不管你以后开多少个新对话,他都会记得。
比如,你可以自定义指令。
请默认用中文回答。
如果涉及代码或命令,请先用大白话解释目的,再给具体操作。
如果要修改文件、运行命令、访问外部账号,请先告诉我风险。
如果我的需求信息不完整,请先问我缺什么,不要直接编。
AGENTS.md编写的模板格式推荐(或者直接让AI帮你生成):
# AGENTS.md
## 项目概览
- 项目类型:
- 主要语言:
- 关键目录:
## 常用命令
- 安装依赖:`...`
- 本地开发:`...`
- 运行测试:`...`
- 类型检查:`...`
- 格式化:`...`
## 代码规范
- 遵循现有代码风格。
- 不做无关重构。
- 新增功能必须补充或更新测试。
## 安全边界
- 不读取或提交 `.env`、密钥和私有凭据。
- 不执行删除生产数据的命令。
- 修改数据库迁移前先说明影响。
## 交付要求
- 说明改动文件。
- 说明验证命令和结果。
- 说明未验证项和剩余风险。
https://agents.md/
然后记忆的两个功能,我推荐都可以在设置下的个性化中打开。

针对于我们打开的项目,我们可以在项目根目录下创建一个 agents.md 的文件,它是 Codex 的记忆文件,Codex 在开始工作之前会先读取 agents.md 的内容。
1、在 agents.md 文件里面写入一些内容。

2、回到 Codex 对话窗口问它:“这是一个什么样的项目?”

从这里可以看出,Codex 会读取 agents.md 文件,把里面的内容自动带入到新的对话,作为它们的上下文。
当然,在当前目录根目录下创建 agents.md 只对当前文件夹生效,并不是全局生效的。
Codex 会请求权限,比如读文件、改文件、运行命令、访问网页、连接账号。
新手最容易犯的错误是:看到确认按钮就点。
不要这样。
第一次使用,建议只给当前项目文件夹权限。
如果看不懂权限请求,就直接问 Codex:
请用小白能懂的话解释:你现在请求的权限会访问什么?为什么这个任务需要它?有没有更低风险的做法?看到权限确认就点,这是最危险的习惯。
不懂就问它解释。
另外,很多新手一上来,就给了 Codex 完全访问权限,结果它误删了重要文件或把代码改得面目全非。建议始终从"默认权限"开始,熟悉它的行为模式后再逐步放开。
小白不需要一上来研究每个模型。
建议:
一句话:
小任务别浪费额度,大任务别省过头。
Codex有一个听起来很诱人的功能:自动化,比如你可以用它:
但新手别急,先把手动流程跑通,再自动化。
如果你手动都没说清楚“输入是什么、输出到哪里、失败怎么办”,自动化只会把混乱定时重复一遍。

只有当一个工作流已经足够稳定、而且会重复发生时,才需要考虑把它交给 自动化来处理。
小白最容易把 Plugin、Skill、MCP 混在一起,先别纠结技术定义,看这张表:
名词 | 小白理解 | 什么时候用 |
|---|---|---|
Plugin 插件 | 给 Codex 装能力包 | 做表格、PPT、文档、浏览器操作 |
Skill 技能 | 工作流说明书 | 固定写作流程、项目规范、测评流程 |
MCP | 外部工具通道 | 连接更专业的本地或远程工具 |
你刚开始不需要全懂,记住一个顺序:
先用 Codex桌面App自带能力
→ 不够再装插件
→ 重复任务沉淀成 Skill
→ 特殊工具再考虑 MCP不要一上来装一堆插件、技能。
接下来,我们重点介绍一下 Codex 里的 Skills 和 Plugins,在codex里,都是从插件这个tab点进去,然后顶部就有tab可以切换插件和技能。

Skill 技能这个东西,字面意思,给Agent用的技能。
可以理解为一份让 Codex 稳定执行重复任务的操作手册或者说是工作流说明书。

Skill 很容易被说玄,其实它最适合小白理解成:一套固定工作流说明书。
比如你经常让 Codex 整理工具资料,每次都要说:
你每次都打一遍,很麻烦。
那就可以把它写成一个 Skill 或项目内流程文件。
当某个工作流已经很固定,就可以把它沉淀成一个 Skill,减少每次重复描述的成本。
一个 Skill 通常会包含:
SKILL.md 文件
这里会写清触发场景、执行步骤、输出格式和注意事项。Skill 常见使用方式是:

Plugin 更像一种打包和分发机制,用来把可复用工作流、应用集成、MCP 服务配置等能力组合起来,方便在项目或团队中统一安装和使用。
你可以把两者简单理解:
Skill 是工作说明书,关注“这件事应该怎么做”。Plugin 是“装着说明书、工具和连接配置的工具箱”,关注“把哪些能力打包起来,方便安装和复用”。所以 Skill 往往是具体流程本身,而 Plugin 更像承载这些流程和集成能力的安装单元。
有些插件里会包含一个或多个 Skills,也可能附带应用集成或 MCP 配置。这样团队在迁移环境时,不用手动一个个配置。
一句话概括:插件就是把一组技能、工具、配置打包起来的安装包,插件是比技能更牛逼更成熟的东西。
直接点击右上角的插件tab菜单,进入插件管理界面,批量管理你的插件和skills。(可按需安装对应的插件)
比如:

每次只为一个明确任务装一个插件。比如你希望Codex能控制Chrome浏览器,则可以安装Chrome插件。

在Codex对话框中,可以直接从插件列表中选择已安装的插件

还可以使用@命令调出我们已安装的插件列表。

但需要注意,插件不是越多越好,而是越明确越好,先明确任务,再装插件。
MCP 是 Model Context Protocol。
这名字听起来很吓人。
小白可以先这样理解:MCP 是让 Codex 连接外部工具或外部资料的一种通道。
但对大多数小白来说,前期不用急着配 MCP。
为什么?因为你一开始最需要的是:
这些都不需要 MCP,所以小白顺序还是那句:
插件优先,Skill 其次,MCP 最后。什么时候再研究 MCP?
现在,终于可以开发任务了。
由于额度关系(plus帐号到期了没续,现在用的是免费额度),接下来先带大家,直接开发一个小网页,走一遍流程。
当你建好一个项目文件夹之后。按一下左边的加号,打开计划模式的开关。计划模式就是只规划不动手,先帮你把方案理清楚,你确认了再开始做。
每个稍微复杂一点的项目,我都推荐你先用这个模式过一遍。
计划模式最大的价值不是"省时间",而是强迫你把模糊需求转化为清晰指令。很多新手抱怨"Codex 不听话",其实根源是自己的需求描述不够具体。计划模式相当于一个"需求预审"环节,帮你发现遗漏和矛盾。
打开以后对话框左边会出现一个小图标,说明你现在在计划模式下。

接下来,咱们跟Codex说:
帮我做一个「狂师.AI进化社」介绍的网页,要好看,要有设计感,把功能、定位按层级分类展示出来。把提示词发送给 Codex 后,它会先扫描你建好的项目文件夹,接着自动调用「brainstorming(头脑风暴)」和「frontend-design(前端设计)」两个内置技能:先拆解你的需求(比如 “狂师.AI 进化社” 的定位),再输出视觉风格选项(比如科技风、简约风、成长路线图风格),并主动询问你是否需要先生成视觉预览 —— 这一步建议新手一定要做,避免 AI 直接开发出的风格和你预期偏差太大。

打开方式,选择用Chrome浏览器打开

我选择C(成长路线图),接着它会先问你几个问题(问题我就不一个个放截图了)。

你直接点选回答就行,回答完以后,它会给你一份比较完整的方案计划。

当你确认没毛病之后,就可以开始实施。中间的开发过程我就不截图了,反正全自动的。
这种小网页,基本就是一遍成,做完之后,他就会给你提示,你可以直接用Codex的内置浏览器打开看看效果。


怎么样,效果还算不错吧。
如果你用的是Codex内置浏览器打开,还可以提供了一个非常实用的功能:批注。点开批注之后,你可以直接在页面上圈选任何元素,写上你的修改意见。 比如说我想让他改成官方的logo,直接在页面上选中它,手动输入文字说明就行了,不用再截图或者用嘴去描述一大堆。(这里就不再演示了,感兴趣的同学,自行尝试吧)
如果你能坚持读到这里,相信应该已经掌握了Codex的常用功能使用方法了。
概括起来,如果你是第一次用codex,按这四步检查
最后送给你一张清单。如果你是第一次用 Codex,照着勾就行。
## Codex 新手自检清单
- [ ] 从OpenAI官方入口安装 Codex(拒绝第三方安装包);
- [ ] 清楚 Codex 桌面App/网页版/CLI/VS Code扩展的核心区别(新手先吃透桌面App);
- [ ] 建立独立的项目根目录(如~/codex-projects),每个项目单独建文件夹;
- [ ] 创建AGENT.md文件
- [ ] 能分清插件/Skill/MCP的核心用途,不盲目安装;
- [ ] 仅授权Codex访问当前项目文件夹(不开放整个硬盘权限);
- [ ] 明确要求Codex:“需求不全时先追问,不擅自编造内容”;
- [ ] 每次AI修改文件后,先让它解释“改了什么、为什么改”,再确认生效。如果这张清单你都能勾上,恭喜你,你已经不是“打开 Codex 只会聊天”的小白了。
最后送一句话:
工具本身不产生价值,使用工具的方式才产生价值。
Codex 再强,也只是你手中的锤子。能不能盖出好房子,取决于你愿不愿意先学会画图纸。
现在,打开 Codex,开始你的第一个项目吧。🎯
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。