所谓"三表",是企业财报的三大核心报表:
报表名称 | 核心内容 | 关键作用 |
|---|---|---|
资产负债表 | 资产、负债、所有者权益 | 反映企业某一时点的财务状况 |
利润表 | 收入、成本、费用、利润 | 反映企业某一期间的经营成果 |
纳税申报表 | 应税收入、应纳税额 | 反映企业某一期间的纳税情况 |
常见勾稽点包括:
三张表之间存在严密的数学勾稽关系,任何一处数字对不上,都可能意味着录入数据错误、虚增收入、隐匿负债或跨表造假等风险信号。传统做法是人工翻 PDF、手动录入 Excel、逐条公式核对,效率低且易出错。本次最佳实践通过WorkBuddy平台,基于腾讯云OCR表格识别能力打造的financial-statement-check Skill,成功将这一流程从数小时压缩至几分钟。
该技能已上架ClawHub社区:https://clawhub.ai/zt1314p-design/financial-statement-check
财报审核的难度是逐层递进的:
企业提交的财报通常是 PDF、扫描件甚至翻拍图片,动辄数十上百页。人工逐页翻阅、定位关键表格、抄录数字,一份年报仅数据录入就要数小时,准确率还难以保证。在批量审核场景下(如信贷审批一天过十几家),人力瓶颈尤为突出。
财报表格存在跨行合并、跨列嵌套、多级小计等复杂版式,且格式五花八门——有文字型 PDF、有扫描图片型 PDF、有拍照件。普通工具面对这些文件,要么无法读取图片内容,要么丢失表格结构,根本无法完成结构化提取。
即使拿到了数据,真正的挑战才刚开始。同一份财报里资产负债表可能用"万元",利润表用"元";涉外企业还夹杂美元、港币。不同企业对同一科目的措辞各异("应交税费"vs"应交税金"),三表之间数十条勾稽规则涉及跨期、跨表、税会差异等多维度校验。手工统一单位、对齐口径、逐条核算,多一个零少一个零都可能引发重大决策偏差。
我们以腾讯公司 2025 年度财报为例,演示基于在 WorkBuddy 平台使用 financial-statement-check 技能的全流程实操。
📌 说明:上市公司公开年报格式规范,适合作为演示样本;实际场景中该流程同样适用于中小企业报表、银行流水财报等。
步骤 | 耗时 |
|---|---|
定位三表页码 | 10~20 分钟 |
数据录入 Excel | 60~90 分钟 |
公式设置与核对 | 30~60 分钟 |
差异复查 | 20~40 分钟 |
合计 | 2~4 小时 |
主要风险:手工录入错误率高,规则漏检高,扫描件/图片型 PDF 完全无法处理。
financial-statement-check 技能包financial-statement-check 是一个API封装的Skill(技能包),它将腾讯云 OCR 表格识别能力、智能页码定位、三表字段映射、规则引擎校验等完整流水线封装为开箱即用的技能,核心资源包括:
scripts/table_ocr.py —— 腾讯云 RecognizeTableAccurateOCR 调用脚本(支持 PDF/图片、并行识别);references/cross-check-rules.md —— 六大类勾稽校验规则定义;references/field-mapping.md —— 三表科目字段映射、单位币种统一规则;与直接调用腾讯云 API 不同,该技能在感知层(自动触发)、编排层(流水线串联)、输出层(结构化报告)做了完整封装,无需理解底层 API 即可使用。
确认技能已启用
在 workbuddy 等平台导入 financial-statement-check 技能。(Skill地址:https://clawhub.ai/zt1314p-design/financial-statement-check,支持CLI与Prompt安装)
配置腾讯云密钥
在环境变量中设置:
2 1export TENCENTCLOUD_SECRET_ID="你的SecretId"2export TENCENTCLOUD_SECRET_KEY="你的SecretKey"🔗 密钥申请:腾讯云 API 密钥管理 🔗 OCR 服务购买:腾讯云文字识别 OCR(选择"表格识别高精度版")
发送财报文件,一句话触发
在 WorkBuddy 中,用户只需:
技能会自动触发完整流水线,无需任何额外配置或编码。
接下里看看实际演示和效果。
上传腾讯 2025 年报 PDF 后,workbuddy 自动进入处理流水线。首先通过 PyMuPDF 提取全文文本进行页码定位,随后对定位到的页面并行调用腾讯云表格 OCR:

可以看到:
整个 financial-statement-check 技能流水线包含 7 个步骤,自动串联执行:

各步骤摘要:
技能最终输出标准化的审核报告,包含报告元信息、时间检查、原始指标等:

报告要点:

除 WorkBuddy 外,CodeBuddy、Qclaw、OpenClaw、Hermes Agent等平台也可支持类似能力,大家可以参考以上实践。
维度 | 人工+Excel | Skills技能(推荐) | 裸 API 自行开发 |
|---|---|---|---|
单份耗时 | 2~4 小时 | 3~8 分钟 | 开发后同等 |
录入错误率 | 5~8% | <0.5% | <0.5% |
规则覆盖率 | 60~70% | 90%+ | 取决于实现 |
扫描件/图片处理 | ❌ | ✅ | ✅ |
单位/币种统一 | 手工易错 | ✅ 自动 | 需自行实现 |
上手门槛 | 需资深经验 | 零门槛 | 需开发资源 |
维护成本 | — | 技能自动更新 | 需持续维护 |
技能的核心 OCR 能力来自腾讯云 RecognizeTableAccurateOCR(表格识别高精度版)接口:
在原有 OCR API 基础上,financial-statement-check 技能还增加了:
能力 | 说明 |
|---|---|
智能页码定位 | 先用 PyMuPDF 文本扫描定位三表页码,再针对性调用 OCR,避免浪费配额 |
三表自动识别 | 根据表头关键词和字段映射规则,自动判定每个表格归属 |
字段标准化 | 将不同企业的措辞差异("应交税费" vs "应交税金"等)统一映射为标准字段名 |
规则引擎 | 内置数十条勾稽规则,覆盖时间一致性、表内平衡、跨表校验、税会差异等六大类 |
异常分级输出 | 区分"必输出"与"仅异常时输出",报告简洁高效 |
用户自定义检查 | 支持附带自定义关注点,灵活扩展 |
财报审核是一个典型的"规则密集 + 数据提取"型任务。基于腾讯云OCR表格识别能力打造的financial-statement-check 技能,在 workbuddy 平台本质上做了三件事:
除了本文演示的财报三表勾稽场景,腾讯云 OCR 技能矩阵还覆盖了更广泛的业务场景:
同时,官方也上架了众多腾讯云OCR Skills在Skillhub、ClawHub等技能社区,满足不同的场景需要,用户可以根据自己的场景按需选择:
skills名称 | 链接 | 介绍 |
|---|---|---|
TencentCloud IDCard OCR | 腾讯云身份证识别(IDCardOCR)接口调用技能。可识别身份证图片中中国大陆居民二代身份证正反面信息(姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限等),支持身份证图片照片裁剪和多种告警功能 | |
TencentCloud BizLicense OCR | 腾讯云营业执照识别(BizLicenseOCR)接口调用技能。可识别营业执照图片上的字段信息(统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限、经营范围等)时,支持复印件/翻拍件告警检测、有效期自动拼接、电子营业执照图片识别及非营业执照的营业类证件图片识别。 | |
TencentCloud General OCR | 腾讯云广告文字识别(AdvertiseOCR)接口调用技能。当用户需要从图片中识别文字内容时,应使用此技能。支持中英文、横排、竖排及倾斜场景的图片文字识别,支持90度、180度、270度翻转场景的图片识别,返回文本框位置与文字内容。 | |
TencentCloud LicensePlate OCR | 腾讯云车牌识别(LicensePlateOCR)接口调用技能。当用户需要对中国大陆机动车车牌进行自动定位和识别时,应使用此技能。支持返回车牌号码、车牌颜色、置信度和像素坐标信息,支持多车牌场景识别。 | |
TencentCloud MLIDPassport OCR | 腾讯云护照识别(多国多地区)(MLIDPassportOCR)接口调用技能。当用户需要识别护照图片中中国大陆、港澳台地区或其他国家/地区的护照信息(护照ID、姓名、出生日期、性别、有效期、发行国、国籍、国家地区代码、MRZ码等)时,应使用此技能。支持图片Base64和URL两种输入方式,支持护照图片人像照片裁剪功能,支持80+国家/地区的可机读护照图片识别,同时支持复印件、翻拍、PS、反光、模糊、边框不完整等告警功能(仅国际站生效) | |
TencentCloud RecognizeTable OCR | 腾讯云表格识别v3(RecognizeTableAccurateOCR)接口调用技能。当用户需要从表格图片或PDF中识别常规表格、无线表格、多表格的内容,提取每个单元格的文字信息,或将表格图片识别结果导出为Excel文件时,应使用此技能。支持中英文表格图片、旋转表格图片、嵌套表格图片等复杂场景,识别效果优于表格识别V2。 | |
TencentCloud VatInvoice OCR | 腾讯云通用票据识别高级版(VatInvoiceOCR)接口调用技能。当用户需要识别发票图片中增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通/增值税专用)的全字段信息时,应使用此技能。支持识别发票图片中的发票代码、发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方/销售方信息、明细条目等全部字段,同时支持PDF格式发票图片识别。 | |
TencentCloud VehicleLicense OCR | 腾讯云行驶证识别(VehicleLicenseOCR)接口调用技能。当用户需要识别行驶证图片主页(车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期)或副页(号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录)信息时,应使用此技能。支持图片Base64和URL两种输入方式,支持复印件、翻拍、反光、模糊、边框不完整等告警功能,支持电子行驶证图片和拖拉机行驶证图片识别。 | |
TencentCloud ExtractDoc OCR | 腾讯云实时文档抽取Agent(ExtractDocAgent)接口调用技能。当用户需要从图片或PDF中按自定义字段名称进行结构化信息抽取时,应使用此技能。支持自定义字段名称、字段类型(KV对或表格字段)和字段提示词,实现灵活的文档信息提取。适用于合同、发票、报告等各类文档的结构化数据抽取场景。 | |
TencentCloud QuestionMark OCR | 腾讯云试题批改Agent接口调用技能。当用户需要对试卷图片或试题图片中的K12试卷或试题进行自动批改、手写答案识别、知识点分析时,应使用此技能。支持整卷图片批改和单题图片批改,提供题目切题、正误判定、答案对比、错误分析、知识点输出等结构化评估结果。 |
当机械性的数据提取和规则核对被AI技能接管之后,财务人员才有更多时间去做高价值的事情:审视异常背后的商业逻辑,判断数字之外的经营风险,做出需要行业洞察和职业判断的决策。工具解决效率问题,人解决判断问题,这才是 AI 在专业领域的正确打开方式。
扫码加入腾讯云AI产品Skills交流群:

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。