首页
学习
活动
专区
圈层
工具
发布

#ocr

物流提单智能解析:覆盖海运、空运与海运单的自动化处理方案(附GitHub项目地址)

合合技术团队

项目介绍:这是一个面向国际物流与供应链场景的提单智能解析工具。支持上传 PDF、扫描件及拍照件格式的海运提单、海运单、空运单等运输单据,自动识别单据类型,抽取发...

1210

融合“身份证识别+活体检测+数据比对”的人脸核身技术,赋能政务、金融、民生、互联网等多个领域的数字化实名认证场景

中科逸视OCR专家

在数字化身份认证全面普及的当下,传统账号密码、静态证件核验模式已无法满足远程、高效、高安全的身份校验需求。人脸核身技术作为新一代可信身份认证核心方案,深度融合身...

3410

FireRed-OCR开源:2B模型拿下文档解析第一

代码简单说

在做知识库构建和 RAG 项目时,我踩过最多的坑,不是向量检索,而是文档结构还原。

13110

智谱GLM视觉模型家族横向评测:从轻量OCR到多模态Agent,一文搞清怎么选

代码简单说

通过 API 统一接入 zai-sdk,可轻松搭建高可用、低延迟的视觉智能工作流。

24410

[开源]一个 Rust 库搞定 macOS/Windows/Linux 三端 OCR:uniOCR 的 6 个使用要点

DevLlama

uniOCR 就是为了这件事而生的——一个 Rust crate,把上面这些底层差异全部封进同一个 OcrEngine 接口。你写一次代码,三端跑通,云端切换只...

11010

解析银行OCR技术全方案:从核心场景到技术难点

楚识科技OCR

银行业正在经历从“柜面纸质化”到“全流程数字化”的深刻变革。在这个过程中,OCR(光学字符识别)技术承担着将非结构化图像数据转化为结构化业务信息的核心任务。一份...

8900

离线、轻量、免费的OCR信创桌面工具

DeskUI

OCR这项技术历来是大企业的专属,而且由于实现起来非常复杂,造成类库依赖非常严重,结果就是特别重,动辄需要几个G,甚至上百G空间,往往还需要连接互联网。这种限制...

10710

ASR + OCR + LLM 三重校对:如何做到 95%+ 中英字幕准确率

gavin1024

摘要 单一ASR在中文综艺、专业术语、混合口音场景常超10%字错率。本文拆解ASR+OCR+LLM三路并行校对的工业方案,从特征级融合到置信度仲裁,结合腾讯云媒...

20110
领券