首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏IT技术分享社区

    Umi-OCR:开源可离线运行的高精度文字识别工具

    官网:https://github.com/hiroi-sora/Umi-OCR项目介绍:开源免费的离线OCR解决方案Umi-OCR是一款基于PaddleOCR-json C++识别引擎构建的离线文字识别工具 这种开放性使得Umi-OCR不仅是一款工具,更是一个可以不断进化的生态系统。在技术架构上,Umi-OCR采用了先进的深度学习算法和计算机视觉技术。 Umi-OCR支持多语言识别。用户可以根据需要导入相应的语言识别库,实现多语言文字的离线识别。 功能说明:全面强大的文字识别能力Umi-OCR的功能集设计涵盖了用户可能需要的各种文字识别场景,其功能可以分为以下几个核心类别:2.1 截图OCR识别Umi-OCR提供了便捷的截图识别功能,用户可以通过快捷键截取屏幕任意区域 对于程序员群体特别有用的是,Umi-OCR能够保留代码截图的缩进格式,极大方便了技术文档的处理。2.2 批量识别处理Umi-OCR支持批量处理数百张图片,没有数量限制。

    3.1K10编辑于 2025-11-10
  • 来自专栏程序那些事儿

    Umi-OCR:开源、免费、离线、多功能的 OCR 图片文字识别软件

    幸运的是,现在有一款令人惊叹的工具出现了,它可以轻松解决这个问题,它就是 Umi-OCRUmi-OCR 是一款免费、离线且功能强大的 OCR 软件,它以其卓越的文字识别能力和众多实用功能闻名于世。 不论是截屏、粘贴,还是批量导入图片,Umi-OCR 都能够快速准确地提取图像中的文字,让您可以轻松编辑、搜索和共享这些文字内容。 此外,Umi-OCR 还支持扫描和生成二维码,让您可以轻松处理与二维码相关的任务。 Umi-OCR 拥有直观简洁的用户界面,操作简单易用,无需专业技能即可上手。 最重要的是,Umi-OCR 完全离线运行,无需网络连接,保护您的隐私和数据安全。同时,它还提供了命令行调用和 HTTP 接口,方便开发者在自己的应用程序中集成 OCR 功能。 借助 Umi-OCR,您可以快速、准确地将纸质文档、图像中的文字转换为可编辑的电子文本。无论是日常办公、学习笔记,还是数字化档案管理,Umi-OCR 都是您的得力助手。

    23.8K20编辑于 2023-11-30
  • 来自专栏测试开发技术

    19.7K star!厉害了,最好用的OCR开源文字识别工具,没有之一!

    今天给大家推荐一个开源OCR项目:Umi-OCR,功能很强大,而且还可以离线使用,现在已经有了19.7k+的星标,足见该项目的受欢迎程度。 项目地址: https://github.com/hiroi-sora/Umi-OCR https://gitee.com/mirrors/Umi-OCR.git 项目结构: Umi-OCR ├─ Umi-OCR.exe /umi-ocr 本软件无需安装,解压后,点击 Umi-OCR.exe 即可启动程序。 也支持在别处复制图片,粘贴到Umi-OCR进行识别。 批量OCR 如果需要一次性识别多图片,这个功能值得拥有 只需要将所有的图片导入,然后点击开始任务,就可以批量识别了。 /blob/main/docs/README_CLI.md https://gitee.com/mirrors/Umi-OCR/blob/main/docs/README_HTTP.md 如果觉得有用,

    10.4K21编辑于 2024-03-22
  • 来自专栏Dance with GenAI

    图像版PDF文件OCR识别转换为文本的3款免费工具软件

    下载地址:官网下载或者加入AIGC部落下载 ●umi ocr Umi-OCR是一款开源的、离线使用的、功能强大的文字识别工具。 精准识别:Umi-OCR默认使用PPOCR-v3模型库,可以准确辨认常规文字,对于手写文字、方向不正、杂乱背景等复杂情况也有不错的识别率。 批量处理:Umi-OCR支持批量导入图片进行文字识别,并可将处理结果保存为多种格式的文件,如txt、md和jsonl等,极大提高了处理效率。 截屏功能:Umi-OCR还提供了即时截屏识别的功能,方便用户快速提取屏幕上的文字信息。 完全离线:Umi-OCR是一款完全离线的文字识别工具,无需网络连接即可使用,这样保护了用户的隐私和数据安全。 免费使用:Umi-OCR的所有代码开源,用户可以免费下载和使用,无需支付任何费用。 这是识别效果: 使用评价:识别速度较慢,识别准确率一般,无法保留原文档布局。

    2.7K10编辑于 2024-06-24
  • 来自专栏山行AI

    Umi-OCR一款火遍全网的智能文字识别工具

    另外此处附上一篇之前整理的OCR相关的文章供大家参考对比:OCRmyPDF—可智能识别PDF文本和图片信息的工具 介绍 Umi-OCR 是一个免费、开源的可批量处理的离线OCR软件。 特点 Umi-OCR 1. 免费:所有代码开源且完全免费。2. 方便:解压即用,离线运行,无需网络。3. 高效:自带高效率离线OCR引擎。4. 灵活:支持命令行、HTTP接口等多种调用方式。5. 构建项目的指南:https://github.com/hiroi-sora/Umi-OCR? 界面语言设置 界面设计——标签页 Umi-OCR v2 界面设计风格像浏览器一样由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,在每个标签页上进行特定的功能操作。 •更多接口和插件支持:为开发者提供更多接口,以便于Umi-OCR可以更容易地集成到其他应用中。

    15.5K10编辑于 2024-02-06
  • 来自专栏Lcry个人博客

    推荐一款纯离线OCR识别开源软件

    这次要推荐的是一款可以纯离线使用,无需担心隐私泄露的开源OCR软件,开源项目已经快到5k star的项目,名称叫“Umi-OCR”,OCR图片转文字识别软件,完全离线。 通过命令行控制Umi-OCR。 弹出悬浮的识别成功与否的提示。 定时或超过限度时自动清理引擎内存占用。 故您的CPU若不支持mkldnn(极早期AMD型号),可尝试使用 v1.2.5 的旧版本Umi-OCR。 在该问题解决之前,Umi-OCR发行版提供原始版本模型。 参考链接 Umi-OCR开源项目地址 Umi-OCR – 免费的离线 OCR 文字识别软件Windows 文章目录 推荐理由 软件一览 软件特性 下载地址 快速入门 准备 截图识别 粘贴图片到软件

    12.3K40编辑于 2023-04-09
  • 高效 OCR 图文识别工具盘点:熊猫 OCR 多引擎超便捷,Umi - OCR 开源可批量,天若 OCR 闪电识别!附下载攻略

    执行任务数量、执行窗口数量、全局延迟、运行速度调节程序设置=>快捷键、托盘设置、坐标模式脚本管理=>导入导出修改、分享脚本、备份脚本等调试设置=>运行中控、输出log、弹出信息框插件管理=>自带ocr插件、umi-ocr 、验证码识别、仿真驱动等生成脚本=>将制作好的脚本生成后发给客户、自定义软件页面内容Umi-OCR 截图OCR在 OCR(光学字符识别)领域,Umi-OCR 一直凭借其强大的功能和开源特性备受关注。 如今,Umi-OCR 迎来了 v2.1.5 版本,在这个具有特殊意义的三周年之际,带来了诸多令人惊喜的更新。注意:需要以管理员身份运行,具体操作,右键点击,选择以管理员身份运行特点:免费:完全免费。

    2.6K10编辑于 2025-07-07
  • 来自专栏开源小分队

    这是我见过最好用的OCR文字识别项目,没有之一!

    了不起最近在Github上面发现一款基于 PaddleOCR 的开源 OCR 项目——Umi-OCR,功能异常的强大,而且还可以离线使用,目前已经收获了近9k star。 自定义识别内容 这个功能应该是Umi-OCR的一大亮点特色,可以指定识别的内容区域或者屏蔽掉不需要识别的区域。 举个例子,我这里有三张和下图类似的图片,我只希望提取出发票号码。 更改文字方向 Umi-OCR 还支持识别竖排的文字,例如需要识别一首古诗,只要设置文字方向为竖排、从右到左即可。 这样古诗就直接转横过来了,确实很方便。 以上这些就是了不起感觉比较有代表性的功能,还有更多细节功能,可以自行去项目地址探索~ GitHub地址:https://github.com/hiroi-sora/Umi-OCR

    2.5K40编辑于 2023-10-21
  • OCR识别软件!支持离线,小巧但好用!

    之前也有推荐过一款Umi-OCR识别软件!也是非常好用方便的。 软件下载Umi-OCR 批量识别软件 OCR识别软件软件安装1、点击上面下载安装包,下载后解压(不要在网盘里解压)​​2.解压后找到exe这个文件夹,就可以直接打开使用了(为绿色免安装)。​​

    1.8K10编辑于 2025-09-17
  • 来自专栏翩翩白衣少年

    『GitHub项目圈选12』推荐5款本周 深受追捧 的AI开源项目

    2、Umi-OCR Umi-OCR 是一款基于百度自研的 PaddleOCR框架 开源的 OCR 项目源、免费的离线OCR软件。 Star:17.2k 项目地址:https://github.com/hiroi-sora/Umi-OCR 狂揽16.9k star!Umi-OCR文字识别太火了,解决了多少人的痛点!

    3.5K10编辑于 2024-01-21
  • 来自专栏开源服务指南

    LLaMA 2:开源的预训练和微调语言模型推理引擎 | 开源日报 No.86

    hiroi-sora/Umi-OCR[4] Stars: 11.1k License: MIT picture Umi-OCR 是一个免费、开源的离线 OCR 软件,适用于 Windows7 x64

    60640编辑于 2023-11-17
  • 来自专栏其它

    windows上好用的软件

    WGestures 鼠标手势工具f.lux 屏幕颜色调整adgurard 广告拦截PixPin 截图工具SwitchHost host编辑器postman api测试工具ConEmu 命令行替代版本Umi-OCR

    48910编辑于 2024-10-01
  • 来自专栏HelloGitHub

    去年最火的 JS 开源项目「GitHub 热点速览」

    HelloGitHub 热评 3.1 免费离线的 OCR 软件:Umi-OCR 3.2 50 个迷你前端项目:50projects50days 4. 往期回顾 1. 3.1 免费离线的 OCR 软件:Umi-OCR 主语言:Python 这是一款完全免费的 OCR 软件,支持离线、截屏识别文字、批量导入图片、横/竖排文字,还可以忽略水印区域,适用于 Windows

    78210编辑于 2024-01-11
  • 来自专栏技术指北

    带带弟弟OCR,Python 的一个识别验证码的开源库

    对于OCR文字提取,在之前也介绍过了Umi-OCR 这个工具,那么我们今天要分享的这个主要是来用于解决验证码相关的问题的一个开源工具。

    4.7K10编辑于 2024-04-01
  • 来自专栏程序小小事

    Umi-OCR完全指南:开源离线OCR识别软件下载安装使用教程|支持批量PDF二维码识别

    前言Umi-OCR是GitHub开源的专业级OCR识别工具,采用PaddleOCR-v3引擎,具有以下核心优势:✅ 完全离线运行 - 保护敏感数据安全100%免费开源 - 基于MIT许可协议⚡ 高效识别

    5.8K21编辑于 2025-07-28
  • 来自专栏JVMGC

    4k Star国产开源免费文字识别工具,强的很,适用于 Windows10,11 平台

    下载 Umi-OCR 软件本体含 简体中文&英文 通用识别库。 配套 多国语言识别扩展包 可导入 繁中,英,日,韩,俄,德,法 识别库,请按需下载。 main分支可能含有开发中的新功能。 地址:https://github.com/hiroi-sora/Umi-OCR 更多功能广大网友可以继续挖掘。

    4.4K10编辑于 2023-03-10
  • 来自专栏翩翩白衣少年

    MacOS平台翻译OCR软件,双管齐下,还可自定义插件,为其添砖加瓦!

    小编昨天为大家分享了Windows系统下的一款功能强大且免费的 OCR 开源工具 Umi-OCR

    96310编辑于 2024-01-19
  • 来自专栏HelloGitHub

    《HelloGitHub》第 79 期

    while True: schedule.run_pending() time.sleep(1) 地址:https://github.com/dbader/schedule 28、Umi-OCR 地址:https://github.com/hiroi-sora/Umi-OCR Ruby 项目 29、linguist:GitHub 官方开源的识别项目编程语言的库。

    1.2K20编辑于 2022-12-30
  • 开源最强OCR生态,不靠参数靠实力,56K+ Star见证实力(附开源地址)

    像 Umi-OCR、MinerU、RAGFlow、OmniParser 等知名项目都直接集成了它。这不仅是“国产之光”,更是开源界的一座里程碑。

    2K10编辑于 2025-10-11
领券