OCR 文字识别工具_www.byteooo.cn

Umi-OCR 是一个免费、开源、可批量的离线 OCR（光学字符识别）软件，适用于 Windows 7 x64 和 Linux x64 系统。Paddle版性能好，但不兼容奔腾、赛扬、凌动CPU。Rapid兼容绝大部分硬件。Umi-OCR_Paddle_v2.1.5.7z.exe、Umi-OCR_Rapid_v2.1.5.7z.exe推荐大家下载Paddle版本，性能比较好，下载后双击exe即可使用。

夸克自取：https://pan.quark.cn/s/f4de3dbad2c3

主要特点
- 免费： 本项目所有代码开源，完全免费。
- 方便： 解压即用，离线运行，无需网络。
- 高效： 自带高效率的离线OCR引擎，内置多种语言识别库。
- 灵活： 支持命令行、HTTP接口等外部调用方式。
- 功能： 截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别。

核心功能：
- 截图OCR ：通过快捷键截图识别文字
- 批量OCR ：批量导入图片进行文字识别
- 文档识别 ：从PDF扫描件中提取文本，生成双层可搜索PDF
- 二维码 ：支持扫码和生成二维码，兼容19种协议
- 排版解析：智能识别不同排版，按正确顺序输出文字
- 忽略区域 ：可排除图片中的水印等不需要的文字区域

工具已安全检测通过，无毒

OCR 文字识别工具

全局设置
OCR 文字识别工具

界面语言
Umi-OCR 支持的界面多国语言。在第一次打开软件时，将会按照你的电脑的系统设置，自动切换语言。
如果需要手动切换语言，请参考下图，全局设置→语言/Language 。
OCR 文字识别工具

截图OCR
OCR 文字识别工具
标签页
Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好，打开需要的标签页。
标签栏左上角可以切换窗口置顶。右上角能够锁定标签页，以防止日常使用中误触关闭标签页。

截图ORC

OCR 文字识别工具
识别到的文本处理设置

可以整理OCR结果的排版和顺序，使文本更适合阅读和使用。预设方案：

多栏-按自然段换行： 适合大部分情景，自动识别多栏布局，按自然段规则进行换行。
多栏-总是换行： 每段语句都进行换行。
多栏-无换行： 强制将所有语句合并到同一行。
单栏-按自然段换行/总是换行/无换行： 与上述类似，不过不区分多栏布局。
单栏-保留缩进： 适用于解析代码截图，保留行首缩进和行中空格。
不做处理： OCR引擎的原始输出，默认每段语句都进行换行。
上述方案，均能自动处理横排和竖排（从右到左）的排版。

批量图片OCR识别
- 支持格式：jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。
- 保存识别结果的支持格式：txt, jsonl, md, csv(Excel)。
- 与截图OCR一样，支持文本后处理功能，整理OCR文本的排版和顺序。
- 没有数量上限，可一次性导入几百张图片进行任务。
OCR 文字识别工具
标记识别的忽略区域

批量文档识别
- 支持格式：pdf, xps, epub, mobi, fb2, cbz。
- 对扫描件进行OCR，或提取原有文本。可输出为双层可搜索PDF 。
- 支持设定忽略区域，可用于排除页眉页脚的文字。

二维码识别
OCR 文字识别工具