Umi-OCR 是一个免费、开源、可批量的离线 OCR(光学字符识别)软件,适用于 Windows 7 x64 和 Linux x64 系统。Paddle版性能好,但不兼容奔腾、赛扬、凌动CPU。Rapid兼容绝大部分硬件。Umi-OCR_Paddle_v2.1.5.7z.exe、Umi-OCR_Rapid_v2.1.5.7z.exe推荐大家下载Paddle版本,性能比较好,下载后双击exe即可使用。
夸克自取:https://pan.quark.cn/s/f4de3dbad2c3
主要特点
- 免费: 本项目所有代码开源,完全免费。
- 方便: 解压即用,离线运行,无需网络。
- 高效: 自带高效率的离线OCR引擎,内置多种语言识别库。
- 灵活: 支持命令行、HTTP接口等外部调用方式。
- 功能: 截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别。
核心功能:
- 截图OCR :通过快捷键截图识别文字
- 批量OCR :批量导入图片进行文字识别
- 文档识别 :从PDF扫描件中提取文本,生成双层可搜索PDF
- 二维码 :支持扫码和生成二维码,兼容19种协议
- 排版解析: 智能识别不同排版,按正确顺序输出文字
- 忽略区域 : 可排除图片中的水印等不需要的文字区域
工具已安全检测通过,无毒

全局设置

界面语言
Umi-OCR 支持的界面多国语言。在第一次打开软件时,将会按照你的电脑的系统设置,自动切换语言。
如果需要手动切换语言,请参考下图,全局设置→语言/Language 。

截图OCR

标签页
Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页。
标签栏左上角可以切换窗口置顶。右上角能够锁定标签页,以防止日常使用中误触关闭标签页。
截图ORC

识别到的文本处理设置

可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案:
- 多栏-按自然段换行: 适合大部分情景,自动识别多栏布局,按自然段规则进行换行。
- 多栏-总是换行: 每段语句都进行换行。
- 多栏-无换行: 强制将所有语句合并到同一行。
- 单栏-按自然段换行/总是换行/无换行: 与上述类似,不过 不区分多栏布局。
- 单栏-保留缩进: 适用于解析代码截图,保留行首缩进和行中空格。
- 不做处理: OCR引擎的原始输出,默认每段语句都进行换行。
上述方案,均能自动处理横排和竖排(从右到左)的排版。
批量图片OCR识别
- 支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。
- 保存识别结果的支持格式:txt, jsonl, md, csv(Excel)。
- 与截图OCR一样,支持文本后处理功能,整理OCR文本的排版和顺序。
- 没有数量上限,可一次性导入几百张图片进行任务。

标记识别的忽略区域

批量文档识别
- 支持格式:pdf, xps, epub, mobi, fb2, cbz。
- 对扫描件进行OCR,或提取原有文本。可输出为 双层可搜索PDF 。
- 支持设定 忽略区域 ,可用于排除页眉页脚的文字。

二维码识别

免责申明:本站不以盈利为目的,下载资源均来源于网络,只做学习和交流使用,版权归原作者所有。若作商业用途,请购买正版。由于未及时购买
和付费发生的侵权行为,与本站无关。如果侵犯了您的合法权益,请联系522390482@qq.com删除,提供版权证明文件和侵权内容的具体链接。
如若转载,请注明出处:https://byteooo.cn/archives/2182
共有 0 条评论