本帖最后由 wangyibin 于 2024-11-6 20:06 编辑
Umi-OCR 文字识别工具
免费,开源,可批量的离线OCR软件
适用于 Windows7 x64 、Linux x64
- 免费:本项目所有代码开源,完全免费。
- 方便:解压即用,离线运行,无需网络。
- 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
- 灵活:支持命令行、HTTP接口等外部调用方式。
- 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别
v2.1.4 主要更新:- 修复:引擎原始输出项的"text"为空时,导致文本分析越界的错误。
- 新增UI语言:葡萄牙语 Português 。
- PaddleOCR 插件相关:
- 修复:布尔类型选项不生效的问题。
- 修复: 繁体中文 配置文件错误的问题。
- 优化:调整默认线程/内存限制,默认内存占用不超过系统总内存的一半。
- 优化:调整识别语言库结构,精简不必要的文件。
- Linux 版本相关:
- 优化:glibc 依赖降级至 2.31 ,兼容 Debian-11 等发行版。
- 修复:Docker 部署 在部分旧系统中报错 'code': 803 的问题。
Windows 下载 不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU) 重要提示:如果执行OCR时报错 0xc0000142、[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。 Umi-OCR_Paddle_v2.1.4.7z.exe (126.5MB)
SHA256: 319edf4d58803ed5482174dcaf8713248cc377a77d9164fcc28796ade591348b
Rapid 引擎插件版(速度稍慢,内存占用低,适合低配机器,兼容性好) Umi-OCR_Rapid_v2.1.4.7z.exe (97MB)
SHA256: c1e851b172437f383ffb6ec1f3236e1beab23c0d7bfd6ba84ffea8f720126471 更多下载途径:
Linux 下载Umi-OCR_Linux_Paddle_2.1.4.tar.xz (264.5MB)
SHA256: 0dae3a93eb4fc8da23097944f403d143430ec27a91ce3fa563ac5d363b69246e 此发行版在 Ubuntu 22.04 / Debian 11 / Debian 12 / Kali 2023.3 桌面环境中通过测试。如果遇到问题,可参考常见问题及修复方法 ,或根据报错安装缺失的依赖库。欢迎提 Issue 共同讨论解决方法。有能力的用户可尝试 从源码部署 Umi-OCR ,以得到最好的兼容性。 首次运行请在命令行中执行 ./umi-ocr.sh ,随后可在全局设置中创建桌面/开始菜单快捷方式,便于日常使用。
Docker 部署 |