无忧启动论坛

 找回密码
 注册
搜索
系统gho:最纯净好用系统下载站投放广告、加入VIP会员,请联系 微信:wuyouceo
查看: 2804|回复: 11
打印 上一主题 下一主题

[求助] 请教坛友们一个关于OCR识别的问题

[复制链接]
跳转到指定楼层
1#
发表于 2023-6-4 15:44:20 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 N140JCE-EL1 于 2023-6-4 16:00 编辑

请教坛友们一个关于OCR识别的问题:

因最近有在做一个OCR自动化识别仪器上的数字的脚本,发现问题:


a.思路一:目前调用Umi-OCR引擎(识别准确率很高),但是OCR识别过程中需要点击打开文件,输入识别的OCR图片的路径,点击确定,再点击开始任务,过一会会得到OCR的输出结果【TXT文本格式】,接着要进行正则匹配匹配要的数字结果。这种方法执行率有点低,而且此软件好像没有命令行模式。目前有没有类似的可以命令行调用的OCR软件?




b.思路二:使用谷歌开源的Tesseract OCR脚本,调用Python脚本辅助进行OCR识别,但是这个识别效果不理想,有时识别不出来数字,而且有考虑去对Tesseract进行样本训练,但是数字组合比较多,这个训练起来是一个庞大的工作量。
所以想请教下万能的网友,是否有其他OCR引擎或者更好的方法?

2023-06-04_15-25-58.png (32.82 KB, 下载次数: 50)

2023-06-04_15-25-58.png
2#
发表于 2023-6-4 17:27:42 | 只看该作者
a加入更多的训练模型;b尽可能的规范化作业者的书写规范
回复

使用道具 举报

3#
发表于 2023-6-4 17:41:28 | 只看该作者
很好,十分感谢!
回复

使用道具 举报

4#
发表于 2023-6-4 18:09:44 | 只看该作者
这种不是用专用解决方案么,比如停车场的车牌识别系统,纯软件地话效率肯定低
回复

使用道具 举报

5#
发表于 2023-6-4 18:40:27 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

6#
发表于 2023-6-4 19:28:06 | 只看该作者
Umi-OCR 文字识别工具 是开源的,自己改吧
https://github.com/hiroi-sora/Umi-OCR
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。

回复

使用道具 举报

7#
发表于 2023-6-4 20:43:20 | 只看该作者
免费的吗
回复

使用道具 举报

8#
发表于 2023-6-4 22:49:27 | 只看该作者
还用想嘛肯定paddlepaddle,市面大部分OCR都是基于此项目的,你的Umi-OCR也是基于此封装的
https://github.com/PaddlePaddle/PaddleOCR
回复

使用道具 举报

9#
发表于 2023-11-9 17:07:07 | 只看该作者
十分感谢分享
回复

使用道具 举报

10#
发表于 2024-1-26 07:51:08 | 只看该作者
大佬,转了一圈,还是你的ltsb最好用,特此感谢
回复

使用道具 举报

11#
发表于 2024-1-26 08:15:31 | 只看该作者
我只是来打酱油的,Mark一下!
回复

使用道具 举报

12#
发表于 前天 14:20 | 只看该作者
搜到您这个问题,遇到同样的情况,请问楼主解决没有? 可否大概说说解决方法 ?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|捐助支持|无忧启动 ( 闽ICP备05002490号-1 )

闽公网安备 35020302032614号

GMT+8, 2024-11-23 20:37

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表