请教坛友们一个关于OCR识别的问题

N140JCE-EL1 · 发表于 2023-6-4 15:44:20

本帖最后由 N140JCE-EL1 于 2023-6-4 16:00 编辑

请教坛友们一个关于OCR识别的问题：

因最近有在做一个OCR自动化识别仪器上的数字的脚本，发现问题：

a.思路一：目前调用Umi-OCR引擎（识别准确率很高），但是OCR识别过程中需要点击打开文件，输入识别的OCR图片的路径，点击确定，再点击开始任务，过一会会得到OCR的输出结果【TXT文本格式】，接着要进行正则匹配匹配要的数字结果。这种方法执行率有点低，而且此软件好像没有命令行模式。目前有没有类似的可以命令行调用的OCR软件？

b.思路二：使用谷歌开源的Tesseract OCR脚本，调用Python脚本辅助进行OCR识别，但是这个识别效果不理想，有时识别不出来数字，而且有考虑去对Tesseract进行样本训练，但是数字组合比较多，这个训练起来是一个庞大的工作量。
所以想请教下万能的网友，是否有其他OCR引擎或者更好的方法？

likeyouli · 发表于 2024-11-21 14:20:52

搜到您这个问题，遇到同样的情况，请问楼主解决没有？可否大概说说解决方法？

tanchenglong · 发表于 2024-1-26 08:15:31

我只是来打酱油的，Mark一下！

megatron · 发表于 2024-1-26 07:51:08

大佬，转了一圈，还是你的ltsb最好用，特此感谢

lal · 发表于 2023-11-9 17:07:07

十分感谢分享

2011阿星 · 发表于 2023-6-4 22:49:27

还用想嘛肯定paddlepaddle，市面大部分OCR都是基于此项目的，你的Umi-OCR也是基于此封装的
https://github.com/PaddlePaddle/PaddleOCR

ezozo · 发表于 2023-6-4 20:43:20

免费的吗

snow99 · 发表于 2023-6-4 19:28:06

Umi-OCR 文字识别工具是开源的，自己改吧
https://github.com/hiroi-sora/Umi-OCR
免费：本项目所有代码开源，完全免费。
方便：解压即用，离线运行，无需网络。
批量：可批量导入处理图片，结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效：采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够，通常比在线OCR服务更快。

翅膀 · 发表于 2023-6-4 18:40:27

提示: 作者被禁止或删除内容自动屏蔽

邪恶海盗 · 发表于 2023-6-4 18:09:44

这种不是用专用解决方案么,比如停车场的车牌识别系统,纯软件地话效率肯定低

ddsdeng · 发表于 2023-6-4 17:41:28

很好，十分感谢！

cdl_1 · 发表于 2023-6-4 17:27:42

a加入更多的训练模型；b尽可能的规范化作业者的书写规范

		自动登录	找回密码
密码			注册

翅膀翅膀当前离线积分 14305 IP卡狗仔卡	5^# 发表于 2023-6-4 18:40:27 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
翅膀翅膀当前离线积分 14305 IP卡狗仔卡
	回复使用道具举报显身卡

[求助] 请教坛友们一个关于OCR识别的问题

浏览过的版块