想要改进这个问题吗? 更新问题,以便 editing this post 提供事实和引用来回答它.
关闭 3 年前。
我最近遇到了Tesseract和 OpenCV .看起来 Tesseract 是一个成熟的 OCR 引擎,OpenCV 可以用作创建 OCR 应用程序/服务的框架。
我尝试在我的一些图像上使用 Tesseract,它的准确性似乎不错。后来偶然发现一个很简单的tutorial关于使用 OpenCV 使用 Python 执行 OCR 并印象深刻。几分钟后,我完成了系统的训练,它的准确性很好。但是,当然,采用这种方法意味着我需要使用大型训练集来广泛训练我的系统。
我的具体问题如下:
有什么建议吗?
最佳答案
Tesseract 是一个 OCR 引擎。它由 Google 使用、开发和资助,专门用于从图像中读取文本、执行基本文档分割以及对特定图像输入(单个单词、行、段落、页面、有限字典等)进行操作。
另一方面,OpenCV 是一个计算机视觉库,其中包含可让您执行某些特征提取和数据分类的功能。您可以创建一个简单的字母分割器和分类器来执行基本的 OCR,但它不是一个很好的 OCR 引擎(我之前在 Python 中从头开始制作了一个。对于偏离训练数据的输入确实不准确)。
如果您想基本了解 OCR 的难度,请尝试 OpenCV。 Tesseract 用于真实 OCR。
https://stackoverflow.com/questions/11489824/