python - 如何在 Tesseract 和 OpenCV 之间进行选择？

想要改进这个问题吗？ 更新问题，以便 editing this post 提供事实和引用来回答它.

关闭 3 年前。

我最近遇到了Tesseract和 OpenCV .看起来 Tesseract 是一个成熟的 OCR 引擎，OpenCV 可以用作创建 OCR 应用程序/服务的框架。

我尝试在我的一些图像上使用 Tesseract，它的准确性似乎不错。后来偶然发现一个很简单的tutorial关于使用 OpenCV 使用 Python 执行 OCR 并印象深刻。几分钟后，我完成了系统的训练，它的准确性很好。但是，当然，采用这种方法意味着我需要使用大型训练集来广泛训练我的系统。

我的具体问题如下:

有什么建议吗？

最佳答案

Tesseract 是一个 OCR 引擎。它由 Google 使用、开发和资助，专门用于从图像中读取文本、执行基本文档分割以及对特定图像输入(单个单词、行、段落、页面、有限字典等)进行操作。
另一方面，OpenCV 是一个计算机视觉库，其中包含可让您执行某些特征提取和数据分类的功能。您可以创建一个简单的字母分割器和分类器来执行基本的 OCR，但它不是一个很好的 OCR 引擎(我之前在 Python 中从头开始制作了一个。对于偏离训练数据的输入确实不准确)。

如果您想基本了解 OCR 的难度，请尝试 OpenCV。 Tesseract 用于真实 OCR。

https://stackoverflow.com/questions/11489824/