ocr - 为什么 Tesseract OCR 使用 Otsu 二值化？

Question

为什么 Tesseract OCR 引擎使用全局阈值技术，例如 Otsu 二值化？局部阈值技术（例如 Sauvola、Niblack 等）在从图像中删除文本方面不是更有效吗？

score 1 · Accepted Answer

Tesseract 被用于谷歌图书项目和 AFAIK，他们运行测试以获得最佳二值化，而 Otsu 是最通用的。如果 Otsu 不适合您的情况，您可以在将图像发送到 tesseract 之前使用其他二值化算法。

score 1 · Accepted Answer

基本上，根据输入图像，我们需要选择要使用的阈值算法。Tesseract 使用 Otsu 方法进行阈值处理，因为通常用于提取文本的 Tesseract 输入具有图像同质性。对于此类图像，Otsu 方法既有效又足够好。

当背景不显示相对于前景（目标）强度的局部变化时，全局阈值方法是有用且足够好的。而当背景和目标的强度差异发生局部变化时，需要进行局部阈值处理。

因此，虽然 Tesseract 确实使用 Otsu 方法（全局阈值）进行二值化，但您可以使用局部阈值方法对图像进行预处理，以从 Tesseract 获得更好的输出。

2 回答 2