4

为什么 Tesseract OCR 引擎使用全局阈值技术,例如 Otsu 二值化?局部阈值技术(例如 Sauvola、Niblack 等)在从图像中删除文本方面不是更有效吗?

4

2 回答 2

1

Tesseract 被用于谷歌图书项目和 AFAIK,他们运行测试以获得最佳二值化,而 Otsu 是最通用的。如果 Otsu 不适合您的情况,您可以在将图像发送到 tesseract 之前使用其他二值化算法。

于 2019-06-24T17:17:55.240 回答
1

基本上,根据输入图像,我们需要选择要使用的阈值算法。Tesseract 使用 Otsu 方法进行阈值处理,因为通常用于提取文本的 Tesseract 输入具有图像同质性。对于此类图像,Otsu 方法既有效又足够好。

当背景不显示相对于前景(目标)强度的局部变化时,全局阈值方法是有用且足够好的。而当背景和目标的强度差异发生局部变化时,需要进行局部阈值处理。

因此,虽然 Tesseract 确实使用 Otsu 方法(全局阈值)进行二值化,但您可以使用局部阈值方法对图像进行预处理,以从 Tesseract 获得更好的输出。

于 2019-06-24T19:39:50.430 回答