0

我正在尝试使用 Tesseract/PaddleOCR 从图像中提取数字以识别裁剪图像中的文本。我正在使用 OpenCV 对图像进行预处理以便更好地识别。我尝试应用高斯模糊和阈值方法进行二值化,但结果非常糟糕。

这是读取图像并转换为灰度的代码,它更好,但仍然很差,无法从该图像中提取文本:

def display(img,cmap='gray'):
    fig = plt.figure(figsize=(12,10))
    ax = fig.add_subplot(111)
    ax.imshow(img,cmap='gray')
img = cv2.imread("/content/PXL_20211019_171419721.MP.jpg")
plt.imshow(img)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
display(gray)

这是我正在使用裁剪图像的图像

4

1 回答 1

1

IMO:你不能从错误的输入中得到好的结果。专注于获得更好的输入图像,否则您将需要“人工 OCR”。

于 2021-10-22T05:01:08.110 回答