我正在尝试使用 Tesseract/PaddleOCR 从图像中提取数字以识别裁剪图像中的文本。我正在使用 OpenCV 对图像进行预处理以便更好地识别。我尝试应用高斯模糊和阈值方法进行二值化,但结果非常糟糕。
这是读取图像并转换为灰度的代码,它更好,但仍然很差,无法从该图像中提取文本:
def display(img,cmap='gray'):
fig = plt.figure(figsize=(12,10))
ax = fig.add_subplot(111)
ax.imshow(img,cmap='gray')
img = cv2.imread("/content/PXL_20211019_171419721.MP.jpg")
plt.imshow(img)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
display(gray)
这是我正在使用裁剪图像的图像