我正在尝试使用 pytesseract 从屏幕中提取单词。
这个词是白色的,它的背景是其他颜色的。
截图的文字总是白色的,但背景可能会改变。
使用带有图像数组的 pytesseract 的简单方法
sct = mss()
image = np.array(sct.grab(mon))
image = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
image = cv2.Canny(image, 25, 50)
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
text = pytesseract.image_to_string(img, lang='eng', config='--oem 3 --psm 10 -c tessedit_char_whitelist=abcdefghijklmnopqrstuvwxyz')
try:
return text.strip()[0].lower()
except IndexError as err:
print(err)
return ''