查看一个表单(为简单起见,仅由复选框组成)被传真到支持 OCR 的传真服务器的场景。现在,对于印刷文本,我已经看到各种 OCR 实现做得不错,但我不确定它如何处理复选框,尤其是手写的“x”或检查,更不用说坐标了。
回到小学,我们曾经用 HB 铅笔阴影在正确答案中填写那些高斯(原文如此)测试;在某个地方,不知何故,被解析和分析了。
我们今天在哪里?有什么开箱即用的东西吗?
您指的是 Scantron 和 NCS 在许多美国学校中普遍使用的光学标记识别 (OMR) 技术。
大多数 OCR 服务器都没有读取 OMR 的真正概念,除非它是专门为识别不同的表单类型而设计的。听起来您的 OCR 传真服务器软件可能只执行整页 OCR,并且没有 OMR 字段的概念。
您可以在不投入太多精力或成本的情况下安装一些东西。如果您按照以下指南设计问题,它可能会很好地工作。
你喜欢吃哪种水果?
< > 苹果
< > 梨
< > 橙
< > 香蕉
当 OCR 引擎返回 OCR 文本时,您可以假设在 < 和 > 字符之间读取的任何字符都是 OMR 标记,即使它是无法识别的字符。
你喜欢吃哪种水果?
<>苹果
<x>梨
<? > 橙子
< > 香蕉
这将表明 Pear 和 Orange 已被标记。
TeleForm 是一个商业软件包,可以导入图像并处理传真页面,但您需要先在 Teleform 中设计表单。 http://www.cardiff.com/products/index.html