0

您建议使用哪种方法对图像中的类型进行自动分类?样本可能很大,白色背景上有黑色文本。

这里定义了类别,每个类别都有一些示例(Google 图书链接):http ://bit.ly/9Mnu7P这是 VOX-ATypI 分类系统的扩展版本。

我对此的最初想法是使用来自每个类别的大量单个字符样本来训练系统,但我想知道是否有更好的方法可以消除一次比较一个字母的需要。

4

1 回答 1

2

首先,您需要提取特征进行分类。字体通常通过线条的粗细、衬线的存在、字符部分的“圆度”来区分。因此,可能的特征是:

  • 固定区域上黑色像素数的分数。
  • 尝试应用数学形态腐蚀几次(和/或使用不同的掩码)并计算这个分数
  • 计算一个字符的平均紧凑度:周长^2 / 面积
  • 应用腐蚀后,计算一个字符的连接分量的数量
  • 计算伸长率和其他图像矩,还有方向
  • ETC

我在这里看到两个选项:要么计算所有字符的平均特征,要么先尝试对字母进行分类,然后根据某些特定字母对字体进行分类(因此,您针对不同的字母训练不同的分类器)。很难说哪种情况更适合您。

至于具体的学习算法,随机森林似乎是一个不错的起点。OpenCV库中有一个实现。

于 2010-02-17T13:41:37.177 回答