image - 从图像文件中分类类型样本

Question

您建议使用哪种方法对图像中的类型进行自动分类？样本可能很大，白色背景上有黑色文本。

这里定义了类别，每个类别都有一些示例（Google 图书链接）：http ://bit.ly/9Mnu7P这是 VOX-ATypI 分类系统的扩展版本。

我对此的最初想法是使用来自每个类别的大量单个字符样本来训练系统，但我想知道是否有更好的方法可以消除一次比较一个字母的需要。

score 2 · Accepted Answer

首先，您需要提取特征进行分类。字体通常通过线条的粗细、衬线的存在、字符部分的“圆度”来区分。因此，可能的特征是：

我在这里看到两个选项：要么计算所有字符的平均特征，要么先尝试对字母进行分类，然后根据某些特定字母对字体进行分类（因此，您针对不同的字母训练不同的分类器）。很难说哪种情况更适合您。

至于具体的学习算法，随机森林似乎是一个不错的起点。OpenCV库中有一个实现。

1 回答 1