7

我一直在使用不同的数据聚类算法来寻找代表节点的随机数据点之间的聚类,我一直在阅读数据聚类用于图像识别。我无法建立联系,聚类数据如何帮助识别图像或面部识别。有人可以解释一下吗?

4

1 回答 1

12

毫不奇怪,聚类被广泛用于模式识别,尤其是图像识别:聚类是一个缩减的过程,这个百万像素时代的图像需要沸腾……它也是一个产生类别的过程,那当然是有用。

然而,有许多方法可以使用聚类作为图像识别技术。这种多样性的原因之一是聚类可以应用于不同的级别,用于不同的目的:从基本像素级别到特征级别(特征是一条线、几何图形……),用于分类或其他目的。

在非常高的层次上,聚类是一种统计工具,它有助于发现各个维度在定义特定项目属于特定类别时的相对重要性。

这种工具的许多用途之一是监督学习,其中一组人工选择的项目(比如图像)被输入到基于集群的逻辑中,以及与特定项目相关联的标签( “这是一个苹果”、“这是另一个苹果”、“这是一个柠檬”......),然后聚类逻辑确定输入的每个维度对于帮助每组项目(苹果、柠檬...... .) 适合不同的集群(例如,颜色可能相对无关紧要,但形状,或点的存在,或任何可能很重要的东西)。在这个训练阶段之后,可以将新图像输入到逻辑中,并通过查看该图像与特定集群的距离有多近,它被“识别”(作为香蕉!)。

当涉及到图像处理时,需要记住,任何“馈送”到聚类逻辑的东西不一定(实际上很少)是原始像素,而是表征原始数据的各种“元素”的各种“对象”(本质上是相对高维向量的集合,与其他数据聚类示例中可能遇到的一些不同),并且由过程的先前阶段产生。例如,面部识别的一个重要元素可能是眼睛中心之间的确切距离。在之前的阶段,图像的处理方式是确定眼睛的位置(可能依赖于另一个基于聚类的逻辑)。然后眼睛之间的距离以及许多其他元素被输入到最终的聚类逻辑中。

前面的描述只是使用聚类进行图像识别的一个例子。事实上,在这个领域已经非常成功地使用了各种形式的神经网络,并且可以说在某种意义上这些神经网络是聚类信息。神经网络成功的原因之一可能在于它们能够更加尊重在原始输入中发现的局部维度,以及它们以分层方式工作的能力。

这篇文章的一个很好的结论是一个简短的在线资源列表,但我现在时间紧迫......“待续”;-)

第二天编辑:(未能提供关于该主题的介绍性在线参考书目)

我对应用于人工视觉和图像处理的聚类主题的文献搜索揭示了两个不同的……聚类;-)

  • 诸如图像处理和计算机视觉算法 J Parkey pub Wiley 或Machine Vision : Theory, Algorithms, Practicalities M Seul 等书籍。艾尔剑桥大学。这类书籍一般涵盖了与降噪、边缘检测、颜色或强度转换以及图像处理链的许多其他元素相关的所有重要技术,其中大多数不涉及聚类甚至统计方法,它们只保留一章或两次,甚至很少提到聚类,应用于模式识别或其他任务。
  • 学术论文和会议手册,专门涵盖应用于人工视觉等的聚类技术,但以最窄和最深入的方式(例如:Fukunaga 和 Narendra 算法的变体,用于字符识别,或用于选择最近邻的快速方法候选人在任何情况下。)

简而言之,我觉得没有能力提出任何具体的书籍或文章建议。

您可能会发现通过“人工视觉”或“图像识别”或上面提到的某些或某些标题来浏览 Google 书籍中的标题会提供丰富的信息。借助“关于这本书”链接中的预览功能和标签云(顺便说一句,集群的另一个应用程序),人们可以很好地了解各种书籍的内容,并可能决定购买其中的一些。不幸的是,读者人数的减少和该领域潜在的有利可图的应用使这些书相对昂贵。另一方面,您可以下载讨论该领域高级主题的研究论文,有时是免费的。这些也将出现在常规(网络)Google 或CiteSeer等专业存储库中。

祝您在该领域的探索顺利!

于 2009-09-17T03:00:37.277 回答