我正在寻找解决以下问题的算法:
- 给定:一组项目及其相似度矩阵。
- 目标:将这些项目分组到最小大小为m的“集群”中
- 条件:
- 数据集中没有类簇结构, 如图1
- 无论如何,组中的项目应该彼此相似。因此,全局相似性会很高。
动机不是识别好的集群,而是将数据集分成高相似性和最小大小的组。围绕 medoids 进行分区并不是开箱即用的,它会产生很多 1-item-clusters。分层方法(AGNES、DIANA)也无济于事。
这个问题在某种程度上类似于稳定婚姻问题:尝试通过相似性对相邻项目进行排名。但在这里,一组/一婚至少有m个物品。
提前致谢!