我是 Alteryx 的新手,正在尝试用它来分析非结构化数据。我有一列文本形式的描述,我打算使用 K-Means 聚类工具进行主题建模。为了让 K-means 处理文本,我需要将我的文本转换为文档术语矩阵 (DTM),以便它们在聚类工具中显示为连续变量。但是,我正在努力寻找一种可以将文本转换为 DTM 的方法。
有谁知道这样做的方法?我目前正在研究 R 工具,但也不确定如何开始。希望各位高手能帮帮我!
我浏览了有关文本分析的帖子,并意识到大多数都依赖于 Microsoft Azure ML 文本分析宏。但是,我想避免使用宏(不限于每月有限运行以实现可扩展性),而是使用 Alteryx 中可用的工具。
提前感谢大家!