使用 R 进行文本分析。
我的数据集是来自 2000 个不同调查的 2000 条评论。我创建了 Bi-gram。我检查了单词的频率,然后使用 进行单词聚类分析hclust()
,然后使用 进行单词关联findAssocs
,例如findAssocs(bigram_dtm,"long time",0.2)
。
例如,我看到“长时间”与“感觉等待”的关联度为 0.66。
我试图在网上找到它,但还没有成功...... 问题:有什么办法可以打印出这个 bi_gram 在一起的评论吗?有什么办法可以打印“长时间”的评论吗?
谢谢,