Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在考虑在 hadoop 中实现基于内容的推荐项目理念。
只是想要建议 weka 是否可以与 hadoop 一起使用,或者是否建议将 Mahout 用于基于 cbf 的实现
请指教
谢谢
你的内容是什么?哪些数据围绕或构成您的项目?
有几种方法可以将其用于 recs,如果合适的话,有些方法可以混合到协同过滤数据中。看看 Mahout 中的行相似性。它计算一个项目与所有其他项目的相似性。如果您以可以消化的方式输入内容,您将拥有 CBR。
例如,推荐类似博客帖子的输入将是:postID、tokens-from-the-text-of-the-post
然后对于每个 postID,您将获得一个使用相似词的其他 postID 列表。您也可以对标签、类别或其他元数据执行相同的操作。