我正在设计一个网站,该网站是围绕根据用户的口味向用户推荐各种项目的概念构建的。(即他们评价过的项目、添加到收藏夹列表中的项目等)亚马逊、Movielens 和Netflix 就是其中的一些例子。
现在,我的问题是,关于这个系统的数学部分,我不确定从哪里开始。我愿意学习所需的数学,只是我不知道需要什么类型的数学。
我查看了Grouplens.org上的一些出版物,特别是“ Towards a Scalable kNN CF Algorithm: Exploring Effective Applications of Clustering ”。(pdf) 在第 5 页“预测生成”之前,我非常擅长理解所有内容
ps 我并不是在寻找对正在发生的事情的解释,尽管这可能会有所帮助,但我对我需要知道的数学更感兴趣。这样我就可以理解发生了什么。