作为生成Pearson 相关系数的计算的一部分,执行以下计算:
在第二个公式中:p_a,i
是用户 a 会给项目的预测评分i
,n
是被比较的相似用户的数量,并且是用户ru,i
对项目的评分。 i
u
u
如果用户没有评价这个项目,将使用什么值?我在这里误会了什么吗?
作为生成Pearson 相关系数的计算的一部分,执行以下计算:
在第二个公式中:p_a,i
是用户 a 会给项目的预测评分i
,n
是被比较的相似用户的数量,并且是用户ru,i
对项目的评分。 i
u
u
如果用户没有评价这个项目,将使用什么值?我在这里误会了什么吗?
根据链接,算法步骤 1 中的早期计算是针对一组项目,索引为 1 到m
,m
其中是共有项目的总数。
该算法的第 3 步指定:“要找到特定用户对特定项目的评分预测,首先选择一些用户,这些用户相对于对相关项目进行评分的当前用户具有最高的加权相似性分数。 "
这些计算仅在不同用户的评分项目集的交集上执行。当用户未对项目进行评分时,不会执行任何计算。
只有当两个用户都对电影评分时,计算结果才有意义。线性回归可以可视化为一种通过二维图形找到直线的方法,其中一个变量绘制在 X 轴上,另一个变量绘制在 Y 轴上。每个评级组合都表示为欧几里得平面上的一个点 [u1_rating, u2_rating]。由于您无法绘制只有一维的点,因此您必须丢弃这些情况。