我是 stan 的新手,我正在实施概率矩阵分解模型。
给定一个用户项目评分矩阵:
item
user 1 3 NA 4 5 NA
2 0 3 NA 1 5
1 1 NA NA NA 0
....
我应该如何表示块中的可观察数据和data
块中用于预测的缺失数据parameter
?
先感谢您!
编辑:
现在我正在实现如下模型:
pmf_code = """
data {
int<lower=0> K; //number of factors
int<lower=0> N; //number of user
int<lower=0> M; //number of item
int<lower=0> D; //number of observation
int<lower=0> D_new; //number of pridictor
int<lower=0, upper=N> ii[D]; //item
int<lower=0, upper=M> jj[D]; //user
int<lower=0, upper=N> ii_new[D_new]; // item
int<lower=0, upper=N> jj_new[D_new]; // user
real<lower=0, upper=5> r[D]; //rating
real<lower=0, upper=5> r_new[D_new]; //pridict rating
}
parameters {
row_vector[K] i[M]; // item profile
row_vector[K] u[N]; // user profile
real<lower=0> alpha;
real<lower=0> alpha_i;
real<lower=0> alpha_u;
}
transformed parameters {
matrix[N,M] I; // indicator variable
I <- rep_matrix(0, N, M);
for (d in 1:D){
I[ii[d]][jj[d]] <- 1;
}
}
model {
for (d in 1:D){
r[d] ~ normal(u[jj[d]]' * i[ii[d]], 1/alpha);
}
for (n in 1: N){
u[n] ~ normal(0,(1/alpha_u) * I);
}
for (m in 1:M){
i[m] ~ normal(0,(1/alpha_i) * I);
}
}
generated_quantities{
for (d in 1:D_new){
r_new[d] <- normal(u[jj_new[d]]' * i[ii_new[d]], 1/alpha);
}
}
"""
但No matches for: real ~ normal(matrix, real)
在这行代码中出现错误:
for (d in 1:D){
r[d] ~ normal(u[jj[d]]' * i[ii[d]], 1/alpha);
}
但是jj[d]
应该是一个整数,表示 的 id user
。并且 u[ int
] 应该是一个row_vector
hask
因子,所以i[ii[d]]
. 他们的产品应该是一个单一的真实价值,为什么斯坦说它是一个matrix
?