0

我试图效仿以下论文,使用 2000 年十年一次的人口普查数据创建一个称为邻里剥夺指数(NDI)的指数:https ://www.ncbi.nlm.nih.gov/pmc/articles/PMC3261293/# CR73

我在论文的组件提取和索引构建部分概述的最后一步特别挣扎。最后的步骤是

对 8 个变量进行主成分分析,保留第一个主成分:1) 从事管理和专业职业的男性百分比,2) 拥挤住房的百分比,3) 贫困家庭的百分比,4) 有受抚养人的女性户主家庭的百分比, 5) 获得公共援助的家庭百分比 6) 年收入低于 30,000 美元的家庭百分比 7) 收入低于高中教育的百分比 8) 失业百分比

通过将指数除以特征值的平方,将指数标准化为平均值为 0,标准差 (SD) 为 1。

我目前正在使用该prcomp()功能来执行主成分分析。我知道我可以通过$sdev对函数中的对象进行平方来获得特征值prcomp()

为了跟随这最后一步。我是否应该手动计算正确的线性组合以使用此公式放置我的人口普查数据?

pca_2000 = prcomp(census_2000_vars,rank.=1,center=F,scale=F)

eigenvalues = pca_2000$sdev^2

loadings = pca_2000$rotation[1:8]

lin_comb = loadings/(eigenvalues^2)

4

0 回答 0