看啥推荐读物
天池,基于阿里云的开放数据处理服务ODPS,面向学术界开放海量数据和分布式计算资源,旨在打造“数据众智、众创”第一平台。在这里,人人都可以玩转大数据,共同探索数据众创新模式。
今天看啥  ›  专栏  ›  天池大数据科研平台

这应该是最全的PCA原理总结了(下)

天池大数据科研平台  · 公众号  · 大数据  · 2019-06-17 22:00
01PCA算法流程从上面两节我们可以看出,求样本x(i)的n'维的主成分其实就是求样本集的协方差矩阵XXT的前n'个特征值对应特征向量矩阵W,然后对于每个样本x(i)做如下变换z(i)=WTx(i),即达到降维的PCA目的。下面我们看看具体的算法流程。输入:n维样本集D=(x(1),x(2),...,x(m)),要降维到的维数n'.输出:降维后的样本集D'1) 对所有的样本进行中心化:2) 计算样本的协方差矩阵XXT3) 对矩阵XXT进行特征值分解4)取出最大的n'个特征值对应的特征向量(w1,w2,...,wn'), 将所有的特征向量标准化后,组成特征向量矩阵W。5)对样本集中的每一个样本x(i),转化为新的样本z(i)=WTx(i)6) 得到输出样本集D'=(z(1),z(2),...,z(m))有时候,我们不指定降维后的n'的值,而是换种方式,指定一个降维到的主成分比重 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照