PCA原理解读和绘制方法 您所在的位置:网站首页 PCA降维的两个关键步骤 PCA原理解读和绘制方法

PCA原理解读和绘制方法

2024-07-09 13:24| 来源: 网络整理| 查看: 265

⚠️该教程的PCA绘图基于ggplot2,可以根据ggplot2语法对图片进行额外的修改和保存。

1. 基础

PCA:全称Principal Component Methods,也就是主成分分析。

主成分分析是一种通过协方差分析来对数据进行降维处理的统计方法。首先利用线性变换,将数据变换到一个新的坐标系统中;然后再利用降维的思想,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上。这种降维的思想首先减少数据集的维数,同时还保持数据集的对方差贡献最大的特征,最终使数据直观呈现在二维坐标系。主要适用于以下情况:已获得一定数目的变量的观测值,并希望能够构造出少数几个综合变量,在最大程度上反映原始数据的消息。

主要目的: 发现数据的内在模式 对高维数据进行降维,去除数据的噪音和冗余 识别相关变量

2. 计算 2.1 R包

很多R包中的functions可以用来计算PCA: · prcomp() 和 princomp() [built-in R stats package], · PCA() [FactoMineR package], · dudi.pca() [ade4 package], · epPCA() [ExPosition package]

在这个教程里主要是用两个R包:FactoMineR (for the analysis) 和factoextra (for ggplot2-based visualization)。

安装和加载

install.packages(c("FactoMineR", "factoextra")) library("FactoMineR") library("factoextra") 2.2 数据格式

载入演示数据集

data(decathlon2) View(decathlon2) 在这个表中,1:23行是Active individuals,也就是主成分分析需要是用的Individuals;24:27行是Supplementary individuals;1:10列是Active variables,也就是主成分分析需要是用的variables;11:12行是Supplementary variables。

把主成分分析所需要用的Active individuals和Active variables提取出来

decathlon2.active


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有