【R语言】

2024-06-28 14:08| 来源: 网络整理| 查看: 265

本期介绍了利用R语言进行相关性分析和数据的可视化的方法。一、什么是相关性分析？

相关性分析是指对两个或多个具备相关性的变量元素进行分析，从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。在组学测序（如转录组）中需设置多个生物学重复，而对多个生物学重复样本的相关性分析，可从中判断生物学重复样本数据是否可以用于接下来的分析。如有一生物学重复不一致的情况，可去除变异数据，预防某一重复数据不可用，进而影响实验数据的分析。

常见的相关性分析方法有三种：皮尔森（pearson）相关系数、斯皮尔曼（spearman）相关系数和肯德尔（kendall）相关系数。

表1 相关性关系

极弱相关或无相关

弱相关

中等程度相关

强相关

极强相关

0.0-0.2

0.2-0.4

0.4-0.6

0.6-0.8

0.8-1.0

1 皮尔森相关系数（Pearson）

皮尔森相关系数（Pearson），也称为线性相关系数，积差相关系数，1890年由英国统计学家卡尔•皮尔逊提出。是用来反映两个变量线性相关程度的统计量，适用于满足正态分布的数据。相关系数用r表示，其中n为样本量，分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的绝对值越大表明相关性越强。r的取值在-1与+1之间，若r>0，表明两个变量是正相关，即一个变量的值越大，另一个变量的值也会越大；若r

【本文地址】

公司简介

联系我们