Linear Mixde Model:线性混合模型简介 您所在的位置:网站首页 回归分析样本量要求是什么 Linear Mixde Model:线性混合模型简介

Linear Mixde Model:线性混合模型简介

2024-07-11 10:40| 来源: 网络整理| 查看: 265

欢迎关注”生信修炼手册”!

Linear Mixde Model, 简称LMM, 称之为线性混合模型。从名字也可以看出,这个模型和一般线性模型有着很深的渊源。

线性混合模型是在一般线性模型的基础上扩展而来,在回归公式中同时包含了以下两种效应

fixed-effects, 固定效应

random efffects,随机效应

其名称中的混合一词正是来源于此。一元简单线性模型的公式如下

其中X代表固定效应,ε表示随机误差,而线性混合模型的公式如下

相比简单线性模型,多出了Z这一项,这一项称之为随机效应。当然两种模型的本质并不是体现在回归公式中自变量的多少,而在于自变量的类别,在一般线性模型中,其自变量全部为固定效应自变量,而线性混合模型中,除了固定效应自变量外,还包含了随机效应自变量。

所以关键之处在于判定自变量的类别,如果一个自变量的所有类别在抽样的数据集中全部包含,则将该变量作为固定效应,比如性别,只要抽样的数据中同时包含了两种性别,就可以将性别作为固定效应自变量;如果一个自变量在抽样的数据集中的结果只是从总体中随机抽样的结果,那么需要作为随机效应自变量。简而言之,如果抽样数据集中的自变量可以包含该自变量的所有情况,则作为固定效应,如果只能代表总体的一部分,则作为随机效应。

在分析的时候,可以将自变量都作为固定效应自变量,然后用一般线性模型来进行处理,那么为何要引入随机效应自变量呢?

使用一般线性模型时,是需要满足以下3点假设的

正态性,因变量y符合正态分布

独立性,不同类别y的观察值之间相互独立,相关系数为零

方差齐性,不同类别y的方差相等

以性别这个分类变量为例,如果不同性别对应的因变量值有明显差异,也就说我们常说数据分层,那么就不满足上述条件了。此时如果坚持使用一般线性模型来拟合所有样本,其参数估计值不在具有最小方差线性无偏性,回归系数的标准误差会被低估,利用回归方程得到的估计值也会过高。

对于分层明显的数据,一种解决方案就是将不同的层分开处理,比如性别分层,那么就将不同性别的数据分开,每一类单独处理,但是这要求每一类包含的样本数据量要够多,而且分层因素的类别也不能太多,太多了处理起来也很麻烦。另外一个解决方案就是更换模型,使用线性混合模型。

一般线性模型有3个前提条件,而线性混合模型只保留了其中的第一点,即因变量要符合正态分布,对于独立性和方差齐性不做要求,所以适用范围更加广泛。

在线性混合模型中,随机效应变量Z的参数向量Γ服从均值为0,方差为G的正态分布,即Γ ~ N(0, G), 随机误差ε服从均值为,方差为R的正态分布,即ε ~ N(0, R), 同时假定G和R没有相关性,即Cov(G, R) = 0, 此时因变量Y的方差可以表示为

Var(Y) = ZGZ + R

在GCTA软件中,其核心就是线性混合模型,将所有SNP作为自变量,然后通过上述公式来估算SNP遗传力。

对于一般线性模型,可以通过最小二乘法或者最大似然法来估算其参数,对于线性混合模型,常用的参数估方法为约束性最大似然法

restricted maximum likelihood

简称REML, 对于如下的混合模型

其中y是已知的,表示因变量的观测值,β是未知的,表示固定效应的参数向量,u是未知的,表示随机效应的参数向量,对于该方程的参数估计,其实就是求解β和u的值,公式如下

对于固定效应β, 其估计值为最佳线性无偏估计

best linear unbiased estimates(BLUE)

对于随机效应u, 其估计值为最佳线性无偏预测

best linear unbiased predictors(BLUP)

线性混合模型只要求因变量服从正态分布,适用范围广,在遗传统计学中广泛使用。

·end·

—如果喜欢,快分享给你的朋友们吧—

往期精彩

自己动手进行逻辑回归,你也可以!

GWAS大家都知道,Gene-Based GWAS你了解吗?

3步搞定GWAS中的Gene Set Analysis

你听说过Epistasis吗?

GWAS中的Gene-Gene Interactions如何分析?看这里

终于搞清楚了Lasso回归和Ridge回归的区别

odd ratio置信区间的计算,你学会了吗?

多元回归分析存在多重共线性了怎么办?

基因型与表型的交互作用如何分析,多元回归来搞定

曼哈顿图就够了吗?你还需要LocusZoom

GWAS做完了,下一步做什么?

  GWAS meta分析

GWAS样本量不够怎么办,meta分析了解一下

你没看错,搞定GWAS meta分析只需一行代码!

meta分析的森林图不会画?看这里

GWAMA:GWAS meta-analysis的又一利器

点击鼠标即可完成GWAS meta分析,任何人都可以!

用R进行gwas meta分析,原来如此简单

  基因型填充

GWAS中的genotype imputation简介

基因型填充中的phasing究竟是什么

基因型填充前的质控条件简介

使用shapeit进行单倍型分析

gtool:操作genotype data的利器

使用IMPUTE2进行基因型填充

使用Beagle进行基因型填充

使用Minimac进行基因型填充

使用Eagle2进行单倍型分析

X染色体的基因型填充

文献解读|不同基因型填充软件性能的比较

Haplotype Reference Consortium:最大规模的单倍型数据库

Michigan Imputation Server:基因型填充的在线工具

  CNV分析

aCGH芯片简介

aCGH芯片分析简介

基于SNP芯片进行CNV分析中的基本知识点

PennCNV:利用SNP芯片检测CNV

DGV:人类基因组结构变异数据库

dbvar:染色体结构变异数据库

DGVa:染色体结构变异数据库

CNVD:疾病相关的CNV数据库

DECIPHER:疾病相关的CNV数据库

全基因组数据CNV分析简介

使用CNVnator进行CNV检测

使用lumpy进行CNV检测

CNVnator原理简介

WES的CNV分析简介

XHMM分析原理简介

使用conifer进行WES的CNV分析

使用EXCAVATOR2检测WES的CNV

靶向测序的CNV分析简介

使用CNVkit进行CNV分析

DECoN:最高分辨率的CNV检测工具

  TCGA

TCGA数据库简介

使用GDC在线查看TCGA数据

使用gdc-client批量下载TCGA数据

一文搞懂TCGA中的分析结果如何来

通过GDC Legacy Archive下载TCGA原始数据

使用GDC API查看和下载TCGA的数据

使用GDC下载TCGA肿瘤患者的临床信息

使用TCGAbiolinks下载TCGA的数据

使用TCGAbiolinks进行生存分析

使用TCGAbiolinks分析TCGA中的表达谱数据

使用TCGAbiolinks进行甲基化和转录组数据的联合分析

Broad GDAC:TCGA数据分析中心

使用cBioPortal查看TCGA肿瘤数据

UCSC  Xena:癌症基因组学数据分析平台

GEPIA:TCGA和GTEx表达谱数据分析平台

TANRIC:肿瘤相关lncRNA数据库

SurvNet:基于网络的肿瘤biomarker基因查找算法

TCPA:肿瘤RPPA蛋白芯片数据中心

TCGA Copy Number Portal:肿瘤拷贝数变异数据中心

  生存分析

生存分析详细解读

用R语言进行KM生存分析

使用OncoLnc进行TCGA生存分析

用R语言进行Cox回归生存分析

使用kmplot在线进行生存分析

  肿瘤数据库

ICGC:国际肿瘤基因组协会简介

HPA:人类蛋白图谱数据库

Oncomine:肿瘤芯片数据库

ONGene:基于文献检索的肿瘤基因数据库

oncomirdb:肿瘤相关的miRNA数据库

TSGene:肿瘤抑癌基因数据库

NCG:肿瘤驱动基因数据库

mutagene:肿瘤突变频谱数据库

CCLE:肿瘤细胞系百科全书

mSignatureDB:肿瘤突变特征数据库

GTEx:基因型和基因表达量关联数据库

  肿瘤免疫和新抗原

Cancer-Immunity Cycle:肿瘤免疫循环简介

TMB:肿瘤突变负荷简介

肿瘤微环境:Tumor microenvironment (TME)简介

肿瘤浸润免疫细胞量化分析简介

使用EPIC预测肿瘤微环境中免疫细胞构成

TIMER:肿瘤浸润免疫细胞分析的综合网站

quanTIseq:肿瘤浸润免疫细胞定量分析

The Cancer Immunome Atlas:肿瘤免疫图谱数据库

肿瘤新抗原简介

TSNAdb:肿瘤新抗原数据库

使用NetMHCpan进行肿瘤新抗原预测分析

  Hi-C数据分析

chromosome-territories:染色质疆域简介

chromosome conformation capture:染色质构象捕获技术

3C的衍生技术简介

解密Hi-C数据分析中的分辨率

A/B compartment:染色质区室简介

TAD:拓扑关联结构域简介

chromatin loops:染色质环简介

Promoter Capture Hi-C:研究启动子区染色质互作的利器

使用HiCUP进行Hi-C数据预处理

Juicer:Hi-C数据处理分析的利器

Juicer软件的安装详解

Juicebox:Hi-C数据可视化利器

Juicer实战详解

HiC-Pro:灵活的Hi-C数据处理软件

HiC-Pro实战详解

3D Genome Browser:Hi-C数据可视化工具

HiCPlotter:Hi-C数据可视化工具

3CDB:基于3C技术的染色质互作信息数据库

3DIV:染色质空间互作数据库

4DGenome:染色质相互作用数据库

4D nucleome project:染色质三维结构研究必不可少的参考项目

3dsnp:SNP在染色质环介导的调控网络中的分布数据库

iRegNet3D:疾病相关SNP位点在三维调控网络中的作用

使用WashU Epigenome Browser可视化hi-c数据

HiGlass:高度定制的Hi-C数据可视化应用

Hi-C Data Browser:Hi-C数据浏览器

使用FitHiC评估染色质交互作用的显著性

使用TADbit识别拓扑关联结构域

使用pyGenomeTracks可视化hi-c数据

hi-c辅助基因组组装简介

文献解读|使用hi-C数据辅助埃及伊蚊基因组的组装

  chip_seq数据分析

Chip-seq简介

chip_seq质量评估之计算样本间的相关性

chip_seq质量评估之查看抗体富集效果

chip_seq质量评估之PCA分析

chip_seq质量评估之coverage分析

chip_seq质量评估之FRiP Score

chip_seq质量评估之cross correlation

chip_seq质量评估之文库复杂度

depth, bedgraph, bigwig之间的联系与区别

bigwig归一化方式详解

使用igvtools可视化测序深度分布

使用UCSC基因组浏览器可视化测序深度分布数据

使用deeptools查看reads分布特征

使用phantompeakqualtools进行cross correlation分析

blacklist regions:NGS测序数据中的黑名单

MACS:使用最广泛的peak calling软件之一

MACS2 peak calling实战

使用SICER进行peak calling

使用HOMER进行peak calling

peak注释信息揭秘

PAVIS:对peak区域进行基因注释的在线工具

使用UPORA对peak进行注释

使用GREAT对peak进行功能注释

annoPeakR:一个peak注释的在线工具

使用ChIPpeakAnno进行peak注释

使用ChIPseeker进行peak注释

使用PeakAnalyzer进行peak注释

使用homer进行peak注释

利用bedtools预测chip_seq数据的靶基因

  motif

关于motif你需要知道的事

详解motif的PFM矩阵

详解motif的PWM矩阵

使用WebLogo可视化motif

使用seqLogo可视化motif

使用ggseqlogo可视化motif

MEME:motif分析的综合性工具

使用MEME挖掘序列中的de novo motif

使用DREME挖掘序列中的de novo motif

使用MEME-ChIP挖掘序列中的de novo motif

  chip_seq数据库

ENCODE project项目简介

FactorBook:人和小鼠转录因子chip_seq数据库

ReMap:人类Chip-seq数据大全

IHEC:国际人类表观基因组学联盟

Epifactors:表观因子数据库

GTRD:最全面的人和小鼠转录因子chip_seq数据库

ChIP-Atlas:基于公共chip_seq数据进行分析挖掘

Cistrome DB:人和小鼠的chip_seq数据库

chipBase:转录因子调控网络数据

unibind:human转录因子结合位点数据库

chip_seq在增强子研究中的应用

DENdb:human增强子数据库

VISTA:人和小鼠的增强子数据库

EnhancerAtlas:人和小鼠的增强子数据库

FANTOM5:人类增强子数据库

TiED:人类组织特异性增强子数据库

HEDD:增强子疾病相关数据库

HACER:human增强子数据库

SEdb:超级增强子数据库简介

dbSUPER:人和小鼠中的超级增强子数据库

dbCoRC:核心转录因子数据库

使用ROSE鉴定超级增强子

  18年文章目录

2018年推文合集

扫描下方二维码,关注我们,解锁更多精彩内容!

生物信息入门

只差这一个

公众号



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有