研究设计时混杂控制策略的结构分类

您所在的位置:网站首页 举例说明何为混杂因素的概念 研究设计时混杂控制策略的结构分类

研究设计时混杂控制策略的结构分类

2024-07-17 12:05:55| 来源: 网络整理| 查看: 265

因果关系研究通常围绕着一个特定暴露(X,如吸烟)与一个拟研究结局(Y,如肺癌)进行。外来干扰因素影响X-Y因果关联的估计存在着8种基本的因果结构[1],其中仅有混杂结构影响着X-Y总效应的估计。在人类识别这种效应前,混杂结构在易感人群中静默地发生着[2],使得拟研究结局表现出特有的人群分布特征。

正确的因果效应估计是所有因果关系研究的目标,控制所有的混杂成为实现这一目标的基本前提。通常做法是,在设计上采用合适的策略,如限制或匹配,尽可能收集已知的可测量的混杂因素,予以准确测量,并采用回归模型等数据分析方法,以达到控制混杂的目的。

目前大多数研究都期望能在获得X-Y统计学关联之后,通过排除法(真或假关联)或通行的病因标准而能达到因果关联的推断结论,但在实际操作中往往极难实现[3]。有向无环图(Directed Acyclic Graphs,DAGs)是因果关系研究的图形工具[1, 4-6],对研究涉及的暴露、结局及其干扰等因素,必须进行各变量之间是否存在因果效应的判断;虽然这个工作看似困难,但研究实施前的充分思考,不但能为形成正确的因果关系整体框架奠定基础,从而达到有效指导研究问题的提出、设计选择和数据分析的目的,而且可为分析结果的因果推断奠定基础[3]。本文尝试采用DAGs对研究设计时如何控制混杂的策略进行分类,并探索这种分类的意义。

1.混杂的因果结构及分类:

假定X为我们拟研究的暴露变量(如慢性乙型肝炎病毒感染),Y为拟研究的结局变量(如原发性肝细胞癌),C为干扰X-Y效应估计的混杂变量(如性别、年龄等)。绘制出混杂的因果结构(图 1),其中C→X和C→Y同时成立(C为X和Y的共同病因,也称共病因结构),形成了混杂路径X←C→Y,混杂了X-Y的效应。因病因是关联的基础,据此结构可很容易推出判断混杂的统计学标准;虽然,反过来的结论并不成立[3]。

图 1 混杂的因果结构 图选项

影响X-Y效应估计的因素众多,依据混杂的共病因结构(图 1),可将其区分为混杂因素和非混杂因素。前者又可根据是否已知、可测量及具体是否测量等情况,将混杂分为4种情形(图 2)。

图 2 混杂的分类 图选项

(1)科学家已认识、可测量并已测量的混杂:当前研究多数为这种情形。因混杂已知、可测量,在研究的设计和分析阶段中,均可采用常规的混杂控制策略予以解决。

(2)科学家已认识、可测量但未测量的混杂:虽然混杂已知、可测量,但在实际工作中因各种原因未予以测量,如回顾性队列研究中重要混杂未记录、设计考虑不够周密,或随着科学发展出现新的认识等。针对这类混杂,通常可采用定量偏倚分析,作为补救措施予以解决[7]。

(3)科学家已认识、但实际无法测量的混杂:虽然混杂已知,但对其测量不可行或难以测量,如社会经济状况,虽然通常被认为是暴露-结局关系研究的重要混杂。

(4)科学家未知的混杂:如小量饮酒可能降低冠心病的风险,虽然怀疑其中存在着混杂,但具体是什么因素起着混杂干扰作用仍不清楚[8]。这类混杂的存在,将给暴露-结局的效应估计造成困难。

获得正确的X-Y因果关联估计是研究的目标,在研究设计阶段,充分考虑混杂对X-Y的干扰是尤为关键的一步,并指导着后续研究的具体实施、变量的测量和结果的分析。因此,如何控制上述4类混杂成为需要解决的问题。

2.混杂结构的控制策略:

那么该如何进行混杂的控制呢?从混杂的因果结构及其构成路径来看(图 1),如有合适的策略或措施,如打断混杂路径使得混杂结构的完整性被破坏,则混杂自然得以控制,这构成了本文建立混杂控制策略的基本思路。

(1)第一种策略:混杂路径打断法。依据DAGs的规则,打断混杂路径上的任一因果关系,这样混杂路径自然消失,即可起到控制混杂的作用。具体可分为:①打断C→X(图 3A):相当于暴露干预完全法。通过设置合适的外部变量(Z)进行干预,即相当于在混杂结构的基础上建立人为的因果路径Z→X。若暴露X完全由Z所决定,此时C→X自然不成立,从而起到打断混杂路径的目的。这类设计即随机对照试验(Randomized Control Trials,RCTs),当随机化方法(Z)完全决定了研究对象的X取值(图 3A),即Z=X。该策略适用于上述混杂的所有4种情形,即已知和未知的、可测量和不可测量、已测量和未测量的混杂均可有效控制。理论上说此时X-Y效应估计不受混杂因素测量与否的影响,这也是在进行因果关系研究时RCTs优于其他设计的结构基础。②打断C→Y(图 3B):同样通过设置外部干预变量Z,即相当于在混杂结构的基础上建立人为的因果路径Z→Y;此时对Y的决定因素包括了混杂C、干预变量Z和拟估计的暴露X。理论上来说,如能恰好获得合适的变量Z,可使得C→Y的效应恰好为Z→Y的效应所抵消,则混杂得以控制。然而实际上的操作相当困难。③同时打断C→X和C→Y(图 3C):第一种:限制法,如性别为混杂,则研究对象只招募男性或女性;第二种:分层法,如性别为混杂,则通过分层法分别在男性或女性人群中研究X-Y的关系。此时C取值只有一个固定值,因此双路径(C→X和C→Y)同时不成立(被打断)。在分析阶段时,通过分层分析、多因素分析等手段来调整C,可同样达到混杂控制的效果,这也是数据分析阶段唯一可以实现的控制手段。这种策略适用于上述混杂的第一种情形,即混杂已知、可测量并且在实际研究实施中已进行了测量。这也是现有因果关系研究中混杂控制最为常用的策略之一。

注:图中蓝色双短线代表着该路径两个变量之间的因果关系被打断 图 3 混杂控制策略-混杂路径打断法 图选项

(2)第二种策略:混杂路径保留法:如果混杂结构中任意一条路径均无法被打断,则一般可通过以下几种办法进行混杂控制。①暴露不完全干预法(图 4A):延续2(1)①的策略,仍然通过设置合适的外部变量(Z)干预,此时暴露X可部分由Z决定,此时C→X路径不能被打断而仍然成立,如工具变量设计(Instrumental variabledesign,IV)[9-10]或孟德尔随机化设计(Mendelian randomization design)[11-13]。因Z为外源变量(不受混杂路径影响),通过估计无混杂的Z→X和Z→Y,从而间接估计X-Y的效应。这种策略同样地适用于上述混杂的4种情形。②中间变量法(图 4B):通过寻找X→Y之间合适的中间变量(M),此时可通过估计无混杂的X→M和调整X而获得无混杂的M→Y(因X为研究因素,是必须测量的),从而间接估计X-Y的效应。这种策略亦同样地适用于上述混杂的4种情形。Lange等[14]曾发表相关综述,文中对中间变量法做了详细的介绍及导读。③匹配法(图 4C和图 4D):匹配常常用于病例对照研究和队列研究设计,用于控制重要的或通常难以测量的混杂,其匹配混杂的DAGs分别对应于图 4C和4D。匹配依据混杂因素决定研究对象是否纳入研究(Z),因此图 4C和图 4D中C→Z成立。同时为了实现匹配使得组间变量的均衡性,病例对照研究对病例组和对照组之间的混杂因素实施匹配,故Y→Z成立;而队列研究对暴露组和非暴露组之间的混杂因素实施匹配,故C→Y成立(图 4D)。因匹配研究在分析时,只对纳入研究(Z=1)的暴露组和非暴露组(队列研究)或病例组和对照组(病例对照研究)进行,因此相当于对Z进行调整并且只可获得Z=1层的分析结果。这种策略适用于上述混杂的第一种和第三种情形。

图 4 混杂控制策略-混杂路径保留法 图选项

从混杂路径保留法上来看,3种方法的混杂结构/路径未被破坏而仍保留,但其控制混杂的机制不同:暴露不完全干预法和中间变量法实际上相当于忽视了混杂路径的存在,并且只能间接估计X-Y之间的效应。在混杂结构的完整性被保留并仍需进行正确因果效应的估计时,这两种方法在选择干预变量或中间变量时,通常不太容易。而匹配法虽可直接估计X-Y之间的效应,但其机制在于经由C→X所产生的混杂效应被因匹配而有意引入的选择性偏倚(因调整Z,关闭路径C→Z←X(图 4C)/C→Z←Y(图 4D)转为开放,而导致C-X/C-Y出现新的关联)所抵消[15-16]:在队列研究或X-Y为零效应的病例对照研究时,这种抵消是完全的,即混杂效应等于上述新引入的选择性偏倚;而在X-Y为非零效应的病例对照研究中,这种抵消不完全,受到路径C→X→Y的影响。这也解释了在数据分析时,匹配设计的队列研究通常不需要再调整匹配因素,而匹配设计的病例对照研究则通常需要。

混杂是干扰因果效应研究的固有现象,是研究设计需首先考虑的,并可结合数据分析阶段的控制策略,以达到混杂的完全控制为目标,构成了获得正确因果效应估计的基础。虽然混杂的因果结构仅有一个,但具体的控制策略却有多种,取决于混杂类型、研究设计、可行性等诸多因素。

本文应用DAGs,从研究设计阶段对混杂的控制策略进行分析与归类,揭示了控制混杂策略的结构基础。在研究设计时,应结合DAGs正确判断与X-Y效应估计的可能因素是否为混杂因素,列出所有的混杂因素,应努力寻找合适的工具变量、中间变量或干预变量,尽可能使用可控制4种情形的混杂的设计方法。当无法完全控制上述4种情形的混杂时,X-Y效应的估计将不可避免地出现残留混杂,尤其是观察性设计,在解释时应较为谨慎。

本文主要提出在研究设计时对混杂的控制策略,现实的研究将涉及具体的人群招募及抽样、测量、分析策略、可行性等,任何可能影响文中提及的因果结构的关系,将可能对混杂控制的策略及因果效应的估计产生影响。

利益冲突:


【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


    图片新闻

    实验室药品柜的特性有哪些
    实验室药品柜是实验室家具的重要组成部分之一,主要
    小学科学实验中有哪些教学
    计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
    实验室各种仪器原理动图讲
    1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
    高中化学常见仪器及实验装
    1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
    微生物操作主要设备和器具
    今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
    浅谈通风柜使用基本常识
     众所周知,通风柜功能中最主要的就是排气功能。在

    专题文章

      CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭