真实世界大数据分析系列

您所在的位置：网站首页 › 检验效能的计算方法 › 真实世界大数据分析系列

真实世界大数据分析系列

2023-08-24 14:55| 来源: 网络整理| 查看: 265

i: 1, 2, 3, …, n个体；

j: 1, 2, 3, …, m 重复测量时间点；

不同个体不同时间点的结局指标

每个个体的截距值

每个个体的时间斜率值

残差

Level2:

固定截距项

固定时间效应

治疗与时间的交互效应

随机截距

随机时间效应或斜率

效应值的方差-协方差矩阵

我们需要根据预实验或者既往的研究对上述的参数进行估计，这里我们假设在治疗（treatment）与时间（time）存在交互效应，而且我们的研究目的是检验该交互效应时候具有统计学意义。简单的来说，我们想看两个治疗组别结局随时间变化的斜率是否有差异。无效假设是两组的斜率没有差异：δ= 0，δ是研究中的效应值。

接着，我们就可以使用以下的公式去进行样本量的计算：

δ: 效应值；

π：治疗组的患者比例，如果两组人数相同，π=0.5；

α: 一类错误值；

1-γ: 检验效能；

系数的方差

其中，

有两个成分：

1）个体内差异：

2）个体间的差异：

如果我们假定该模型中的方差-协方差矩阵满足复合对称性(compound symmetry, CS)，即repeated ANOVA中的假设。这时模型的整体方差为：

同时，个体内重复测量结局之间的关联也恒等于ρ（correlation）, 而

基于以上假设，我们可以将公式（1.1）简化为：

上面的样本量计算公式对重复测量值之间的相关性（ρ）是如何影响样本量（和检验效能）具有指导意义：我们可以发现样本量（N）与ρ成反比，当ρ增大时N减小。这意味着，如果重复测量之间的相关性更接近，则所需的N会降低。但是，如果模型的方差-协方差矩阵实际上比CS要复杂，那我们就会低估了样本量。

从上述的公式我们也可以发现样本量和检验效能还可能受到观察的持续时间和频率的影响：1）研究持续时间；2）重复测量的次数；3）重复测量的间隔；都会对样本量的估计造成影响。

我们可以使用相同的公式来计算检验效能，而纵向研究的效能则取决于受试者人数N和重复测量次数n的组合。功率将随着样本大小或重复测量次数的增加而增加。但是，与增加重复测量时间相比，增加样本大小通常会对功率产生更大的影响。

表1 在固定持续时间的纵向研究中，检验效能随样本量和重复测量次数影响的实例

我们可以注意到，power随样本大小的增加而大大增加，但仅随重复测量次数的增加而缓慢增加。

三、实用工具

我们可以使用一些工具来计算纵向数据研究的样本量和效能，例如：

1）NCSS提供的PASS（效能分析和样本量）软件。PASS软件为1030多种统计测试和置信区间方案提供了样本量工具。但是PASS并不是免费的软件。

2) SAS -- proc power procedure；

3) 另一个选项是GLIMMPSE，GLIMMPSE是一种用户友好的在线工具，可用于计算多层和纵向研究的效能和样本量：https://glimmpse.samplesizeshop.org/

使用GLIMMPSE计算样本量例子：

基于以上的研究假设，现在我们使用该网页去进行样本量的计算。

1)输入power值

在此示例中，我们选择检验效能= 0.9

2) 选择一项或多项统计检验

对于线性混合模型，我们选择Hotelling Lawley Trace

3)确定重复测量指标并输入各个重复测量时间点

4) 定义模型中的固定效应项，这里填入treatment并设置为两组

5) 选择一个研究假设，这里我们按照之前的想法选择交互效应项

6) 接着我们需要设定两组的人数比例，这里设为1，即两组人数相等(π=0.5)

7) 输入我们预期的两组各个时间点的均值

8)输入我们预计的结局变量的标准差

9) 设定每个时间点的标准差的比例，这里我们设定为标准差随着时间增加而增加

10) 最后一步是定义重复测量指标之间的相关性矩阵

这里我们选择LEAR model，LEAR model的设定与AR1结构很接近，它的设定为在矩阵中距离越近的测量点相关性越强，另外我们也可以选择unstructured结构，可以自由定义协方差矩阵。

结果：

结果提示，基于我们的假设以及估计，我们会需要6606的样本量以检验治疗与时间的交互效应。但是GLIMMPSE结果也存在一些局限，因为它没有考虑纵向研究的失访或者脱落问题，所以我们需要对结果进行调整。简而言之，如果我们预计最终的数据会有20％的观测值的缺失，则研究人员应计划将样本大小增加为1.25倍（1 /（1-0.20）），则我们之前计算出的样本量将需要提高为6606 * 1.25 = 8258。

参考文献：

1. Guo Y, Logan HL, Glueck DH, Muller KE. Selecting a sample size for studies with repeated measures. BMC Medical Research Methodology. 2013;13(1):100.

2. Muller KE, Lavange LM, Ramey SL, Ramey CT. Power Calculations for General Linear Multivariate Models Including Repeated Measures Applications. J Am Stat Assoc. 1992;87(420):1209-1226.

3. Lu K, Mehrotra DV, Liu GJSim. Sample size determination for constrained longitudinal data analysis. 2009;28(4):679-699.

4. Hedeker D, Gibbons RD, Waternaux CJJoE, Statistics B. Sample size estimation for longitudinal designs with attrition: comparing time-related contrasts between two groups. 1999;24(1):70-93.

5. Fitzmaurice GM, Laird NM, Ware JH. Applied longitudinal analysis. Vol 998: John Wiley & Sons; 2012.返回搜狐，查看更多

更多内容，请关注“医学大数据挖掘分析”公众号，欢迎留言联系～邮箱：[email protected] 地址：广州市天河区珠江东路高德置地秋广场F座

【本文地址】

公司简介

联系我们

今日新闻

推荐新闻

专题文章