SCI论文中的P for trend是什么鬼？为什么高分文章经常采用呢推荐

2023-07-29 20:51| 来源: 网络整理| 查看: 265

导读精鼎40期SPSS软件实战训练营

（详情点击）

2018年4月20-27日

安徽合肥

SCI论文中，统计分析经常用到P for trend，而且高分论文出现频率更高，请见下图。

图1

图2

图3

这是干啥的？啥时候用？怎么实现呢？为什么要这么做呢？今天松哥就和大家一起唠唠嗑！

松哥统计说

1、这是啥？

P for trend是线性趋势检验的P值，用于反映自变量x是否与目标变量Y存在线性关系。

2、何时用呢？

一般都用于进行回归分析时，用于识别判定自变量与因变量的线性趋势关系。常见于Logistic回归，COX回归，以及线性回归时。自变量本身为计量资料。

3、为什么要这样做呢？

你肯定会问，自变量本身就是计量资料，为什么不能直接带入模型进行分析，线性回归结果解释为自变量每增加1个单位，Y改变多少单位（线性）；Logistic/COX，为自变量增加1个单位，结局事件发生的风险（OR/HR）。

很多的时候自变量增加1个单位，Y未必有太大的变化或风险，如图3微球蛋白增加1mg/L的时候，很可能并未有多少变化。为了增加模型发现风险的能力；对于年龄，有时候我们将10岁划分为1组；然而对于一些生化指标，怎么划分呢？

于是我们采用四分位数间距（Q），我们将自变量X以四分位数间距进行分组，可以分为4组，我们Q1=1；Q2=2；Q3=3；Q4=4，见图2蓝色框；

红色框为P for trend值，它是怎么计算出来的呢？就是将原始的x转化为等级变量，1、2、3、4带入模型，以1为参照，Logistic回归得到的P值就是P for trend。

图2黄色框，的第二行，还有一个P值，这是怎么算的呢？试想，咱们凭什么认为X和Y之间是线性的呢？万一不符合线性，咱们非要按照等级的线性进行分析，那是不对的。

为了保险起见，我们还要把等级的（1、2、3、4）再次当做分类变量，设置哑变量进入模型进行分析，以1为参照，就又可以得到3个对比的P值。这就是黄色框中P值的由来。

4、图2解读

图2中，我们以黄色框为例，进行解读，其他内容相同；黄色框所对应的P for trend为0.0007

然后作者又将等级资料降一级为分类，设置哑变量进行分析；得到1:2无意义；1:3无意义；1:4有意义。让我们进一步了解各组间差异；

松哥的经验认为，理论上，1:4应该先有统计学意义；然后才可能1;3,再而1:2；如果出现顺序错乱，那就有意思啦！很可能说明数据并不呈现线性趋势而是U型或其他形式。

细心的你看模型2、模型3和模型4，是不是都是1:4,1:3有意义。再次验证松哥的判断。

模型1和模型2、3、4比，由1个1:4有意义，变成1:4和1:3有意义，也说明了其他因素的校正，改善了模型，更加深刻识别X对Y的作用。

松哥小结

很多高分论文，其实做的内容页不多，但是就是分析的深刻。中国人经常围绕某主题，一检测就是7-8个指标，而老外往往一个指标就可以写1篇好文章。想想咱们指标浪费的好亏啊！

我们常常是将7-8个指标，往方程里一放，做个逐步回归，就准备盖棺论定，下结论了，而老外往往一个指标讨论的非常细致。这就是差距，其他TM的都是套路。因为国人统计太弱了，在这上面吃亏！

但松哥可以预感到，未来5-10年，是中国的科技井喷阶段，开创性的成果将陆续出世！另这几期讨论的有点深，有人有意见了，后面会照顾全面些。

（很多文章还会计算Per 1. SD，后续松哥还会解读哦！）

【本文地址】

公司简介

联系我们