SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢推荐 您所在的位置:网站首页 spss分组计算四分位数 SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢推荐

SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢推荐

2023-07-29 20:51| 来源: 网络整理| 查看: 265

导读精鼎40期SPSS软件实战训练营

(详情点击)

2018年4月20-27日

安徽合肥

SCI论文中,统计分析经常用到P for trend,而且高分论文出现频率更高,请见下图。

图1

图2

图3

这是干啥的?啥时候用?怎么实现呢?为什么要这么做呢?今天松哥就和大家一起唠唠嗑!

松哥统计说

1、这是啥?

P for trend是线性趋势检验的P值,用于反映自变量x是否与目标变量Y存在线性关系。

2、何时用呢?

一般都用于进行回归分析时,用于识别判定自变量与因变量的线性趋势关系。常见于Logistic回归,COX回归,以及线性回归时。自变量本身为计量资料。

3、为什么要这样做呢?

你肯定会问,自变量本身就是计量资料,为什么不能直接带入模型进行分析,线性回归结果解释为自变量每增加1个单位,Y改变多少单位(线性);Logistic/COX,为自变量增加1个单位,结局事件发生的风险(OR/HR)。

很多的时候自变量增加1个单位,Y未必有太大的变化或风险,如图3微球蛋白增加1mg/L的时候,很可能并未有多少变化。为了增加模型发现风险的能力;对于年龄,有时候我们将10岁划分为1组;然而对于一些生化指标,怎么划分呢?

于是我们采用四分位数间距(Q),我们将自变量X以四分位数间距进行分组,可以分为4组,我们Q1=1;Q2=2;Q3=3;Q4=4,见图2蓝色框;

红色框为P for trend值,它是怎么计算出来的呢?就是将原始的x转化为等级变量,1、2、3、4带入模型,以1为参照,Logistic回归得到的P值就是P for trend。

图2黄色框,的第二行,还有一个P值,这是怎么算的呢?试想,咱们凭什么认为X和Y之间是线性的呢?万一不符合线性,咱们非要按照等级的线性进行分析,那是不对的。

为了保险起见,我们还要把等级的(1、2、3、4)再次当做分类变量,设置哑变量进入模型进行分析,以1为参照,就又可以得到3个对比的P值。这就是黄色框中P值的由来。

4、图2解读

图2中,我们以黄色框为例,进行解读,其他内容相同;黄色框所对应的P for trend为0.0007

然后作者又将等级资料降一级为分类,设置哑变量进行分析;得到1:2无意义;1:3无意义;1:4有意义。让我们进一步了解各组间差异;

松哥的经验认为,理论上,1:4应该先有统计学意义;然后才可能1;3,再而1:2;如果出现顺序错乱,那就有意思啦!很可能说明数据并不呈现线性趋势而是U型或其他形式。

细心的你看模型2、模型3和模型4,是不是都是1:4,1:3有意义。再次验证松哥的判断。

模型1和模型2、3、4比,由1个1:4有意义,变成1:4和1:3有意义,也说明了其他因素的校正,改善了模型,更加深刻识别X对Y的作用。

松哥小结

很多高分论文,其实做的内容页不多,但是就是分析的深刻。中国人经常围绕某主题,一检测就是7-8个指标,而老外往往一个指标就可以写1篇好文章。想想咱们指标浪费的好亏啊!

我们常常是将7-8个指标,往方程里一放,做个逐步回归,就准备盖棺论定,下结论了,而老外往往一个指标讨论的非常细致。这就是差距,其他TM的都是套路。因为国人统计太弱了,在这上面吃亏!

但松哥可以预感到,未来5-10年,是中国的科技井喷阶段,开创性的成果将陆续出世!另这几期讨论的有点深,有人有意见了,后面会照顾全面些。

(很多文章还会计算Per 1. SD,后续松哥还会解读哦!)



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有