SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢推荐 | 您所在的位置:网站首页 › spss分组计算四分位数 › SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢推荐 |
导读精鼎40期SPSS软件实战训练营 (详情点击) 2018年4月20-27日 安徽合肥 SCI论文中,统计分析经常用到P for trend,而且高分论文出现频率更高,请见下图。 图1 图2 图3 这是干啥的?啥时候用?怎么实现呢?为什么要这么做呢?今天松哥就和大家一起唠唠嗑! 松哥统计说 1、这是啥? P for trend是线性趋势检验的P值,用于反映自变量x是否与目标变量Y存在线性关系。 2、何时用呢? 一般都用于进行回归分析时,用于识别判定自变量与因变量的线性趋势关系。常见于Logistic回归,COX回归,以及线性回归时。自变量本身为计量资料。 3、为什么要这样做呢? 你肯定会问,自变量本身就是计量资料,为什么不能直接带入模型进行分析,线性回归结果解释为自变量每增加1个单位,Y改变多少单位(线性);Logistic/COX,为自变量增加1个单位,结局事件发生的风险(OR/HR)。 很多的时候自变量增加1个单位,Y未必有太大的变化或风险,如图3微球蛋白增加1mg/L的时候,很可能并未有多少变化。为了增加模型发现风险的能力;对于年龄,有时候我们将10岁划分为1组;然而对于一些生化指标,怎么划分呢? 于是我们采用四分位数间距(Q),我们将自变量X以四分位数间距进行分组,可以分为4组,我们Q1=1;Q2=2;Q3=3;Q4=4,见图2蓝色框; 红色框为P for trend值,它是怎么计算出来的呢?就是将原始的x转化为等级变量,1、2、3、4带入模型,以1为参照,Logistic回归得到的P值就是P for trend。 图2黄色框,的第二行,还有一个P值,这是怎么算的呢?试想,咱们凭什么认为X和Y之间是线性的呢?万一不符合线性,咱们非要按照等级的线性进行分析,那是不对的。 为了保险起见,我们还要把等级的(1、2、3、4)再次当做分类变量,设置哑变量进入模型进行分析,以1为参照,就又可以得到3个对比的P值。这就是黄色框中P值的由来。 4、图2解读 图2中,我们以黄色框为例,进行解读,其他内容相同;黄色框所对应的P for trend为0.0007 然后作者又将等级资料降一级为分类,设置哑变量进行分析;得到1:2无意义;1:3无意义;1:4有意义。让我们进一步了解各组间差异; 松哥的经验认为,理论上,1:4应该先有统计学意义;然后才可能1;3,再而1:2;如果出现顺序错乱,那就有意思啦!很可能说明数据并不呈现线性趋势而是U型或其他形式。 细心的你看模型2、模型3和模型4,是不是都是1:4,1:3有意义。再次验证松哥的判断。 模型1和模型2、3、4比,由1个1:4有意义,变成1:4和1:3有意义,也说明了其他因素的校正,改善了模型,更加深刻识别X对Y的作用。 松哥小结 很多高分论文,其实做的内容页不多,但是就是分析的深刻。中国人经常围绕某主题,一检测就是7-8个指标,而老外往往一个指标就可以写1篇好文章。想想咱们指标浪费的好亏啊! 我们常常是将7-8个指标,往方程里一放,做个逐步回归,就准备盖棺论定,下结论了,而老外往往一个指标讨论的非常细致。这就是差距,其他TM的都是套路。因为国人统计太弱了,在这上面吃亏! 但松哥可以预感到,未来5-10年,是中国的科技井喷阶段,开创性的成果将陆续出世!另这几期讨论的有点深,有人有意见了,后面会照顾全面些。 (很多文章还会计算Per 1. SD,后续松哥还会解读哦!) |
CopyRight 2018-2019 实验室设备网 版权所有 |