spss秩和检验.docx | 您所在的位置:网站首页 › friedman检验spss › spss秩和检验.docx |
spss秩和检验.docx 《spss秩和检验.docx》由会员分享,可在线阅读,更多相关《spss秩和检验.docx(19页珍藏版)》请在冰豆网上搜索。 spss秩和检验 秩和检验 前面介绍的均数的区间估计及假设检验,都是要求个体变量值服从正态分布,或根据中心极限定理,当样本较大时,样本均数服从正态分布。 这种要求样本来自总体分布型是已知的,在此基础上对总体参数进行估计或检验,称为参数统计(parametricstatistics)。 但在医学研究中,许多数据不符合参数统计的要求,这时有两种处理的方法。 一是,进行数据转换,使其符合参数统计方法的要求。 二是,选择非参数检验方法,非参数检验(non-parametrictest)方法是对样本来自的总体分布不作要求(如不要求样本来自正态分布)的一类假设检验方法。 非参数检验的主要优点是对样本的总体分布不作要求,适用的范围广,尤其是当变量中有不确定数值时,如 同时,非参数检验方法存在其致命的缺点,其检验功效低于相应的参数统计方法。 因此,如果数据符合参数统计的要求首选参数统计方法;如果数据不符合参数统计的要求有两个选择,一是选择非参数检验方法。 下面介绍了属于非参检验的两种秩和检验(ranksumtest)方法。 二是,将数据经过变换使其符合参数统计方法,再选择参数统计方法,本节介绍了几种数据变换方法。
应用条件 ①总体分布形式未知或分布类型不明; ②偏态分布的资料: ③等级资料: 不能精确测定,只能以严重程度、优劣等级、次序先后等表示; ④不满足参数检验条件的资料: 各组方差明显不齐。 ⑤数据的一端或两端是不确定数值,如“>50mg”等。 一、配对资料的Wilcoxon符号秩和检验(Wilcoxonsigned-ranktest) 例1对10名健康人分别用离子交换法与蒸馏法,测得尿汞值,如表9.1的第 (2)、(3)栏,问两种方法的结果有无差别? 表110名健康人用离子交换法与蒸馏法测定尿汞值(μg/l) 样品号 (1) 离子交换法 (2) 蒸馏法 (3) 差值 (4)= (2)(3) 秩次 (5) 1 0.5 0.0 0.5 2 2 2.2 1.1 1.1 7 3 0.0 0.0 0.0 — 4 2.3 1.3 1.0 6 5 6.2 3.4 2.8 8 6 1.0 4.6 -3.6 -9 7 1.8 1.1 0.7 3.5 8 4.4 4.6 -0.2 -1 9 2.7 3.4 -0.7 -3.5 10 1.3 2.1 -0.8 -5 T+=+26.5 T-=-18.5 差值先进行正态性及方差齐性检验,看是否可以做参数检验,其检验效能高于非参数检验。 (下同) H0: Md(差值的总体中位数)=0H1: Md≠0α=0.05 T++T-=1+2+3+…n=n(n+1)/2 1小样本(n≤50)--查T界值表 基本思想: 如果无效假设H0成立,则正负秩和的绝对值从理论上说应相等,都等于n(n+1)/4,既使有抽样误差的影响正负T值的绝对值相差也不应过大。 反过来说,如果实际计算出的正负T值绝对值相差很大,我们只能认为H0成立的可能性很小。 界值的判断标准 若下限表中概率值 若T≤下限或T≥上限,则P值≤表中概率值 2大样本时(n>50),正态近似法(Z检验) 基本思想: 假定无效假设H0成立,则正负秩和的绝对值应相等,随着n增大T逐渐趋近于均数等于n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布。 所以可用近似正态法计算Z值。 即: *校正公式: 当相同秩次个数较多时 tj: 第j个相同秩次的个数 SPSS: 建立变量名: 录入数值: 统计分析: 分析——非参数检验——两相关样本(配对样本) 结果分析: 表一: 第一行: b-a的负秩(NegativeRanks)有5个(右上角的a在表下方有注释),平均秩次为5.3,负秩和为26.5。 第二行: 正秩,正秩的个数,平均秩次,正秩和。 表二: 可用正秩和18.5或负秩和26.5计算,习惯上用较小的秩和计算Z值。 p=0.635大于0.05,不拒绝H0,还不能认为两种方法有差别。 二、两个独立样本比较的Wilcoxon秩和检验(Wilcoxonranksumtest) 1.原始数据的两样本比较 例2某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,试检验两组小鼠生存日数有无差别?
实验组 对照组 生存日数 秩次 生存日数 秩次 10 9.5 2 1 12 12.5 3 2 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9.5 90以上 22 11 11 12 12.5 13 14 n1=10 T1=170 n2=12 T2=83 时间资料不服从正态分布 H0: 两总体分布位置相同H1: 两总体分布位置不同a=0.05 记n较小组秩和为T,样本量n1。 如果n1=n2,可取任秩和 1查表法: 查T界值表: n1≤10,n2n1≤10 界值的判断标准: 若下限表中概率值 若T≤下限或T≥上限,则P值≤表中概率值 2正态近似法 当n1或n2-n1超出T界值表的范围时,随n增大,T的分布逐渐逼近均数为n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布,所以可用近似正态法计算Z值。 即: *校正公式(当相同秩次较多时) SPSS 建立变量名: 录入数值: 统计分析: 结果分析: Z值为-3.630,p<0.001,拒绝H0 2.频数表资料(或等级资料)的两样本比较 例320名正常人和32名铅作业工人尿棕色素定性检查结果见下表。 问铅作业工人尿棕色素是否高于正常人? 结果 (1) 人数 秩次 范围 (5) 平均秩次(6) 秩和 正常人 (2) 铅作业工人 (3) 合计 (4) 正常人 (7)= (2)(6) 铅作业工人 (8)=(3)(6) - 18 8 26 1-26 13.5 243 108 2 10 12 27-38 32.5 65 325 ++ 0 7 7 39-45 42.0 0 294 +++ 0 3 3 46-48 47.0 0 141 ++++ 0 4 4 49-52 50.5 0 202 合计 n1=20 n2=32 52 - - T1=308 T2=1070 取n较小组的秩和为T值,用校正公式计算。 即: SPSS: 建立变量名: 录入数值:
统计分析: 结果分析: 同两个独立样本比较的Wilcoxon秩和检验 Mann-WhitneyTest P<0.001,拒绝H0
三、多个样本比较的秩和检验(Kruskal-WallisHtest) 1.原始数据法 例4某研究者测定正常人、单纯性肥胖、皮质醇增多症者各10人的血浆总皮质醇含量见下表,问这三组人的血浆总皮质醇含量有无差别? 三组人的血浆总皮质醇含量测定值(μg/L) 正常人 单纯性肥胖 皮质醇增多症 测定值 秩次 测定值 秩次 测定值 秩次 0.4 1 0.6 2 9.8 20 1.9 4 1.2 3 10.2 21 2.2 6 2.0 5 10.6 22 2.5 8 2.4 7 13.0 23 2.8 9 3.1 10.5 14.0 25 3.1 10.5 4.1 14 14.8 26 3.7 12 5.0 16 15.6 27 3.9 13 5.9 17 15.6 28 4.6 15 7.4 19 21.6 29 6.0 18 13.6 24 24.0 30 Ri ni 96.5 10
117.5 10
251 10 H0: : 三组人的血浆总皮质醇含量总体分布位置相同 H1: 三组人的血浆总皮质醇含量总体分布位置不全相同 a=0.05 SPSS 建立变量名 录入数值: 统计分析: 结果分析: 若g(组数)=3且最小样本例数大于5或g>3时,H或HC近似服从自由度为g-1的卡方分布。 H=18.130,自由度=2,P<0.001,拒绝H0,三组总体分布位置不全相同,需做两两比较。 2.频数表法: 例5 (单向有序分类变量的多个样本比较) 用A、B、C三种药物治疗单纯性慢性支气管炎,结果见表第 (1)~(5)栏,问三种药物的总体疗效是否不同。 表三种药物疗效比较的秩和检验计算过程 疗效 (1) 药物 合计 (5) 秩次 范围 (6) 平均 秩次(7) 秩和R1 (8)= (2)´(7) 秩和R2 (9)= (3)´(7) 秩和R3 (10)= (4)´(7) A (2) B (3) C (4) 治愈 17 5 3 25 1~25 13.0 221.0 65.0 39.0 显效 51 11 17 79 26~104 65.0 3315.0 715.0 1105.0 好转 33 52 47 132 105~236 170.5 5626.5 8866.0 8013.5 无效 7 24 26 57 237~293 265.0 1855.0 6360.0 6890.0 合计 108 92 93 293 — — 11017.5 16006.0 16047.5 检验步骤如下: (1)建立检验假设 H0: 三种药物疗效的总体分布相同 H1: 三种药物疗效的总体分布不同或不全相同 =0.05 (2)编秩 用各疗效等级的合计值排序确定秩次范围,如表第(6)栏所示,A、B、C三种药物总的治愈人数是25,他们的秩次范围是1~25。 同理疗效为“显效”组的秩次范围是26~104,以此类推。 再对第(6)栏秩次范围的上下限求和取平均值得各等级的平均秩次,如第(7)栏所示,疗效为“治愈”组的平均秩次为 =13。 (3)求秩和 分别用第 (2)~(4)栏各等级的频数与(7)栏平均秩次相乘再求和,如第(8)~(10)栏所示。 (4)计算统计量H值 将第(8)~(10)栏的总秩和ΣT1、ΣT2、ΣT3代入公式(11.15)计算H值。 若各样本相同秩次较多时(如超过25%),由公式(11.15)计算所得H值偏小,应按公式(11.16)和公式(11.17)对H值作校正计算Hc H= (∑ )-3(N+1) H= ( + + )-3(293+1)=48.23 C=1-(tj3-tj)/(N3-N) C=1-(253-25)(793-79)(1323-132)(573-57)/(2933-293)=0.9086 Hc=H/C Hc=48.23/0.9086=53.08 (5)确定P值和作出统计结论 若组数k=3,每组例数均小于或等于5,可查附表H界值表,得出P值。 本例各组例数均大于5,已超出附表的范围,则H值近似服从ν=k-1的χ2分布,可查附表的χ2界值表。 故按ν=3-1=2,查χ2界值表得χ20。 05 (2)=5.99,因为53.08>5.99,故P 按α=0.05水平拒绝H0,接受H1认为三种药物的疗效不同或不全相同。 用SPSS统计软件中的nonparametrictests—KIndependentSamples—Kruskal-WallisH程序做秩和检验得到Hc统计量。
四、Friedman秩和检验 用于随机区组设计的非参数方法,分别在每个区组内编秩。
秩和检验方法要点和注意事项 检验方法 方法要点 注意事项 配对样本的符号秩检验 1.依差值大小编秩,再冠以差值的符号,任取T+、T-作为T,查附表9,T界值表。 T>T界值,P>α。 2.n>50,用z检验。 编秩时若差值绝对值相同符号相反,取平均秩次。 0差值省略。 两独立样本的秩和检验(分布位置) 1.按两组数据由小到大统一编秩,以n1较小者为T,查附表10T界值表。 T在界值范围内,P>α。 2.n1>10或n1-n2>10时,用z检验。 1.编秩时若相同数据在不同组,取平均秩次。 2.当相同秩次较多时,使用校正公式。 成组设计多样本比较的秩和检验(K-W检验) 1.将k组数据由小到大统一编秩,求各组秩和Ri。 2.计算H值,用ν=k-1查χ2界值表,确定P值。 3.拒绝H0时,应作多个样本两两比较的秩和检验。 1.编秩时若相同数据在不同组,取平均秩次。 2.当相同秩次较多时,使用校正公式。 |
CopyRight 2018-2019 实验室设备网 版权所有 |