用python和Excel进行列联表分析(卡方检验) | 您所在的位置:网站首页 › numpy卡方检验 › 用python和Excel进行列联表分析(卡方检验) |
用python和Excel进行列联表分析
卡方检验回顾(独立性检验)
行(\(r_i\))列(\(c_j\))
\(j=1\)
\(j=2\)
\(\cdots\)
合计
\(i=1\)
\(f_{11}\)
\(f_{12}\)
\(r_1\)
\(i=2\)
\(f_{21}\)
\(f_{22}\)
\(r_2\)
\(\vdots\)
\(\vdots\)
\(\vdots\)
\(\vdots\)
合计
\(c_1\)
\(c_2\)
\(\cdots\)
\(n\)
建立原假设和备择假设 \[H_0:\text{两变量独立 }vs\text{ }H_1:\text{两变量不独立 } \]计算自由度和理论频数 自由度:\((r-1)*(c-1)\),其中\(r,c\)分别是行数和列数 我们将实际频数记作\(f_{ij}\),期望(理论)频数记作\(e_{ij}\),且\(e_{ij}=\frac{r_i*c_j}{n}\) 计算卡方统计量 \[\chi^{2}=\sum\limits_{i=1}^{r} \sum\limits_{j=1}^{c} \frac{\left(f_{i j}-\mathrm{e}_{i j}\right)^{2}}{\mathrm{e}_{i j}} \sim \chi^{2}(d f) \]实际观察次数与理论次数之差的平方再除以理论次数得到的统计量近似服从卡方分布 查χ2方分布临界值表,确定接受域 \[\chi_{1-\frac{\alpha}{2}}^{2}(\mathrm{df}) |
CopyRight 2018-2019 实验室设备网 版权所有 |