怎么理解生存分析的风险函数?

2023-03-26 02:12| 来源: 网络整理| 查看: 265

国内书上讲得粗糙，没给出细节，直接上结论，让很多喜欢刨根问底的学生一头雾水。下面结合国外教材加上个人理解作一点知识梳理：

令 Y 表示生存时间这个随机变量，令 f_{Y}\left( y \right) 表示 Y 的概率密度函数。

则 Y 的累积分布函数为： F_{Y}\left( y\right)=P(Y \leq y)=\int_{0}^{y}f_{Y}\left( t \right)dt.

由此可见， F_{Y}\left( y \right) 表示直到时刻 y 时事件（失效、死亡等）发生的累积概率。

生存函数（survivor function）定义为： S_{Y}\left( y \right)=P\left( Y>y \right)=1-F_{Y}\left( y \right) ，可见，生存函数表示某样本的生存时间大于时刻 y 的概率。

生存函数可以用来预测生存时间的百分位点，比如：

当 S_{Y}\left( y \right)=1-0.5=0.5 时，可以根据这个式子求解中位生存时间 y_{50} 。

风险函数（hazard function）定义为： h_{Y}\left( y \right)=\frac{f_{Y}\left( y \right)}{S_{Y}\left( y \right)}. (定义式)

可见，风险函数 h_{Y}\left( y \right) 既不是概率密度，也不是累积概率分布。

不过，我们仍可以把它看做：到时刻 y 时存活下来的个体在此后一个无限小的时间区间 \left[ y, y+\partial y\right] 内结局事件（失效、死亡）发生的概率。在这个意义上，风险函数 h 是risk的一种度量，在时刻 y_{1} 和时刻 y_{2} 之间， h 越大，则事件（失效）发生的risk也越大。

为啥可以这么理解风险函数呢？下面给出道理：

由概率密度函数 f_{Y}\left( y \right) 的定义知：

f_{Y}\left( y \right)=\lim_{\partial y \rightarrow 0}{\frac{{F_{Y}\left( y+\partial y \right)-F_{Y}\left( y \right)}}{\partial y}},

于是： h_{Y}\left( y \right)=\lim_{\partial y \rightarrow 0}{\frac{{F_{Y}\left( y+\partial y \right)-F_{Y}\left( y \right)}}{\partial y \cdot S_{Y}\left( y \right)}}\\ =\lim_{\partial y \rightarrow 0}{\frac{P(y\lambda>1 ，那么 h_{Y}\left( y \right) 随着 y 的增大而增大；若形状参数 \lambda

【本文地址】

公司简介

联系我们