怎么理解生存分析的风险函数? | 您所在的位置:网站首页 › 生存率的估计 › 怎么理解生存分析的风险函数? |
国内书上讲得粗糙,没给出细节,直接上结论,让很多喜欢刨根问底的学生一头雾水。下面结合国外教材加上个人理解作一点知识梳理: 令 Y 表示生存时间这个随机变量,令 f_{Y}\left( y \right) 表示 Y 的概率密度函数。 则 Y 的累积分布函数为: F_{Y}\left( y\right)=P(Y \leq y)=\int_{0}^{y}f_{Y}\left( t \right)dt. 由此可见, F_{Y}\left( y \right) 表示直到 时刻 y 时事件(失效、死亡等)发生的累积概率。 生存函数(survivor function)定义为: S_{Y}\left( y \right)=P\left( Y>y \right)=1-F_{Y}\left( y \right) ,可见,生存函数表示某样本的生存时间大于时刻 y 的概率。 生存函数可以用来预测生存时间的百分位点,比如: 当 S_{Y}\left( y \right)=1-0.5=0.5 时,可以根据这个式子求解中位生存时间 y_{50} 。 风险函数(hazard function)定义为: h_{Y}\left( y \right)=\frac{f_{Y}\left( y \right)}{S_{Y}\left( y \right)}. (定义式) 可见,风险函数 h_{Y}\left( y \right) 既不是概率密度,也不是累积概率分布。 不过,我们仍可以把它看做:到时刻 y 时存活下来的个体在此后一个无限小的时间区间 \left[ y, y+\partial y\right] 内结局事件(失效、死亡)发生的概率。在这个意义上,风险函数 h 是risk的一种度量,在时刻 y_{1} 和时刻 y_{2} 之间, h 越大,则事件(失效)发生的risk也越大。 为啥可以这么理解风险函数呢?下面给出道理: 由概率密度函数 f_{Y}\left( y \right) 的定义知: f_{Y}\left( y \right)=\lim_{\partial y \rightarrow 0}{\frac{{F_{Y}\left( y+\partial y \right)-F_{Y}\left( y \right)}}{\partial y}}, 于是: h_{Y}\left( y \right)=\lim_{\partial y \rightarrow 0}{\frac{{F_{Y}\left( y+\partial y \right)-F_{Y}\left( y \right)}}{\partial y \cdot S_{Y}\left( y \right)}}\\ =\lim_{\partial y \rightarrow 0}{\frac{P(y\lambda>1 ,那么 h_{Y}\left( y \right) 随着 y 的增大而增大;若形状参数 \lambda |
CopyRight 2018-2019 实验室设备网 版权所有 |