资源简介 (共29张PPT)管理统计学10 生存分析10.1 基本概念10.2 寿命表分析10.3 Kaplan-Meier分析10.4 Cox 回归分析10.1.1 基本术语失效时间:也被称为“死亡”事件或失败事件,表示观察到随访对象出现了我们所规定的结局截尾(删失)值:当观察对象的资料不能提供完全的信息时,这些对象的观察值称为截尾值(或删失),常用符号“+”表示生存时间:即随访观察持续的时间,按失效事件发生或失访前最后一次的随访时间记录,常用符号t表示生存率:生存概率,指某个观察对象活过 时刻的概率,常用 表示10.1.2 基本函数生存函数危险率函数平均剩余寿命10.1.3 常见的参数模型指数分布(参数 )线性危险率分布Weibull分布(参数 )10.1.4 生存分析的方法参数法观察的生存时间t服从某一特定的分布估计分布中的参数获得生存率的估计值生存时间的分布可能为指数分布、Weibull分布、对数正态分布等这些分布曲线都有相应的生存函数形式,只需求得相应参数的估计值,即可获得估计值和曲线非参数法检验假设参数法一样,假设两组或多组的总体生存率曲线分布相同,不论总体的分布形式和参数如何半参数法只规定影响因素和生存状况间的关系,没有对时间(和风险函数)的分布情况加以限定主要用于分析生存率的影响因素属于多因素分析方法,典型方法是Cox比例风险模型10.2.1 寿命表分析寿命表的由来格兰特于1662年完成《关于死亡表的自然和政治的观察》(简称(死亡率表)),提出了寿命表概念基本思想将观测区间划分为很多小的时间区间,对每一个区间所估计的概率都用来估计事件发生在不同的时间点上的概率10.2.1 寿命表分析寿命表的由来格兰特于1662年完成《关于死亡表的自然和政治的观察》(简称(死亡率表)),提出了寿命表概念基本思想将观测区间划分为很多小的时间区间,对每一个区间所估计的概率都用来估计事件发生在不同的时间点上的概率原理某一个期望观测到的在 岁间的死亡个数等于实际死亡个数,即10.2.2 寿命表分析的SPSS操作Analyze → Survival → Life Tables源变量列表框选择生存时间变量设置时间区间的长度及终点选入状态变量选入一阶因素变量选入二阶因素变量设置一个指示事件发生的数值设置一个指示事件发生的数据区间因素变量的上界因素变量的下界输出寿命表选择所输出的函数图形比较不同水平的一阶因素变量的方法10.2.2 寿命表分析的SPSS操作寿命表(Life Tablea)Interval Start Time Number Entering Interval Number Withdrawing during Interval Number Exposed to Risk Number of Terminal Events Proportion Terminating Proportion Surviving Cumulative Proportion Surviving at End of Interval Std. Error of Cumulative Proportion Surviving at End of Interval Probability Density Std. Error of Probability Density Hazard Rate Std. Error of Hazard Rate0 50 0 50.000 0 .00 1.00 1.00 2.83 .000 .000 .00 .0020 50 0 50.000 8 .16 .84 .84 2.39 .008 .023 .01 .0040 42 0 42.000 21 .50 .50 .42 1.20 .021 .060 .03 .0160 21 4 19.000 8 .42 .58 .24 .70 .009 .025 .03 .0180 9 6 6.000 0 .00 1.00 .24 .70 .000 .000 .00 .00100 3 3 1.500 0 .00 1.00 .24 .70 .000 .000 .00 .00a. The median survival time is 56.19平均生存时间生存函数图生存率为0.42随着时间的增加,生存率在下降,到第60个月时下降到42%10.3.1 Kaplan-Meier分析简介由Kaplan与Meier于1958年提出,又称为乘积极限(PL)估计一种非参数方法,主要用于小样本分组资料的生存函数估计模型建立的两个基础对每一个事件发生的时间 点的条件概率所作的估计这些概率的范围,然后使用这两方面的信息来估计每一个时间点的生存率KM分析的数学原理累积生存函数的估计值生存函数的 分位点为10.3.2 Kaplan-Meier分析SPSS操作Analyze → Survival → Kaplan-Meier源变量列表框选择生存时间变量选择状态变量选入一个分类变量选入一个分层变量选入一个变量来标定观测量选择新变量的保存比较因子水平定义状态变量的事件选项设置一个指示事件发生的数值设置一个指示事件发生的数值区间设置指示事件发生的值的列表选择检验的统计方法选择比较方法生存率复选框,“sur_”累计事件复选框,“cul_”生存率的标准误差复选框,“se_”危险函数复选框,“haz_”输出简化生存表输出生存时间的均值和中位数输出生存时间的分位数选择统计量设置输出图形线性刻度生成的累积函数输出(1-累积生存函数)线性刻度生成的累积危险函数以对数刻度生成的积累生存函数10.3.2 Kaplan-Meier分析SPSS操作观测量汇总表(Case Processing Summary)温度条件 Total N N of Events CensoredN Percent80度 50 37 13 26.0%100度 40 34 6 15.0%Overall 90 71 19 21.1%观察个案总数完全数据个数截尾数据个数和比例生存时间的平均数和中位数(Means and Medians for Survival Time)温度条件 Meana MedianEstimate Std. Error 95% Confidence Interval Estimate Std. Error 95% Confidence IntervalLower Bound Upper Bound Lower Bound Upper Bound80度 63.712 3.784 56.296 71.128 55.000 3.536 48.070 61.930100度 44.781 4.370 36.216 53.346 38.000 2.369 33.357 42.643Overall 55.620 3.081 49.581 61.660 49.000 1.897 45.281 52.719a.Estimation is limited to the largest survival time if it is censored两种温度条件下生存率比较表(Overall Comparisons)Chi-Square df Sig.Log Rank (Mantel-Cox) 7.715 1 .005Breslow (Generalized Wilcoxon) 13.133 1 .000Tarone-Ware 10.704 1 .001Test of equality of survival distributions for the different levels of 温度条件.中位生存时间平均预期生存时间统计量自由度Sig.值0.91431可以认为20度的变化是导致发动机绕组解体的重要因素10.4.1 COX回归分析1972年英国统计学家D.R.Cox提出的半参数模型专门用于生存时间多变量分析的统计方法对生存时间分布无要求,可估计出各研究因素对风险率的影响,应用范围很广模型中包含预测变量(协变量)COX回归分析的数学原理Cox回归分析的比例危险度模型为上面的模型暗示有两个假设危险率函数与独立协变量之间有一个对数线性关系危险率函数与协变量的对数线性函数之间存在乘积关系比例危险率模型中“比例”的含义10.4.2 COX回归分析的操作Analyze → Survival → Cox Regression源变量列表框同Kaplan-Meier窗口介绍选择分层变量选入协变量交互作用项选择协变量进入回归方程形式定义分类变量图形保存设置设置对比方法协变量列表框选择生成的图形选择以什么样的对比变量和协变量的均值来输出函数图形按变量值将数据分为两个或多个小的分组输出以线性刻度生成的累积生存函数输出(1-累积生存函数)输出以线性刻度生成的累积危险函数输出(1-对数刻度生成的累积生存函数)选择所要保存的生存函数和诊断设置需要显示的模型信息选择模型统计量选择逐步分析方法设置迭代进行的最大次数10.4.2 COX回归分析的操作观测量汇总表(Case Processing Summary)N PercentCases available in analysis Eventa 45 90.0%Censored 5 10.0%Total 50 100.0%Cases dropped Cases with missing values 0 .0%Cases with negative time 0 .0%Censored cases before the earliest event in a stratum 0 .0%Total 0 .0%Total 50 100.0%a.Dependent Variable:生存时间(月)完全数据截尾数据,用于计算危险率总数据比例模型系数综合检验表(Omnibus Tests of Model Coefficientsa,b )-2 Log Likelihood Overall (score) Change From Previous Step Change From Previous BlockChi-square df Sig. Chi-square df Sig. Chi-square df Sig.245.259 33.621 3 .000 31.393 3 .000 31.393 3 .000a. Beginning Block Number 0b. Beginning Block Number 1. Method = Enter引入方程的变量(Variables in the Equation)B SE Wald df Sig. Exp(B) 95.0% CI for Exp(B)Lower Upperx1 .001 .002 .360 1 .548 1.001 .997 1.005x2 .454 .206 4.846 1 .028 1.574 1.051 2.358x3 -1.886 .377 25.050 1 .000 .152 .072 .317根据上表可以得到引入协变量后的回归方程为:()保护因素分层变量的作用是显著的初始的-2对数似然值为276.652,引入变量进行分层后为245.259Meanx1 34.504x2 .600x3 .500x1 x2x2 -.415x3 .012 -.224协变量平均值(Covariate Means)正相关负相关协变量平均水平下的生存函数图3073.57生存率一直呈下降趋势;在第30个月的时候下降到0.1左右,然后保持平稳状态;到73.57个月时,生存率下降为0.000。相关系数矩阵(Correlation Matrix of Regression Coefficients) 展开更多...... 收起↑ 资源预览