10 生存分析 课件(共29张PPT)-《管理统计学(第2版)》同步教学(电工版)

资源下载
  1. 二一教育资源

10 生存分析 课件(共29张PPT)-《管理统计学(第2版)》同步教学(电工版)

资源简介

(共29张PPT)
管理统计学
10 生存分析
10.1 基本概念
10.2 寿命表分析
10.3 Kaplan-Meier分析
10.4 Cox 回归分析
10.1.1 基本术语
失效时间:也被称为“死亡”事件或失败事件,表示观察到随访对象出现了我们所规定的结局
截尾(删失)值:当观察对象的资料不能提供完全的信息时,这些对象的观察值称为截尾值(或删失),常用符号“+”表示
生存时间:即随访观察持续的时间,按失效事件发生或失访前最后一次的随访时间记录,常用符号t表示
生存率:生存概率,指某个观察对象活过 时刻的概率,常用 表示
10.1.2 基本函数
生存函数
危险率函数
平均剩余寿命
10.1.3 常见的参数模型
指数分布(参数 )
线性危险率分布
Weibull分布(参数 )
10.1.4 生存分析的方法
参数法
观察的生存时间t服从某一特定的分布
估计分布中的参数获得生存率的估计值
生存时间的分布可能为指数分布、Weibull分布、对数正态分布等
这些分布曲线都有相应的生存函数形式,只需求得相应参数的估计值,即可获得估计值和曲线
非参数法
检验假设参数法一样,假设两组或多组的总体生存率曲线分布相同,不论总体的分布形式和参数如何
半参数法
只规定影响因素和生存状况间的关系,没有对时间(和风险函数)的分布情况加以限定
主要用于分析生存率的影响因素
属于多因素分析方法,
典型方法是Cox比例风险模型
10.2.1 寿命表分析
寿命表的由来
格兰特于1662年完成《关于死亡表的自然和政治的观察》(简称(死亡率表)),提出了寿命表概念
基本思想
将观测区间划分为很多小的时间区间,对每一个区间所估计的概率都用来估计事件发生在不同的时间点上的概率
10.2.1 寿命表分析
寿命表的由来
格兰特于1662年完成《关于死亡表的自然和政治的观察》(简称(死亡率表)),提出了寿命表概念
基本思想
将观测区间划分为很多小的时间区间,对每一个区间所估计的概率都用来估计事件发生在不同的时间点上的概率
原理
某一个期望观测到的在 岁间的死亡个数等于实际死亡个数,即
10.2.2 寿命表分析的SPSS操作
Analyze → Survival → Life Tables
源变量列表框
选择生存时间变量
设置时间区间的长度及终点
选入状态变量
选入一阶因素变量
选入二阶因素变量
设置一个指示事件发生的数值
设置一个指示事件发生的数据区间
因素变量的上界
因素变量的下界
输出寿命表
选择所输出的函数图形
比较不同水平的一阶因素变量的方法
10.2.2 寿命表分析的SPSS操作
寿命表(Life Tablea)
Interval Start Time Number Entering Interval Number Withdrawing during Interval Number Exposed to Risk Number of Terminal Events Proportion Terminating Proportion Surviving Cumulative Proportion Surviving at End of Interval Std. Error of Cumulative Proportion Surviving at End of Interval Probability Density Std. Error of Probability Density Hazard Rate Std. Error of Hazard Rate
0 50 0 50.000 0 .00 1.00 1.00 2.83 .000 .000 .00 .00
20 50 0 50.000 8 .16 .84 .84 2.39 .008 .023 .01 .00
40 42 0 42.000 21 .50 .50 .42 1.20 .021 .060 .03 .01
60 21 4 19.000 8 .42 .58 .24 .70 .009 .025 .03 .01
80 9 6 6.000 0 .00 1.00 .24 .70 .000 .000 .00 .00
100 3 3 1.500 0 .00 1.00 .24 .70 .000 .000 .00 .00
a. The median survival time is 56.19
平均生存时间
生存函数图
生存率为0.42
随着时间的增加,生存率在下降,到第60个月时下降到42%
10.3.1 Kaplan-Meier分析简介
由Kaplan与Meier于1958年提出,又称为乘积极限(PL)估计
一种非参数方法,主要用于小样本分组资料的生存函数估计
模型建立的两个基础
对每一个事件发生的时间 点的条件概率所作的估计
这些概率的范围,然后使用这两方面的信息来估计每一个时间点的生存率
KM分析的数学原理
累积生存函数的估计值
生存函数的 分位点为
10.3.2 Kaplan-Meier分析SPSS操作
Analyze → Survival → Kaplan-Meier
源变量列表框
选择生存时间变量
选择状态变量
选入一个分类变量
选入一个分层变量
选入一个变量来标定观测量
选择新变量的保存
比较因子水平
定义状态变量的事件
选项
设置一个指示事件发生的数值
设置一个指示事件发生的数值区间
设置指示事件发生的值的列表
选择检验的统计方法
选择比较方法
生存率复选框,“sur_”
累计事件复选框,“cul_”
生存率的标准误差复选框,“se_”
危险函数复选框,“haz_”
输出简化生存表
输出生存时间的均值和中位数
输出生存时间的分位数
选择统计量
设置输出图形
线性刻度生成的累积函数
输出(1-累积生存函数)
线性刻度生成的累积危险函数
以对数刻度生成的积累生存函数
10.3.2 Kaplan-Meier分析SPSS操作
观测量汇总表(Case Processing Summary)
温度条件 Total N N of Events Censored
N Percent
80度 50 37 13 26.0%
100度 40 34 6 15.0%
Overall 90 71 19 21.1%
观察个案总数
完全数据个数
截尾数据个数和比例
生存时间的平均数和中位数(Means and Medians for Survival Time)
温度条件 Meana Median
Estimate Std. Error 95% Confidence Interval Estimate Std. Error 95% Confidence Interval
Lower Bound Upper Bound Lower Bound Upper Bound
80度 63.712 3.784 56.296 71.128 55.000 3.536 48.070 61.930
100度 44.781 4.370 36.216 53.346 38.000 2.369 33.357 42.643
Overall 55.620 3.081 49.581 61.660 49.000 1.897 45.281 52.719
a.Estimation is limited to the largest survival time if it is censored
两种温度条件下生存率比较表(Overall Comparisons)
Chi-Square df Sig.
Log Rank (Mantel-Cox) 7.715 1 .005
Breslow (Generalized Wilcoxon) 13.133 1 .000
Tarone-Ware 10.704 1 .001
Test of equality of survival distributions for the different levels of 温度条件.
中位生存时间
平均预期生存时间
统计量
自由度
Sig.值
0.9
14
31
可以认为20度的变化是导致发动机绕组解体的重要因素
10.4.1 COX回归分析
1972年英国统计学家D.R.Cox提出的半参数模型
专门用于生存时间多变量分析的统计方法
对生存时间分布无要求,可估计出各研究因素对风险率的影响,应用范围很广
模型中包含预测变量(协变量)
COX回归分析的数学原理
Cox回归分析的比例危险度模型为
上面的模型暗示有两个假设
危险率函数与独立协变量之间有一个对数线性关系
危险率函数与协变量的对数线性函数之间存在乘积关系
比例危险率模型中“比例”的含义
10.4.2 COX回归分析的操作
Analyze → Survival → Cox Regression
源变量列表框
同Kaplan-Meier窗口介绍
选择分层变量
选入协变量
交互作用项
选择协变量进入回归方程形式
定义分类变量
图形
保存
设置
设置对比方法
协变量列表框
选择生成的图形
选择以什么样的对比变量和协变量的均值来输出函数图形
按变量值将数据分为两个或多个小的分组
输出以线性刻度生成的累积生存函数
输出(1-累积生存函数)
输出以线性刻度生成的累积危险函数
输出(1-对数刻度生成的累积生存函数)
选择所要保存的生存函数和诊断
设置需要显示的模型信息
选择模型统计量
选择逐步分析方法
设置迭代进行的最大次数
10.4.2 COX回归分析的操作
观测量汇总表(Case Processing Summary)
N Percent
Cases available in analysis Eventa 45 90.0%
Censored 5 10.0%
Total 50 100.0%
Cases dropped Cases with missing values 0 .0%
Cases with negative time 0 .0%
Censored cases before the earliest event in a stratum 0 .0%
Total 0 .0%
Total 50 100.0%
a.Dependent Variable:生存时间(月)
完全数据
截尾数据,用于计算危险率
总数据
比例
模型系数综合检验表(Omnibus Tests of Model Coefficientsa,b )
-2 Log Likelihood Overall (score) Change From Previous Step Change From Previous Block
Chi-square df Sig. Chi-square df Sig. Chi-square df Sig.
245.259 33.621 3 .000 31.393 3 .000 31.393 3 .000
a. Beginning Block Number 0
b. Beginning Block Number 1. Method = Enter
引入方程的变量(Variables in the Equation)
B SE Wald df Sig. Exp(B) 95.0% CI for Exp(B)
Lower Upper
x1 .001 .002 .360 1 .548 1.001 .997 1.005
x2 .454 .206 4.846 1 .028 1.574 1.051 2.358
x3 -1.886 .377 25.050 1 .000 .152 .072 .317
根据上表可以得到引入协变量后的回归方程为:
(
)
保护因素
分层变量的作用是显著的
初始的-2对数似然值为276.652,引入变量进行分层后为245.259
Mean
x1 34.504
x2 .600
x3 .500
x1 x2
x2 -.415
x3 .012 -.224
协变量平均值(Covariate Means)
正相关
负相关
协变量平均水平下的生存函数图
30
73.57
生存率一直呈下降趋势;
在第30个月的时候下降到0.1左右,然后保持平稳状态;
到73.57个月时,生存率下降为0.000。
相关系数矩阵(Correlation Matrix of Regression Coefficients)

展开更多......

收起↑

资源预览