Baidu
map

SPSS 10.0高级教程十四:Survival菜单详解(1)

2012-04-12 生物谷 生物谷

对于急性病的疗效考核,一般可以用治愈率、病死率等指标来评价,但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,这时可以对病人进行长期随访,统计一定期限后的生存和死亡情况以判断疗效,这就是生存分析。 生存分析是用于以处理生存时间(survival time)为反应变量、含有删失数据一类资料的统计方法。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的

对于急性病的疗效考核,一般可以用治愈率、病死率等指标来评价,但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,这时可以对病人进行长期随访,统计一定期限后的生存和死亡情况以判断疗效,这就是生存分析。

生存分析是用于以处理生存时间(survival time)为反应变量、含有删失数据一类资料的统计方法。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的病人从发病到死亡或从确诊到死亡所经历的时间。广义地说,“死亡”可定义为某研究目的“结果”的发生,如宫内节育器的失落,疾病的痊愈,女孩月经初潮的到来等(生存分析中往往统指各“死亡”为失效)。此类资料的生存时间变量多不符从正态分布,且常含有删失值,故不适于用传统的数据分析方法如t检验或线性回归进行分析。根据不同的研究目的和资料类型,可采用不同的分析方法,如寿命表、Kaplan-Meier法、Cox回归模型等分析方法进行分析。而这正是下面我将要给大家介绍的主要内容。

“喂,你在这里说的都是些什么呀?又是删失、又是Cox的,搞的我一头雾水。”那位给我提意见了。

列位看官切莫着急,且听在下慢漫道来。

所谓删失值,就是因各种原因对随访对象的随访可能失访或终检(censoring),如研究对象由于其他原因死亡、研究者与病人失去了联系及直到对资料作总结时随访对象还活着但尚未发生所规定的事件。这种数据就叫做删失值,也叫做截尾数据。能处理截尾数据是生存分析的一个优点。

Cox回归是一种多变量的生存分析方法。这是本世纪6070年代发展起来的、应用于生存资料分析的比例分险模型(the proportional hazard model)。1972年,英国统计学家D.R.Cox的研究工作使得比例分险模型的理论和实用性更大地推进了一步。因此许多统计学者就把它称为Cox比例风险或Cox回归。

§13.1  Life Tables过程

Life Tables过程用于:

1、  制作寿命表。

2、  绘制各种曲线如生存函数、风险函数曲线等。

3、  对某一研究因素不同水平的生存时间分布进行比较,控制另一因素后对研究因素不同水平的生存时间分布进行比较,包括从总体上比较和不同水平之间进行两两比较。

例13.1 某临床试验对20名第Ⅲ或第Ⅳ期黑色素瘤患者进行随访研究,截至研究期结束,记录的生存资料见表1。试计算100周生存率。

12.8 15.6 24.0+ 26.4  29.2  30.8+  39.2  42.0  58.4+  72.0+

77.2 82.4 87.2+ 94.4+ 97.2+ 106.0+ 114.8+ 117.2+ 140.0+ 168.0+

注:数据后跟符号“+”表示该数据为删失数据。

[1] [2] [3] 下一页

 

13.1.1     界面说明

1   寿命表主对话框

Time】框

选入生存时间变量。

Display Time Intervals】框

欲输出生存时间范围及组距。

by前面的框内填入生存时间上限,本例填入200(此区间必须包括生存时间的最大值);在by后面的框内填入生存时间的组距,本例填入20,以保证结果列出“100-”的组段。

Status】框

选入生存状态变量,并定义终结事件的标记值。

选入变量“Status”后,Define Event】钮被激活变黑,击该按钮,弹出定义终结事件标记值的对话框(图1)。对二分类变量,一般以死亡、复发、恶化等表示终结事件。本例以死亡为终结事件,其标记值为1,故在Single value 框内填入1。击Continue钮。若生存状态变量取值为一连续型变量,如反应变量为收缩压,则在下面的Range of values 框中输入140 through 400,此处上限输入400是我随便输入的一个上限,目的是为了定义高血压患者,实际上恐怕没有人的血压能达到400,这样才能保证包括所有的高血压病例,具体情况具体分析。

2  定义终结事件标记值的对话框

Factor】框

定义第1层因素,即分组因素。

By Factor】框

定义第2层因素,即分层因素。

Options】选项

Options按钮,弹出选项对话框。(图3)

寿命表选项对话框

   Life Table(s):输出寿命表,系统默认。

Plot:统计图。

       Survival:累积生存函数曲线。

       Hazard:累积风险函数散点图。

       One minus survival:生存函数被1减后的曲线。

       Log survival:对数累积生存函数曲线。

       Density:密度函数散点图。

Compare Levels of First Factor:对第1层因素不同水平的比较,即主对话框(图1)中的factor框中所选入的因素。

            None:不做比较。系统默认。

            Overall:整体比较。

            Pairwise:两两比较。

            本例因没有分组因素,故Compare Levels of First Factor选项均不可选。

13.1.2     结果解释

1、  寿命表

This subfile contains:      20 observations
 Life Table
Survival Variable  TIME      survival time(week)

说明:20例观察单位,生存变量为Time,变量标签为survival time(week)

 

Number

Number

Number

Number

   

Cumul

   

Intrvl

Entrng

Wdrawn

Exposd

Of

Propn

Propn

Propn

Proba-

 

Start

this

During

to

Termnl

Termi-

Sur-

Surv

bility

Hazard

Time

Intrvl

Intrvl

Risk

Events

nating

viving

at End

Densty

Rate

------

------

------

------

------

------

------

------

------

------

.0

20.0

.0

20.0

2.0

.1000

.9000

.9000

.0050

.0053

20.0

18.0

2.0

17.0

3.0

.1765

.8235

.7412

.0079

.0097

40.0

13.0

1.0

12.5

1.0

.0800

.9200

.6819

.0030

.0042

60.0

11.0

1.0

10.5

1.0

.0952

.9048

.6169

.0032

.0050

80.0

9.0

3.0

7.5

1.0

.1333

.8667

.5347

.0041

.0071

100.0

5.0

3.0

3.5

.0

.0000

1.0000

.5347

.0000

.0000

120.0

2.0

.0

2.0

.0

.0000

1.0000

.5347

.0000

.0000

140.0

2.0

1.0

1.5

.0

.0000

1.0000

.5347

.0000

.0000

160.0

1.0

1.0

.5

.0

.0000

1.0000

.5347

.0000

.0000

 The median survival time for these data is 160.00+
         SE of   SE of
 Intrvl  Cumul   Proba-  SE of
 Start   Sur-    bility  Hazard
 Time    viving  Densty   Rate
-------  ------  ------  ------
     .0   .0671   .0034   .0037
   20.0   .0999   .0042   .0056
   40.0   .1081   .0029   .0042
   60.0   .1157   .0031   .0050
   80.0   .1261   .0039   .0071
  100.0   .1261   .0000   .0000
  120.0   .1261   .0000   .0000
  140.0   .1261   .0000   .0000
  160.0   .1261   .0000   .0000
  • Intrvl Start Time:生存时间的组段下限。

  • Number Entrng this Intrvl:进入该组段的观察例数。

  • Number Wdrawn During Intrval:该组段的删失例数。

  • Number Exposed to Risk:暴露于危险因素的例数,即有效观察例数。

  • Number of Termnl Events:终结事件的例数,即死亡例数。

  • Propn Terminating:终结事件比例,即死亡比例。

  • Propn Surviving:生存比例。

  • Cumul Propn Surv at End:至本组段上限的累积生存率。

  • Probability Densty:概率密度。

  • Hazard Rate:风险率。

  • SE of Cumul Surviving:累积生存率的标准误。

  • SE of Probability Densty:概率密度的标准误。

  • SE of Hazard Rate:风险率的标准误。

  • The median survival time for these data is 160.00+:本例的中位生存时间为“160.00+”,从下图的累积生存函数曲线看,曲线与生存率等于0.5的横线不相交,故中位生存时间无法估计。

  • 本例的100周生存率为53.47%。

2、累积生存函数曲线:图4。

4    累积生存函数曲线

§13.2    Kaplan-Meier过程

Kaplan-Meier法用于:

1、估计某研究因素不同水平的中位生存时间。

2、  比较该研究因素不同水平的生存时间有无差异。

3、  控制一分层因素后对研究因素不同水平的生存时间比较(此时将按分层因素的不同水平对研究因素对生存时间的影响分别进行分析)。怎么样,有点拗口吧?

例13.2 3种疗法治疗66例白血病患者的缓解时间(天)

A 疗法

4,5,9,10,11,12,13,28,28,28,29,31,32,37,41,41,57,62,74,100,139,20+,258+,269,

B疗法

8,10,10,12,14,20,48,70,75,99,103,162,169,195,220,161+,199+,217+,245+

C疗法

8,10,11,23,25,28,28,31,31,40,48,89,124,143,12+,159+,190+,196+,197+,205+,219+

注:数据后跟符号“+”表示该数据为删失数据。

上一页  [1] [2] [3] 下一页

 

13.2.1     界面说明

5   Kaplan-Meier法主对话框

Time】框

选入生存时间变量。

Status】框

选入生存状态变量。

Factor】框

选入分组变量。

Strata】框

选入分层变量。

Lables Cases】框

给个体标记。

Compare Factor】选项

Compare Factor按钮,弹出选项对话框。(图6)

6    分组因素水平间比较对话框

l         Test Statistics:检验统计量。

   Log rank:检验生存分布是否相同,各时间点权重一样。

 Breslow:检验生存分布是否相同,以各时间点的观察例数为权重。

 Tarone-Ware:检验生存分布是否相同,以各时间点的观察例数的平方根为权重。

 Linear trend for factor levels:分组因素水平间的线性趋势检验。

      Pooled over strata:水平间的整体比较。系统默认。

      For each stratum:按分层变量,对每一层进行分组因素各水平间的整体比较。

      Pairwise over strata:分组因素各水平间的两两比较。

      Pairwise for each stratum:按分层变量,对每一层进行分组因素各水平间的两两比较。

Save 选项

Save按钮,弹出Save New Variables(保存新变量)对话框(图7)。

7      保存新变量对话框

 Survival:累积生存率估计。

 Standard error of survival:累积生存率估计的标准误。

 Hazard:累积风险函数估计。

 Cumulative events:终结事件的累积频数。在各水平内,按生存时间和生存状态排序。

Options】选项

Options按钮,弹出选项对话框(图8)。

8      K-M法选项对话框

l         Statistics:统计量。

 Survival table(s):生存分析表。

 Mean and median survival:平均生存时间和中位生存时间及其标准误和可信区间。

 Quartiles:生存时间的第25百分位数、中位生存时间、第75百分位数。

l         Plot:统计图。

 Survival:累积生存函数曲线。

 One minus survival:生存函数被1减后的曲线。

 Hazard:累积风险函数散点图。

 Log survival:对数累积生存函数曲线。

操作如下:

1.       Analyze==>Survival ==>Life Tables

2.       Time框:选入remission time

3.       Status框:选入status;击define events钮,在single value框右边的空格中输入1

4.       Factor框:选入group;

5.       Compare factors列表框:

l         Test Statistics:选择Log rank、Breslow、Tarone-Ware

l         Linear trend for factor levels:选Pooled over strata或Pairwise over strata

6.       Option列表框:

l         Statistics: 选Survival table(s)、Mean and median、Survival

l         Plots: 选Survival

单击OK钮

13.2.2 结果说明

1、生存分析表

Survival Analysis for TIME     remission time(days)
对生存时间变量Time进行分析,其变量标签是remission time(days)。
 Factor GROUP = A疗法
  Time       Status     Cumulative     Standard     Cumulative      Number
                         Survival       Error         Events       Remaining
       4     恶化          .9600          .0392              1            24
       5     恶化          .9200          .0543              2            23
       9     恶化          .8800          .0650              3            22
      10     恶化          .8400          .0733              4            21
      11     恶化          .8000          .0800              5            20
      12     恶化          .7600          .0854              6            19
      13     恶化          .7200          .0898              7            18
      20     删失                                            7            17
      23     恶化          .6776          .0940              8            16
      28     恶化                                            9            15
      28     恶化                                           10            14
      28     恶化          .5506          .1010             11            13
      29     恶化          .5082          .1017             12            12
      31     恶化          .4659          .1017             13            11
      32     恶化          .4235          .1009             14            10
      37     恶化          .3812          .0993             15             9
      41     恶化                                           16             8
      41     恶化          .2965          .0936             17             7
      57     恶化          .2541          .0893             18             6
      62     恶化          .2118          .0838             19             5
      74     恶化          .1694          .0770             20             4
     100     恶化          .1271          .0684             21             3
     139     恶化          .0847          .0572             22             2
     258     删失                                           22             1
     269     删失                                           22             0
 Number of Cases:  25        Censored:   3      ( 12.00%)   Events: 22
          Survival Time    Standard Error   95% Confidence Interval
 Mean:           57                  15     (       28,        86 )
 (Limited to      269 )
 Median:         31                   3     (       25,        37 )

说明:

  •  限于篇幅原因,此处仅列出A治疗组的结果。

  • Time:观察时间。

  • Status:生存状态。

  •  Cumulative Survival:累积生存率。

  •  Standard Error: 累积生存率的标准差。

  •  Cumulative Events:累计死亡数。

  •  Number remaining: 组中剩余人数,即在时间Time的暴露人数。

 2、生存时间估计

Survival Analysis for TIME     remission time(days)
Factor GROUP = A疗法
Survival Time    Standard Error   95% Confidence Interval
Mean:           57                  15     (       28,        86 )
 (Limited to      269 )
 Median:         31                   3     (       25,        37 )
Factor GROUP = B疗法
        Survival Time    Standard Error   95% Confidence Interval
 Mean:          112                  20     (       72,       152 )
 (Limited to      245 )
 Median:         99                  24     (       52,       146 )
Factor GROUP = C疗法
          Survival Time    Standard Error   95% Confidence Interval
 Mean:           95                  19     (       58,       132 )
 (Limited to      219 )
 Median:         40                  11     (       18,        62 )
                            Total       Number        Number         Percent
                                        Events       Censored       Censored
  GROUP          A疗法         25           22             3           12.00
  GROUP          B疗法         19           15             4           21.05
  GROUP          C疗法         22           15             7           31.82
Overall                        66           52            14           21.21

说明:

  •  Mean是生存时间的算术均数。

  • Limit to 269表示A疗法组的最长生存时间为219天。

  •   Median为中位生存时间,即生存率为50%所对应的生存时间。A、B、C疗法的中位生存时间分别为31、99、40。

  • A、B、C疗法组中位生存时间的95%可信区间分别为(25,37)、(52,146)、(18,62)。

  • 本文系梅斯医学(MedSci)原创编译整理,转载需授权!-->

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (0)
#插入话题

相关资讯

SPSS 10.0高级教程十:征服一般线性模型(2)

§8.4 多元方差分析 所谓的多元方差分析,就是说存在着不止一个应变量,而是两个以上的应变量共同反映了自变量的影响程度。比如要研究某些因素对儿童生长的影响程度,则身高、体重等都可以作为生长程度的测量因子,即都应作为应变量。 8.4.1 分析步骤 为了方便起见,我们这里直接利用SPSS自带的数据集plastic.sav,假设tear_res、gloss和opacity都使反应橡胶质量的指标(不

SPSS 10.0高级教程十三:分类资料的回归分析(2)

在很久很久以前,地球上还是一个阴森恐怖的黑暗时代,大地上恐龙横行,我们的老祖先--类人猿惊恐的睁大了双眼,围坐在仅剩的火堆旁,担心着无边的黑暗中不知何时会出现的妖魔鬼怪,没有电视可看,没有网可上... 我是疯了,还是在说梦话?都不是,类人猿自然不会有机会和恐龙同时代,只不过是我开机准备写这一部分的时候,心里忽然想到,在10年前,国内的统计学应用上还是卡方检验横行,分层的M-H卡方简直就是超级武器

SPSS 10.0高级教程十三:非参数检验

§12.1  概论 作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些洋统计软件没有提供两两比

SPSS 10.0高级教程九:征服一般线性模型

请注意,本章的标题用了一些修辞手法,一般线性模型可不是用一章就可以说清楚的,因为它包括的内容实在太多了。 那么,究竟我们用到的哪些分析会包含在其中呢?简而言之:凡是和方差分析粘边的都可以用他来做。比如成组设计的方差分析(即单因素方差分析)、配伍设计的方差分析(即两因素方差分析)、交叉设计的方差分析、析因设计的方差分析、重复测量的方差分析、协方差分析等等。因此,能真正掌握GLM菜单的用法,会使大家

SPSS 10.0高级教程十一:相关分析

在医学中经常要遇到分析两个或多个变量间关系的情况,有时是希望了解某个变量对另一个变量的影响强度,有时则是要了解变量间联系的密切程度,前者用下一章将要讲述的回归分析来实现,后者则需要用到本章所要讲述的相关分析实现。 SPSS的相关分析功能被集中在Statistics菜单的Correlate子菜单中,他一般包括以下三个过程: Bivariate过程 此过程用于进行两个/多个变量间的参数/非参

SPSS 10.0高级教程十二:多元线性回归与曲线拟合

回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。 §10.1 Linear过程 10.1.1 简单操作入门 调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(

Baidu
map
Baidu
map
Baidu
map