SPSS教程第八课:相关分析
2012-04-12 生物谷 生物谷
任何事物的存在都不是孤立的,而是相互联系、相互制约的。在医学领域中,身高与体重、体温与脉搏、年龄与血压等都存在一定的联系。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这个过程就是相关分析。 值得注意,事物之间有相关,不一定是因果关系,也可能仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。 SPS
任何事物的存在都不是孤立的,而是相互联系、相互制约的。在医学领域中,身高与体重、体温与脉搏、年龄与血压等都存在一定的联系。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这个过程就是相关分析。
值得注意,事物之间有相关,不一定是因果关系,也可能仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。
SPSS的相关分析是借助于Statistics(新版为analysis)菜单的Correlate选项完成的。
第一节 Bivariate过程
7.1.1 主要功能
调用此过程可对变量进行相关关系的分析,计算有关的统计指标,以判断变量之间相互关系的密切程度。调用该过程命令时允许同时输入两变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。
7.1.2 实例操作
[例7-1]某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析。
编号 |
发硒 |
血硒 |
1 2 3 4 5 6 7 8 9 10 |
74 66 88 69 91 73 66 96 58 73 |
13 10 13 11 16 9 7 14 5 10 |
7.1.2.1 数据准备
激活数据管理窗口,定义变量名:发硒为X,血硒为Y,按顺序输入相应数值,建立数据库(图7.1)。
7.1.2.2 统计分析
激活Statistics菜单选Correlate中的Bivariate...命令项,弹出Bivariate Correlation对话框(图7.2)。在对话框左侧的变量列表中选x、y,点击Ø钮使之进入Variables框;再在Correlation Coefficients框中选择相关系数的类型,共有三种:Pearson为通常所指的相关系数(r),Kendell’s tau-b为非参数资料的相关系数,Spearman为非正态分布资料的Pearson相关系数替代值,本例选用Pearson项;在Test of Significance框中可选相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,本例选双侧检验。
点击Options...钮弹出Bivariate Correlation:Options对话框(图7.3),可选有关统计项目。本例要求输出X、Y的均数与标准差以及XY交叉乘积的标准差与协方差,故选Means and standard deviations和Cross-product deviations and covariances项,而后点击Continue钮返回Bivariate Correlation对话框,再点击OK钮即可。
7.1.2.3 结果解释:
在结果输出窗口中将看到如下统计数据:变量X、Y的例数、均数与标准差,变量X、Y交叉乘积的例数、标准差与协方差;XY两两对应的相关系数及其双侧检验的概率,本例r = 0.8715,P = 0.001。
Variable Cases Mean Std Dev X 10 75.4000 12.2945 Y 10 10.8000 3.3267 Variables Cases Cross-Prod Dev Variance-Covar X Y 10 320.8000 35.6444 X Y X 1.0000 .8715 ( 10) ( 10) P= . P= .001 Y .8715 1.0000 ( 10) ( 10) P= .001 P= . (Coefficient / (Cases) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed |
第二节 Partial过程
7.2.1 主要功能
调用此过程可对变量进行偏相关分析。在偏相关分析中,系统可按用户的要求对两相关变量之外的某一或某些影响相关的其他变量进行控制,输出控制其他变量影响后的相关系数。
7.2.2 实例操作
[例7-2]某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表, 试对该资料作控制体重影响作用的身高与肺活量相关分析。
编号 |
身高(cm) |
体重(kg) |
肺活量(ml) |
编号 |
身高(cm) |
体重(kg) |
肺活量(ml) |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
135.1 139.9 163.6 146.5 156.2 156.4 167.8 149.7 145.0 148.5 165.5 135.0 153.3 152.0 160.5 |
32.0 30.4 46.2 33.5 37.1 35.5 41.5 31.0 33.0 37.2 49.5 27.6 41.0 32.0 47.2 |
1750 2000 2750 2500 2750 2000 2750 1500 2500 2250 3000 1250 2750 1750 2250 |
16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
153.0 147.6 157.5 155.1 160.5 143.0 149.4 160.8 159.0 158.2 150.0 144.5 154.6 156.5 |
47.2 40.5 43.3 44.7 37.5 31.5 33.9 40.4 38.5 37.5 36.0 34.7 39.5 32.0 |
1750 2000 2250 2750 2000 1750 2250 2750 2500 2000 1750 2250 2500 1750 |
7.2.2.1 数据准备
激活数据管理窗口,定义变量名:身高为height,体重为weight,肺活量为vc,按顺序输入相应数值,建立数据库。
7.2.2.2 统计分析
激活Statistics菜单选Correlate中的Partial...命令项,弹出Partial Correlations对话框(图7.4)。现欲在控制体重的影响下对变量身高与肺活量进行偏相关分析,故在对话框左侧的变量列表中选变量height、vc,点击Ø钮使之进入Variables框,选要控制的变量weight,点击Ø钮使之进入Controlling for框中, 在Test of Significance框中选双侧检验,然后点击OK钮即可。
7.2.2.3 结果解释
在结果输出窗口中将看到如下统计数据:控制体重的影响后,身高与肺活量的相关系数为0.0926,经检验P = 0.639,故身高与肺活量的线性相关不存在。(如果不控制体重的影响,则身高与肺活量的相关系数为0.5884,P为0.001。在有控制的情况下,身高与肺活量的决定系数 = r2 = 0.00857,而无控制的身高与肺活量决定系数 = r2 = 0.34621,可见身高与肺活量的相关有33.764%是由体重协同作用而产生的。)
Controlling for.. WEIGHT HEIGHT VC HEIGHT 1.0000 .0926 ( 0) ( 26) P= . P= .639 VC .0926 1.0000 ( 26) ( 0) P= .639 P= . (Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed |
如果控制变量改为身高,则得如下结果:体重与肺活量的相关系数为0.5528,经检验P = 0.002,故体重与肺活量的线性相关存在。可见,尽管肺活量与身高和体重均有关系,但如果仅仅研究其中一个变量与肺活量的相关关系时,体重的意义会更大。
Controlling for.. HEIGHT VC WEIGHT VC 1.0000 .5528 ( 0) ( 26) P= . P= .002 WEIGHT .5528 1.0000 ( 26) ( 0) P= .002 P= . (Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed |
第三节 Distances过程
7.3.1 主要功能
调用此过程可对变量内部各观察单位间的数值进行距离相关分析,以考察相互间的接近程度;也可对变量间进行距离相关分析,常用于考察预测值对实际值的拟合优度。
7.3.2 实例操作
[例7-3]某医师对10份标准血红蛋白样品作三次平行检测,结果如下,问检测结果是否一致?
样品号 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
第一次 第二次 第三次 |
12.36 12.40 12.18 |
12.14 12.20 12.22 |
12.31 12.28 12.35 |
12.32 12.25
第一章 SPSS的安装与概貌
第一节 SPSS的安装
1.1.1 SPSS简介
SPSS的全称是:Statistical Program for Social S 方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用于:1、均数 统计分析离不开数据,因此数据管理是SPSS的重要组成部分。详细了解SPSS的数据管理方法,将有助于用户提高工作效率。SPSS的数据管理是借助于数据管理窗口和主窗口的File、Data、Transform等菜单完成的。
第一节 数据的输入
2.1.1 变量的定义
先激活数据管理窗口,然后选Data菜单的Define Variable. 上一章介绍了SPSS数据管理窗口的使用方法。在第一章中,我们还提到过SPSS的其他窗口,如结果输出窗口(图3.1)和命令编辑窗口(图3.2),这两个窗口是系统用于接收或输出文本的。用户经常在实际工作中需要对之进行必要的编辑。SPSS的文本编辑是借助于主窗口的File、Edit等菜单完成的,本章介绍SPSS的文本编辑方法。
第一节 文本文件 摘要性分析是对原始数据进行描述性分析,这是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。通过调用摘要性分析的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资料,可完成构成比、率等指标的计算和χ2 检验。本章将介绍其操作方法。
第一节 Frequenci 在正态或近似正态分布的计量资料中(如临床常见的体温、血压、脉搏、身高、体重等测量值,几乎均为此类资料),经常在使用前一章计量资料描述过程分析后,还要进行组与组之间平均水平的比较。本章将分四节分别介绍这一统计方法:即常用的t检验和单因素方差分析。
第一节 Means过程
5.1.1 主要功能
&nbs |