SPSS教程第十课:对数线性模型
2012-04-12 生物谷 生物谷
对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对于列联表资料,通常作χ2 检验,但χ2 检验无法系统地评价变量间的联系,也无法估计变量间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。 第一节 General过程 9.1.1 主要功能  
对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对于列联表资料,通常作χ2 检验,但χ2 检验无法系统地评价变量间的联系,也无法估计变量间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。
第一节 General过程
9.1.1 主要功能
调用该过程可对一个或多个二维列联表资料进行非层次对数线性分析。它只能拟合全饱和模型,即分类变量各自效应及其相互间效应均包含在对数线性模型中。
9.1.2 实例操作
[例9-1]在住院病人中,研究其受教育程度与对保健服务满意程度的关系,资料整理成列联表后如下所示。
对保健服务满意程度 (%) |
受教育程度 | ||
高 |
中 |
低 | |
满意 不满意 |
65 (91.5) 6 (8.5) |
272 (93.8) 18 (6.2) |
41 (97.6) 1 (2.4) |
按一般情形作χ2检验,结果显示不同受教育程度的住院病人其对保健服务满意程度无差别。但从百分比分析中可见,随受教育程度的提高,满意程度有下降的趋势;且我们还想了解受教育程度与满意程度有无交互作用和交互作用的大小。对此,必须采用对数线性模型加以分析。
9.1.2.1 数据准备
激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,受教育程度和满意程度作为行、列分类变量(即独立变量),变量名分别为educ、care。输入原始数据,结果如图9.1所示。如同第四章Crosstab过程中所述,为使列联表的频数有效,应选Data菜单的Weight Cases...项,弹出Weight Cases对话框(图9.2),激活Weight cases by项,从变量列表中选freq点击Ø钮使之进入Frequency Variable框,点击OK钮即可。
图9.1 原始数据的输入
图9.2 频数的加权定义
9.1.2.2 统计分析
激活Statistics菜单选Loglinear中的General...项,弹出General Loglinear Analysis对话框(图9.3)。从对话框左侧的变量列表中选care,点击Ø钮使之进入Factor(s)框,点击Define Range...钮,弹出General Loglinear Analysis: Define Range对话框,定义分类变量care的范围,本例为1、2,故可在Minimum处键入1,在Maximum处键入2,点击Continue钮返回General Loglinear Analysis对话框。同法将变量educ选入Factor(s)框,并定义其范围为1、3。本例要求计算各分类变量主效应和交互作用的参数估计,故点击Contrast...钮,弹出General Loglinear Analysis:Contrasts对话框,选择Display parameter estimates项,点击Continue钮返回General Loglinear Analysis对话框,最后点击OK钮即完成分析。
图9.3 非层次对数线性模型分析对话框
9.1.2.3 结果解释
在结果输出窗口中将看到如下统计数据:
首先显示系统对403例资料进行分析,共有二个分类变量:CARE为2水平,EDUC为3水平。分析的效应有三类:满意程度(CARE)、教育程度(EDUC)和两者的交互作用(CARE BY EDUC)。系统经2次叠代后即达到相邻二次估计之差不大于规定的0.001。
DATA Information 6 unweighted cases accepted. 0 cases rejected because of out-of-range factor values. 0 cases rejected because of missing data. 403 weighted cases will be used in the analysis. FACTOR Information Factor Level Label CARE 2 EDUC 3 DESIGN Information 1 Design/Model will be processed. Correspondence Between Effects and Columns of Design/Model 1 Starting Ending Column Column Effect Name 1 1 CARE 2 3 EDUC 4 5 CARE BY EDUC Note: for saturated models .500 has been added to all observed cells. This value may be changed by using the CRITERIA = DELTA subcommand. *** ML converged at iteration 2. Maximum difference between successive iterations = .00000 |
由于本例对Model(模型)未作定义,故系统采用默认的全饱和模型,因而期望例数(EXP.count)与实际例数(OBS. count)相同,进而残差(Residual)、标准化残差(Std.Resid)和校正残差(Adj.Resid)均为0。
Observed, Expected Frequencies and Residuals Factor Code OBS. count & PCT. EXP. count & PCT. Residual Std. Resid. Adj. Resid. CARE 1 EDUC 1 65.50 (16.13) 65.50 (16.13) .0000 .0000 .0000 EDUC 2 272.50 (67.12) 272.50 (67.12) .0000 .0000 .0000 EDUC 3 41.50 (10.22) 41.50 (10.22) .0000 .0000 .0000 CARE 2 EDUC 1 6.50 ( 1.60) 6.50 ( 1.60) .0000 .0000 .0000 EDUC 2 18.50 ( 4.56) 18.50 ( 4.56) .0000 .0000 .0000 EDUC 3 1.50 ( .37) 1.50 ( .37) .0000 .0000 .0000 |
最后输出参数估计的结果。为了唯一地估计参数,系统强行限定同一分类变量的各水平参数之和为0,故根据下列结果可推得各参数为:
λ满意 = 1.386724028
λ不满意 = -1.386724028
λ高教育程度 = -0.091477207
λ中教育程度 = 1.144301306
λ低教育程度 = -1.052824099
λ满意.高教育程度 = -0.231600045
λ满意.中高教育程度 = -0.041790087
λ满意.低教育程度 = 0.273390132
λ不满意.高教育程度 = 0.231600045
λ不满意.中教育程度 = 0.041790087
λ不满意.低教育程度 = -0.273390132
λ值为正,表示正效应;反之为负效应;零为无效应。分析提供的信息是:①对保健服务的满意程度高于不满意程度;②中等教育程度者的满意程度>高等教育程度者的满意程度>低等教育程度者的满意程度;③通过受教育程度与对保健服务满意程度的交互作用研究,结果表明高、中等教育未能增加人们对现有保健服务状况的满意程度。
Estimates for Parameters CARE Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 1 1.386724028 .15965 8.68589 1.07381 1.69964 EDUC Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 2 -.091477207 .19895 -.45980 -.48142 .29847 3 1.144301306 .17407 6.57393 .80313 1.48547 CARE BY EDUC Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 4 -.231600045 .19895 -1.16410 -.62154 .15834 5 -.041790087 .17407 -.24008 -.38296 .29938 |
第二节 Hierarchical过程
9.2.1 主要功能
调用该过程可对多维列联表资料进行分层对数线性分析。所谓分层即并可根据用户指定的条件,对某一或某些主效应与交互作用进行剔除,从而形成包含特定层次阶项的各种模型。
9.2.2 实例操作
[例9-2] 为了研究Colles骨折在不同性别中的年龄分布情况,以说明不同性别者骨折的年龄差异及其年度变化,某地收集了1978--1981年的骨折资料,数据见下表。请作对数线性模型的分析。
年龄 |
1978 |
1979 |
1980 |
1981 | ||||
男 |
女 |
男 |
女 |
男 |
女 |
男 |
女 | |
0—19 20--59 60--89 |
55 165 50 |
17 260 94 |
43 101 29 |
9 233 115 |
89 104 56 |
20 202 95 |
140 137 54 |
41 278 153 |
9.2.2.1 数据准备
激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,年份、性别和年龄为分类变量,变量名分别为year、sex和age。输入原始数据,其中年份1978至1981依次为1、2、3、4,性别男为1、女为2,年龄分组依次为1、2、3。之后选Data菜单的Weight Cases...项,在Weight Cases对话框中激活Weight cases by项,从变量列表中选freq点击Ø钮使之进入Frequency Variable框,点击OK钮完成对频数的权重定义。
9.2.2.2 统计分析
激活Statistics菜单选Loglinear中的Hierarchical...项,弹出Hierarchical Loglinear Analysis对话框(图9.4)。从对话框左侧的变量列表中选age,点击Ø钮使之进入Factor(s)框,点击Define Range...钮,弹出Hierarchical Loglinear Analysis: Define Range对话框,定义分类变量age的范围,在Minimum处键入1,在Maximum处键入9,点击Continue钮返回Hierarchical Loglinear Analysis对话框。同法将变量sex选入Factor(s)框,定义其范围为1、2
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言