第十章 线性回归和逐步回归命令和输出结果说明
2012-04-17 生物谷 生物谷
本 节STATA 命 令 摘 要: regress 因变量 变 量1 变 量2… 变 量m,beta stepwise 因变量 变 量1 变 量2… 变 量m,ba forw st fe(#) fs(#) test 表 达 式 predict&
本 节STATA 命 令 摘 要:
regress 因变量 变 量1 变 量2… 变 量m,beta stepwise 因变量 变 量1 变 量2… 变 量m,ba forw st fe(#) fs(#) test 表 达 式 predict 新变量 predict 新 变 量,resi predict 新 变 量,stdp predict 新 变 量,stdr |
regress 命 令 表 示 作 线 性 回 归, 其 子 命 令 beta 表 示 得 到 的 回 归 系 数 为 标 化 的 回 归 系 数( 即: 无 量 纲)。stepwise 命 令 表 示 作 逐 步 线 性 回 归, 其 子 命 令:ba 表 示 后 退 法 筛 选 自 变 量;form 表 示 向 前 法 筛 选 自 变 量;st 表 示 前 进 后 退 法 筛 选 变 量;fe(#) 表 示 在 筛 选 变 量 中, 变 量 选 入 模 型 的 F 统 计 量 的 临 界 值(#), 在STATA 中, 其 缺 省 值 为 0.5, 最 大 设 置 值 不 要 大 于 4;fs(#) 表 示 在 筛 选 变 量 中, 变 量 从 模 型 中 剔 除 的 F 统 计 量 的 临 界 值(#), 在STATA 中, 其 缺 省 值 为 0.1,最 大 设 置 值 不 要 大 于 4。test 用 于 检 验 回 归 系 数 的 表 达 式, 如: 某 两 个 回 归 系 数 是 否 相 等。 predict 新 变 量 是 根 据 线 性 回 归 方 程 计 算 每 个 自 变 量 记 录 所 对 应 的 y 值( 一 些 文 献 上 称 预 测 值 和 期 望 估 计 值)。predict 新 变 量,resi 计 算 残 差 值。predict 新 变 量,stdp
是 计 算 因 变 量 y 的 总 体 均 数 估 计 的 标 准 误( 不 同 的 自 变 量 值, 该 标 准 误 也 不 同)。predict 新 变 量,stdr 是 计 算 因 变 量 y 的 预 测 值 的 标 准 误。
例: 对 15 名 对 象 的 血 浆 粘 度(Y) 及 其 3 个 血 浆 成 分: 白 蛋 白(x1), 球 蛋 白(x2) 和 纤 维 蛋 白 原(x3) 进 行 测 定, 试 建 立 多 元 线 性 回 归 方 程。 其 数 据 如 下 表( 数 据 摘 自 医 用 多 元 统 计 分 析, 曹 素 华 主 编):
编 号 |
y |
x1 |
x2 |
x3 |
1 |
1.73 |
4500 |
1500 |
1000 |
2 |
1.47 |
4200 |
1400 |
360 |
3 |
1.50 |
2700 |
1900 |
280 |
4 |
1.47 |
5200 |
1000 |
156 |
5 |
1.46 |
3700 |
2300 |
207 |
6 |
1.56 |
4200 |
1770 |
355 |
7 |
1.49 |
1700 |
2100 |
578 |
8 |
1.40 |
4650 |
950 |
231 |
9 |
1.46 |
5900 |
1550 |
416 |
10 |
1.38 |
3840 |
1410 |
391 |
11 |
1.66 |
3800 |
2650 |
515 |
12 |
1.57 |
5300 |
1900 |
435 |
13 |
1.90 |
4090 |
1820 |
357 |
14 |
1.20 |
3500 |
1700 |
300 |
15 |
2.20 |
3000 |
1790 |
820 |
regress y x1 x2 x3
① ② ③ Source | SS df MS Number of obs = 15 -----------+------------------------------ ④ F( 3, 11) = 2.39 ⑤ Model | .314572294 3 .104857431 ⑦ Prob > F = 0.1239 ⑥ Residual | .481761032 11 .043796457 ⑧ R-squared = 0.3950 -------- -+------------------------------ ⑨ Adj R-squared = 0.2300 Total | .796333326 14 .056880952 Root MSE = .20928 --------------------------------------------------------------------------------------------- y | Coef. Std. Err. t P>|t| [95% Conf. Interval] ----------+---------------------------------------------------------------------------------- x1 | 9.57e-06 .0000596 0.161 0.875 -.0001217 .0001408 x2 | .0000724 .0001414 0.512 0.619 -.0002389 .0003837 x3 | .0006278 .0002514 2.497 0.030 .0000745 .0011811 _cons | 1.132732 .4274603 2.650 0.023 .1918985 2.073566 ----------------------------------------------------------------------------------------------- |
① 离 均 差 平 方 和;② 自 由 度;③ 均 方 差; ④ 模 型 回 归 系 数 全 为 0 的 无 效 假 设 检 验 对 应 的 F 值;⑦ 为 F 检 验 相 应 的 p 值; ⑤ 为 回 归 项: 对 应 为 回 归 平 方 和 和 回 归 均 方 差;⑥ 残 差 项, 对 应 为 残 差 平 方 和、 残 差 自 由 度 和 残 差 均 方 和;⑧ 为 决 定 系 数;⑨ 为 调 整 自 由 度 后 的 决 定 系 数; 为 残 差 均 方 和 的 根 号; 回 归 系 数; 回 归 系 数 的 标 准 误; 回 归 系 数 检 验 的 t 值; 回 归 系 数 检 验 相 应 的 p 值; 回 归 系 数 的 95% 可 信 限。
线 性 回 归 模 型 假 定 残 差 呈 正 态 分 布 其 齐 性, 独 立 于 所 有 回 归 自 变 量, 因 此 应 对 残 差 作 正 态 性 检 验 和 残 差 分 析, 由 于 这 部 分 内 容 已 超 出 了 本 教 材 的 范 围, 所 以 不 在 此 处 详 细 介 绍。 以 本 例 数 据 介 绍 逐 步 线 性 回 归 分 析, 设 筛 选 变 量 进 入 模 型 的 F 值 等 于 变 量 从 模 型 中 剔 除 的 F 值, 并 均 为 1.5, 其 输 出 内 容 对 应 相 同:
stepwise y x1 x2 x3, fe(1.5) fs(1.5)
Dropping: x1 F= 0.02577 ① Dropping: x2 F= 0.26297 (stepwise) Source | SS df MS Number of obs = 15 -----------+---------------------------------------- F( 1, 13) = 7.98 Model | .302861381 1 .302861381 Prob > F = 0.0143 Residual | .493471945 13 .03795938 R-squared = 0.3803 -----------+---------------------------------------- Adj R-squared = 0.3327 Total | .796333326 14 .056880952 Root MSE = .19483 ----------------------------------------------------------------------------------------------- y | Coef. Std. Err. t P>|t| [95% Conf. Interval] ----------+------------------------------------------------------------------------------------ x3 | .0006453 .0002284 2.825 0.014 .0001517 .0011388 _cons | 1.287974 .1096994 11.741 0.000 1.050982 1.524965 ------------------------------------------------------------------------------------------------ |
① 为 在 筛 选 变 量 中 剔 除 x1 的 F 检 验 值。
predict yhat 计 算 因 变 量 预 测 值 yhat
predict e, resi 计 算 残 差 e
predict ymuse, stdp 计 算 因 变 量 总 体 估 计 的 标 准 误
predict yhatse, stdr 计 算 因 变 量 预 测 值 的 标 准 误
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#线性回归#
74