Baidu
map

第十章 非参数检验

2012-04-17 生物谷 不详

第十章 非参数检验     非参数统计是统计分析的重要组成部分。可是与之很不相称的是它的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。在SAS中,非参数统计主要由UNIVARIATE过程、MEANS过程和NPAR1WAY过程来实现,前两者在前面的章节中已经介绍,它们可以进行配对设计差值的符号秩和检验(WILCOXON配对法);后者是一个单因素的非参数方差分析过程,可进

第十章 非参数检验

 

 

非参数统计是统计分析的重要组成部分。可是与之很不相称的是它的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。在SAS中,非参数统计主要由UNIVARIATE过程、MEANS过程和NPAR1WAY过程来实现,前两者在前面的章节中已经介绍,它们可以进行配对设计差值的符号秩和检验(WILCOXON配对法);后者是一个单因素的非参数方差分析过程,可进行成组设计的两样本(WILCOXON法)或多样本比较(KRUSKAL-WALLIS法)的秩和检验。本章将主要介绍NPAR1WAY过程。

由于在理论上还有争议,作为权威性的统计软件,SAS不提供非参检验两两比较的方法。据我所知,其余统计软件里也只有PEMS提供这一功能(因为她是医统·医百的配套软件,而非参两两比较是写入了该书的)。如果你需要这一结果,那么恐怕只有手算了。

9.0.1 语法格式

PROC NPAR1WAY [DATA=<数据集名> [选项] ] ;
 CLASS <处理因素变量名>;

  必需,指定要分析的处理因素

 EXACT <关键字>; 

要求程序在必要时计算确切概率

 OUTPUT <选项>; 

指定统计结果的输出数据集

 VAR <结果变量名>; 

指定要分析的应变量

 BY <变量名列>;

  统计按指定的变量分组进行

NPAR1WAY过程不能处理按频数输入的资料。这意味着如果你的数据是以频数方式输入的,那么除非你将资料想办法转换成按例记录的资料,否则SAS无法处理。

有的同学将“NPAR1WAY”打成了“NPARLWAY”,可以这样来记:“NPAR”即“非参”的英文缩写,“WAY”是维数,更明确的说是因素的意思,而“1WAY”就代表一个因素,合起来“NPAR1WAY”说的是“单因素的非参数检验”。怎么样,明白这个过程在做什么了吧!

9.0.2 语法说明

【过程选项】

NPAR1WAY过程常用的选项有:

  • MISSING 将缺失值也用于统计分析
  • ANOVA 同时进行方差分析
  • MEDIAN 要求进行中位数检验
  • NOPRINT 禁止统计结果在OUTPUT视窗内输出
  • SAVAGE 要求对样本进行SAVAGE得分分析
  • WILCOXON 要求进行WILCOXON秩和检验

我们常用的秩和检验就是WILCOXON秩和检验,对于其它方法,有兴趣的读者可参阅有关统计书籍。

9.0.3 结果解释

在省略所有选项的情况下,SAS系统默认输出所有的统计结果,这恰恰说明了非参数检验方法的不完善。如果你无法判断用那个结果,那么只看Wilcoxon秩和检验的分析结果就够了。这里我们给出《卫生统计学》第三版91页例9.2的运算结果,其OUTPUT视窗输出如下:

下面的输出结果中反复出现了Z检验及相应的统计量Z,实际上Z检验就是我们非常熟悉的u检验,只不过是国内外的叫法不同罢了。

                    N P A R 1 W A Y  P R O C E D U R E
----------------------------以下为方差分析的检验结果-------------------------
                       Analysis of Variance for Variable  应变量名
                             Classified by Variable   分组变量名
    分组变量名        N          Mean               Among MS      Within MS
                   样本量        均数                组间MS         组内MS
                                                  1413.87273       258.270000
       1             10       23.6000000
       2             12        7.5000000            F Value        Prob > F
                                                      F值             p值
                                                    5.474           0.0298
                    Average Scores Were Used for Ties
-------------------------以下为Wilcoxon秩和检验的分析结果-------------------------
                     Wilcoxon Scores (Rank Sums) for Variable 应变量名
                            Classified by Variable 分组变量名
                              Sum of       Expected      Std Dev           Mean
       分组变量名     N        Scores       Under H0      Under H0          Score
                    样本量   各组的秩和   各组的期望秩和   秩和的标准差    各组的平均秩次
       1             10        170.0         115.0       15.1529004     17.0000000
       2             12         83.0         138.0       15.1529004      6.9166667
                       Average Scores Were Used for Ties
                Wilcoxon 2-Sample Test (Normal Approximation)
                     (with Continuity Correction of .5)
             S =  170.000         Z =  3.59667         Prob > |Z| = 0.0003
                 如果按照正态近似法做秩和检验,则Z=3.59667,p=0.0003。
             T-Test Approx. Significance = 0.0017
                            做近似t检验则p=0.0017
             Kruskal-Wallis Test (Chi-Square Approximation)
             CHISQ =  13.174         DF =  1         Prob > CHISQ = 0.0003
                      用 近似做K-W法秩和检验,则 =13.174,p=0.0003。
------------------------以下为中位数检验的分析结果----------------------------
                  Median Scores (Number of Points Above Median)
                              for Variable 应变量名
                         Classified by Variable 分组变量名
                       Sum of         Expected          Std Dev            Mean
  分组变量名    N       Scores         Under H0         Under H0            Score
             样本量 各组的中位秩次和 各组期望中位秩次和 中位秩次的标准差 各组平均中位秩次
  1            10       9.0              5.0          1.19522861      0.900000000
  2            12       2.0              6.0          1.19522861      0.166666667
                      Average Scores Were Used for Ties
            Median 2-Sample Test (Normal Approximation)
            S =  9.00000         Z =  3.34664         Prob > |Z| = 0.0008
                  用正态近似法做中位数检验,则Z=3.34664,p=0.0008。
            Median 1-Way Analysis (Chi-Square Approximation)
            CHISQ =  11.200         DF =  1         Prob > CHISQ = 0.0008
                  用c2近似法做中位数检验,则c2=11.200,p=0.0008。
-------------------------以下为Van der Waerden比分检验的结果-------------------------
                Van der Waerden Scores (Normal) for Variable  应变量名
                        Classified by Variable  分组变量名
                     Sum of         Expected         Std Dev             Mean
 分组变量名     N     Scores         Under H0         Under H0            Score
             样本量 各组的比分和   各组的期望比分和     比分和的标准差   各组的平均比分
    1          10   7.34869734        0.0             2.09589648      0.734869734
    2          12  -7.34869734        0.0             2.09589648      -.612391445
                        Average Scores Were Used for Ties
            Van der Waerden 2-Sample Test (Normal Approximation)
            S =  7.34870         Z =  3.50623         Prob > |Z| = 0.0005
              用正态近似法做Van der Waerden检验,则Z=3.50623,p=0.0005。
            Van der Waerden 1-Way Analysis (Chi-Square Approximation)
            CHISQ =  12.294         DF =  1         Prob > CHISQ = 0.0005
               用c2近似法做Van der Waerden检验,则 =12.294,p=0.0005。
----------------------以下为Savage比分检验的结果-------------------------
                     Savage Scores (Exponential) for Variable  应变量名
                               Classified by Variable  分组变量名
                       Sum of        Expected        Std Dev           Mean
 分组变量名  N          Scores        Under H0       Under H0          Score
          样本量     各组的比分和   各组的期望比分和 比分和的标准差    各组的平均比分
     1      10       7.14463489         0.0        2.17965946      0.714463489
     2      12      -7.14463489         0.0        2.17965946      -.595386241
                       Average Scores Were Used for Ties
            Savage 2-Sample Test (Normal Approximation)
            S =  7.14463         Z =  3.27787         Prob > |Z| = 0.0010
                 用正态近似法做Savage检验,则Z=3.27787,p=0.0010。
            Savage 1-Way Analysis (Chi-Square Approximation)
            CHISQ =  10.744         DF =  1         Prob > CHISQ = 0.0010
                     用c2近似法做Savage检验,则c2=10.744,p=0.0010。
------------------以下为Kolmogorov-Smirnov检验的结果----------------------
                     Kolmogorov-Smirnov Test for Variable  应变量名
                           Classified by Variable  分组变量名
                                                              Deviation
                                         EDF                  from Mean
       分组变量名       N              at Maximum             at Maximum
          1            10              0.20000000             -1.37990298
          2            12              1.00000000              1.25967331
                      ----             -----------
                       22              0.63636364
                   Maximum Deviation Occurred at Observation   22
                   Value of DAY at Maximum  13.0000000
             Kolmogorov-Smirnov 2-Sample Test (Asymptotic)
                KS = 0.398344          D = 0.800000
                KSa =  1.86840          Prob > KSa = 0.0019
            Kolmogorov-Smirnov检验的最后结果为统计量Ksa=1.86840,p=0.0019。
------------------以下为Cramer-von Mises检验的结果------------------------
                  Cramer-von Mises Test for Variable  应变量名
                         Classified by Variable  分组变量名
                                                   Summed
                                                   Deviation
           分组变量名             N                 from Mean
                1                10               0.775807663
                2                12               0.646506386
                     Cramer-von Mises Statistic (Asymptotic)
                      CM = 0.064651          CMa =  1.42231
                  Cramer-von Mises统计量CM=0.064651,CMa=1.42231。
----------------------------以下为Kuiper检验的结果----------------------------
                        Kuiper Test for Variable 应变量名
                         Classified by Variable 分组变量名
                                                    Deviation
                GROUP             N                 from Mean
                1                 10               0.000000000
                2                 12               0.800000000
                Kuiper 2-Sample Test (Asymptotic)
                K = 0.800000          Ka =  1.86840          Prob > Ka = 0.0241
                     Kuiper检验的最后结果为统计量Ka=1.86840,p=0.0241。

9.0.4 应用实例

9.1 测得铅作业与非铅作业工人的血铅值(),问两组工人的血铅值有无差别(卫统p233 4.3题)?

铅作业组 0.82 0.87 0.97 1.21 1.64 2.08 2.13

非铅作业组 0.24 0.24 0.29 0.33 0.44 0.58 0.63 0.72 0.87 1.01

解:程序如下:

data a.wt4_3;

 group=1;

 if _n_>7 then group=2;

 input value@@;

 cards;

 0.82 0.87 0.97 1.21 1.64 2.08 2.13

 0.24 0.24 0.29 0.33 0.44 0.58 0.63

 0.72 0.87 1.01

;

proc gchart;

分组做条图,观察数据的分布

 vbar value / group=group;

proc npar1way data=a.wt4_3 WILCOXON ;

 class group;

 var value;

run;

9.2 现测量了三组人的血浆总皮质醇,试检验这三组人有无差别(卫统p234 4.6题)。

解:程序如下:

data a.wt4_6;

 do group=1 to 3;

  do tempvar=1 to 10;

   input value @@;

   output;

  end;

 end;

 drop tempvar;

 cards;

 0.11 0.52 ...

 0.17 0.33 ...

 ... 5.96 6.62

;

proc npar1way data=a.wt4_6 WILCOXON;

 class group;

 var value;

run;

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2075710, encodeId=0fcf20e5710d4, content=<a href='/topic/show?id=27dd993421f' target=_blank style='color:#2F92EE;'>#非参数#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=71, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=99342, encryptionId=27dd993421f, topicName=非参数)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=af68384, createdName=hanhaisha2008, createdTime=Wed Jan 16 08:14:00 CST 2013, time=2013-01-16, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=2045918, encodeId=fd6d204591888, content=<a href='/topic/show?id=7e8e99343d4' target=_blank style='color:#2F92EE;'>#非参数检验#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=95, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=99343, encryptionId=7e8e99343d4, topicName=非参数检验)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=2ba9118, createdName=makuansheng, createdTime=Tue Dec 11 11:14:00 CST 2012, time=2012-12-11, status=1, ipAttribution=)]
  2. [GetPortalCommentsPageByObjectIdResponse(id=2075710, encodeId=0fcf20e5710d4, content=<a href='/topic/show?id=27dd993421f' target=_blank style='color:#2F92EE;'>#非参数#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=71, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=99342, encryptionId=27dd993421f, topicName=非参数)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=af68384, createdName=hanhaisha2008, createdTime=Wed Jan 16 08:14:00 CST 2013, time=2013-01-16, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=2045918, encodeId=fd6d204591888, content=<a href='/topic/show?id=7e8e99343d4' target=_blank style='color:#2F92EE;'>#非参数检验#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=95, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=99343, encryptionId=7e8e99343d4, topicName=非参数检验)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=2ba9118, createdName=makuansheng, createdTime=Tue Dec 11 11:14:00 CST 2012, time=2012-12-11, status=1, ipAttribution=)]

相关资讯

第五章 定量资料的统计描述和t、u检验

第五章 定量资料的统计描述和t、u检验   从本章开始,我们将正式开始使用SAS解决我们的统计问题。从前面的几章可知,SAS的主要功能是由不同的程序步来体现的。因此在以后的各章中,我们将对每种问题重点介绍一些常用的程序步,以及它们的输出结果的解释。 对于定量资料的统计描述和简单推断,SAS提供了三个强有力的程序步,它们是: UNIVARIATE过程 提供单个变量的详细描述和对其分布类

第九章 直线回归、直线相关与logistic回归(下)

第九章 直线回归、直线相关与logistic回归(下) §8.4  多元线性回归 REG过程不仅可以完成只有一个自变量的简单直线回归,还可以作含有多个自变量的多元线性回归。作多元线性回归时REG过程的语法格式与简单直线回归的语法几乎完全相同,只要把要分析的多个自变量名放在MODEL语句中应变量后即可。因为多元线性回归时一般要作自变量的筛选,涉及到MODEL语句的选项,现将多元线性回

第六章 分类资料的统计描述与简单推断

第六章 分类资料的统计描述与简单推断   在SAS/STAT模块中FREQ、TABULATE和SUMMARY等过程可用于分类资料的统计描述,其中FREQ过程兼具统计描述和统计推断的功能,对分类变量计算频数分布,产生从一维到n维的频数表和列联表;对于二维表,可进行c2检验,对于三维表,可作Mentel-Hanszel分层分析。FREQ过程是SAS用于分析分类资料的一个常用过程。本章将向大家介绍F

第八章 直线回归、直线相关与logistic回归(上)

第八章 直线回归、直线相关与logistic回归(上)   直线回归与相关是联系非常紧密的两种统计分析方法,事实上SAS用于回归分析的程序步REG也可提供相关分析的结果,但进一步的深入分析仍应采用相应的程序步--CORR才能实现。本章前三节主要介绍两个常用的用于直线回归和相关分析的程序步――REG过程和CORR过程。后两节则介绍多元线性回归和Logistic回归的方法和所用的过程。 §8.1

第四章 统计图

第四章 统计图   统计图是统计描述的重要工具,它可以直观的反映出事物间的数量关系。因此,许多统计软件均提供了强大的统计做图功能。SAS的许多程序步,如Univariate过程等,也附有相应的绘图功能,这些我们拟在相关章节中讲述。本章将向大家介绍两个专门用于绘图的程序步――GCHART过程和GPLOT过程。前者用于绘制各种常用的统计图,而后者则用于绘制散点图。 在早期的DOS版本中,SAS只

第七章 方差分析和协方差分析

第七章 方差分析和协方差分析 方差分析和协方差分析在SAS系统中由SAS/STAT模块来完成,其中我们常用的有ANOVA过程和GLM过程。前者运算速度较快,但功能较为有限;后者运算速度较慢,但功能强大,我们做协方差分析时就要用到GLM过程。本章将首先介绍方差分析所用数据集的建立技巧,然后重点介绍这两个程序步。 其实,这里的速度快慢只是相对而言,SAS的处理速度是首屈一指的。举个例子,这个暑假我

Baidu
map
Baidu
map
Baidu
map