至样本最小值,右侧线画至样本最大值,这样每条线段包含了样本25%的数据。Р以上两步得到的图形就是样本数据的水平箱线图,当然箱线图也可以作成竖直的形式。从箱线图上能大概看出样本数据的分布情况。Р2.2 方差分析Р方差分析产生于英国,它是由统计学家R.A.Fisher在20世纪20年代提出的一种统计方法。方差分析是分析试验(或观测)数据的一种统计方法。在工农业生产和科学研究中,经常要分析各种因素之间的交互作用对研究对象某些指标值的影响。在方差分析中,把试验数据的总波动(总变差或总方差)分解为由所考虑因素引起的波动(各因素的变差)和随机因素引起的波动(误差的变差),然后通过分析比较这些变差来推断哪些因素对所考察指标的影响是显著的,哪些是不显著的。也就是分析在诸多因素中哪些因素是主要的,哪些是次要的,以及主要因素处于何种状态时,才能使所考察的指标达到一个较高的水平,这就是方差分析所要解决的问题。Р本文主要对数据中的13个学院学生的身高进行了单因素一元方差分析和非参数方差分析,其中单因素一元方差分析,样本数据应满足方差分析的几个基本假定,即(1)所有样本均来自正态总体(2)这些正态总体具有相同的方差(3)所有观测值相互独立,即独立抽样。在前两个假定基本满足的情况下,一般认为方差分析检验(ANOVA test)是稳健的。Р(1)单因素方差分析的数学模型。设因素有个水平,对应试验指标的个总体,记为,它们的分布为Р (2-1) Р今从这个总体中各自独立地抽取一个样本,取自的样本记为列表如表2-1所示。Р表 2-1 单因素方差分析的样本数据Р组别Р样本Р样本均值Р样本方差Р其中Р (2-2)Р单因素方差分析的数学模型为Р. (2-3)Р其中表示独立同分布。欲检验因素对试验指标有无显著影响,相当于检验Р不全相等. (2-4) Р原假设成立表示因素对试验指标无显著影响。令Р则(2-3)式可改写为