行相对比较的。总体离散系数和样本离散系数的计算公式分别为:Р,Р四、分布偏态与峰度的测度Р1.偏态及其测度Р偏态是对分布偏斜方向及程度的测度。测度偏斜的程度需要计算偏态系数(SK),在根据未分组的原始数据计算偏态系数时,通常采用下面的公式:Р根据分组数据计算偏态系数,可采用下面的公式:Р当分布对称时,SK=0;当SK为正值时,表示正离差数值较大,可以判断为正偏或右偏;当SK为负值时,表示负离差数值较大,可以判断为负偏或左偏。SK的数值越大,表示偏斜的程度就越大。Р2.峰度及其测度Р峰度是对数据分布平峰或尖峰程度的测度。在根据未分组数据计算峰态系数时,通常采用下面的公式:Р根据分组数据计算峰态系数是用离差四次方的平均数,再除以标准差的四次方,其计算公式为:Р正态分布的峰度系数为0,当K>0时为尖峰分布,当K<0时为平峰分布。Р五、统计表、统计图与辛普森悖论Р1.统计表Р统计表是显示统计数据的基本工具。它使数据变得一目了然、清晰易懂。充分利用和绘制好统计表是做好统计分析的基本要求。它一般由四个主要部分组成,即表头、行标题、列标题和数字资料,此外,必要时可以在统计表的下方加上表外附加。Р2.统计图Р统计图是统计数据直观的表现形式,可以将复杂的数据用生动的图形表现出来。Р(1)茎叶图Р即将数据分成“茎”和“叶”两部分,利用计算机作图达到直方图分组的目的。通过茎叶图,可以看出数据的分布形状及数据的离散状况。Р茎叶图与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息,而直方图则不能给出原始的数值。Р(2)箱线图Р由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为箱线图。Р3.辛普森悖论Р数据分析中经常会出现局部结论与综合结论不一致、甚至完全矛盾的情况,就是典型的辛普森悖论问题。Р2.2 课后习题详解