《石大医学统计学讲义03离散趋势.docx》由会员分享,可在线阅读,更多相关《石大医学统计学讲义03离散趋势.docx(4页珍藏版)》请在第壹文秘上搜索。
1、第三讲离散趋势离散程度的描述三组同性别、同年龄儿童的体重(kg)如下,分析其集中趋势与离散趋势。甲组2628303234X.3OkgR=8S=3.16己组2427303336X乙=3OkgR=12S=4.74丙组2629303134X产30kgR=8S=2.91哪一组数值的代表性好?(1)极差(range)一组观察值中,最大值与最小值差,反映个体差异的范围。极差大,说明变异度大,各变量值离均数越远,数据越分散;反之亦然。(2)四分位数(quartile)间距可看成是特定的百分位数,用它说明个体差异比极差稳定。Q=P75-P25一般来说,样本例数越多,四分位间距越稳定。(3)方差(varianc
2、e)与标准差的计算方差:o2=E(-)2N.二Zd)2n-1由上式可知:方差考虑了总体中每个变量值X与总体均数之差(x-),称为离均差平方和(SS),因此方差近似等于离均差平方和的算数均数,故又称为均方差(MS),由于SS利用了每一个观察值的信息,因而反映一批数据的变异程度优于极差和四分位间距。(4)标准差(standarddeviation)方差开方后称为标准差,其单位与变量值单位及均数单位相同,变异度越大,则离均差平方和越大,标准差越大,说明个体差异越大,均数的代表性越差。为了简化计算,标准差的计算公式还可写为:分组资料的计算:*-(A)2M-I如上例:n=110fx2=1584990Ef
3、x=13194(加n-11584990-131942/110Vno-1=4.72cm(5)变异系数(Cofficientofvariation,CV)定义:标准差与算术均数之比,cv=-100%X其描述了相对于算术均数而言标准差的大小,即描述数据的变异相对于其平均水平来说是大还是小。与前面介绍的四种离散程度指标相比,变异系数有以下两个不同之处:1:它描述的不是数据分布的绝对离散程度,而是相对离散程度;2:它不象极差、四分位数间距、方差、标准差那样具有取值单位。这两个特点决定了变异系数的应用也不同于前面四个离散程度指标。它常用于:1、比较度量衡单位不同的多组资料的变异度:例如:某地20岁男子10
4、0人,其身高均数为166.06Cnb标准差为4.95cm;其体重均数为53.72kg,标准差为4.96kg.欲比较身高与体重的变异何者为大,由于度量单位不同,不能比较其标准差而应比较其变异系数身高cv=4,95czw100%=2.98%166.06CTn体重CV=4.9653.72Ag100%=9.23%由此可见,该地20岁男子体重的变异大于身高的变异。2.比较均数相差悬殊的多组资料的变异度:某地不同年龄组男子身高的变异程度年龄组人数均数土标准差变异系数(%)33.5岁10090.13.13.230-35岁100170.25.00.3表中可见,虽然3035岁组的标准差明显大于33.5岁组的标准
5、差,但事实上3035岁组男子身高的变异并不大,而33.5岁组男童身高的变异却很大。这种均数相差悬殊的资料比较变异程度时,应当用变异系数说明其变异情况。小结为了解数值变量的分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资料的分布特征(集中趋势和离散趋势),以及分布类型(对称分布和偏态分布)0一、平均数是描述频数分布集中位置的指标,它代表一组观察值的平均水平,常用平均数的指标下表:平均数意义应用场合均数几何均数中位数平均数量水平平均增(减)倍数位次居中的观察值水平应用甚广,最适用于对称分布,特别是正态分布等比级数资料,对数正态分布偏态分布,分布不明,分布末端无确定值百分位数描述观察序列在某百分位置的水平,是分布的百分界值,可用于医学参考值范围,适用于任何分布。二、描述频数分布离散程度的指标有:1)极差与四分位间距,后者较稳定,但均不能综合反映各观察值的变异程度;2)方差和标准差,最为常用,对正态分布尤为重要;3)变异系数常用于:不同测量单位的几组资料变异度的比较;均数相差悬殊的几组资料变异度的比较。