变异系数,也叫作离散系数,是概率分布离散程度的一个归一化量度。只有在平均值不为零时变异系数才有定义,且变异系数一般适用于平均值大于零的情况。变异系数也被称为标准离差率或单位风险。
当需要比较两组数据离散程度大小的时,如果两组数据的测量尺度相差太大,或者数据量纲的不同,若直接用标准差来衡量会比较不合适,应当消除测量尺度和量纲的影响,变异系数就可以消除这些影响,他是标准差与其平均数的比。CV(标准差与平均数的比值称为变异系数,记为C.V)虽然没有量纲,同时又按照其均数大小进行了标准化,这样就可以进行客观比较了。因此,可以认为变异系数和极差、标准差和方差一样,都是反映数据离散程度的绝对值。其数据大小不仅受变量值离散程度的影响,而且还受变量值平均水平大小的影响。
变异系数越大说明什么?
变异系数越大说明以均数为准变异程度大。变异系数是反应离散趋势的,变异系数越大,反应以均数为准的变异程度大。
变异系数的计算公式
变异系数C·V=(标准偏差SD/平均值Mean)×100%
在进行数据统计分析时,如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除。
变异系数的优点
与标准差相比,变异系数不需要参照数据的平均值。变异系数是一个无量纲量,因此在比较两组量纲不同或均值不同的数据时,应该用变异系数而不是标准差来作为比较的参考。
变异系数的缺点
当平均值接近于0的时候,微小的扰动也会对变异系数产生巨大影响,因此造成精确度不足。变异系数无法发展出类似于均值的置信区间的工具。