二、離散程度的測度
離散程度是指數據之間的差異程度或頻數分布的分散程度。離散程度與集中趨勢是兩個同樣重要的數據分布特征。集中趨勢的測度值是對數據一般水平的一個概括性變量,它對一組數據的代表程度,取決于該組數據的離散水平。數據的離散程度越大,集中趨勢的測度值對該組數據的代表性就越差;離散程度越小,其代表性就越好。離散程度的測度,主要包括極差、方差和標準差、離散系數等。
(一)極差
極差是最簡單的變異指標。它就是總體或分布中最大的標志值與最小的標志值之差,又稱全距,用R表示。
R=Xmax—Xmin
在本章上面的例子中,根據連鎖超市10個分店月銷售額的數據,最大值為97萬元,最小值為61萬元,極差=97—61=36(萬元)。
極差反映的是變量分布的變異范圍或離散幅度,在總體中任何兩個單位的標志值之差都不可能超過極差。極差計算簡單,含義直觀,運用方便。但它僅僅取決于兩個極端值的水平,不能反映其間的變量分布情況,同時易受極端值的影響。
(二)標準差和方差
標準差是總體所有單位標志值與其平均數離差之平方的平均數的平方根,用ó表示。標準差的計算公式為:
方差就是標準差的平方,用ó2來表示。方差的計算公式為:
例如,根據表24—1中的數據,計算100個會員企業年銷售額方差和標準差。
計算過程見表24—3。
標準差與方差計算比較簡便,又具有比較好的數學性質,是應用最廣泛的統計離散程度的測度方法。
(三)離散系數
上面介紹的極差、標準差和方差等都是反映數據分散程度的絕對值,其數值的大小一方面取決于原變量值本身水平高低的影響,也就是與變量的算術平均數大小有關,變量值絕對水平高的,離散程度的程度值自然就大,絕對水平小的,離散程度的程度值自然就小;另一方面,它們與原變量值的計量單位相同,采用不同計量單位計量的變量值,其離散程度的測度值也就不同。因此,對于平均水平不同或計量單位不同的不同組別的變量值,是不能用上述離散程度的測度值直接比較其離散程度的。為消除變量值水平高低和計量單位不同對離散程度測度值的影響,需要計算離散系數。
離散系數通常是就標準差來計算的,因此也稱標準差系數,它是一組數據的標準差與其相應的算術平均數之比-.是測度數據離散程度的相對指標,用Vó表示,其計算公式為:
離散系數主要是用于比較對不同組別數據的離散程度。離散系數大的說明數據的離散程度也就大,離散系數小的說明數據的離散程度也就小。
相關文章:
(責任編輯:中大編輯)