變異系數(shù)(系數(shù) of Variation):當(dāng)需要比較兩組數(shù)據(jù)離散程度大小的時(shí)候,如果兩組數(shù)據(jù)的測(cè)量尺度相差太大,或者數(shù)據(jù)量綱的不同,直接使用標(biāo)準(zhǔn)差來(lái)進(jìn)行比較不合適,此時(shí)就應(yīng)當(dāng)消除測(cè)量尺度和量綱的影響,而變異系數(shù)可以做到這一點(diǎn),它是原始數(shù)據(jù)標(biāo)準(zhǔn)差與原始數(shù)據(jù)平均數(shù)的比。CV沒(méi)有量綱,這樣就可以進(jìn)行客觀比較了。事實(shí)上,可以認(rèn)為變異系數(shù)和極差、標(biāo)準(zhǔn)差和方差一樣,都是反映數(shù)據(jù)離散程度的絕對(duì)值。其數(shù)據(jù)大小不僅受變量值離散程度的影響,而且還受變量值平均水平大小的影響。
定義
在概率論和統(tǒng)計(jì)學(xué)中,變異系數(shù),又稱“離散系數(shù)”(英文:系數(shù) of variation),是概率分布離散程度的一個(gè)歸一化量度,其定義為標(biāo)準(zhǔn)差與平均值之比:
變異系數(shù)(coefficient of variation)只在平均值不為零時(shí)有定義,而且一般適用于平均值大于零的情況。變異系數(shù)也被稱為標(biāo)準(zhǔn)離差率或單位風(fēng)險(xiǎn)。
變異系數(shù)只對(duì)由比率標(biāo)量計(jì)算出來(lái)的數(shù)值有意義。舉例來(lái)說(shuō),對(duì)于一個(gè)氣溫的分布,使用開(kāi)爾文或攝氏度來(lái)計(jì)算的話并不會(huì)改變標(biāo)準(zhǔn)差的值,但是溫度的平均值會(huì)改變,因此使用不同的溫標(biāo)的話得出的變異系數(shù)是不同的。也就是說(shuō),使用區(qū)間標(biāo)量得到的變異系數(shù)是沒(méi)有意義的。
基本含義
一般來(lái)說(shuō),變量值平均水平高,其離散程度的測(cè)度值越大,反之越小。
變異系數(shù)是衡量資料中各觀測(cè)值變異程度的另一個(gè)統(tǒng)計(jì)量。當(dāng)進(jìn)行兩個(gè)或多個(gè)資料變異程度的比較時(shí),如果度量單位與平均數(shù)相同,可以直接利用標(biāo)準(zhǔn)差來(lái)比較。如果單位和(或)平均數(shù)不同時(shí),比較其變異程度就不能采用標(biāo)準(zhǔn)差,而需采用標(biāo)準(zhǔn)差與平均數(shù)的比值(相對(duì)值)來(lái)比較。標(biāo)準(zhǔn)差與平均數(shù)的比值稱為變異系數(shù),記為。變異系數(shù)可以消除單位和(或)平均數(shù)不同對(duì)兩個(gè)或多個(gè)資料變異程度比較的影響。
變異系數(shù)的計(jì)算公式為:
在進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析時(shí),如果變異系數(shù)大于15%,則要考慮該數(shù)據(jù)可能不正常,應(yīng)該剔除。
舉例
已知某良種豬場(chǎng)長(zhǎng)白成年母豬平均體重為190kg,標(biāo)準(zhǔn)差為10.5kg,而大約克成年母豬平均體重為196kg,標(biāo)準(zhǔn)差為8.5kg,試問(wèn)兩個(gè)品種的成年母豬,那一個(gè)體重變異程度大。
此例觀測(cè)值雖然都是體重,單位相同,但它們的平均數(shù)不相同,只能用變異系數(shù)來(lái)比較其變異程度的大小。
由于,長(zhǎng)白成年母豬體重的變異系數(shù):
大約克成年母豬體重的變異系數(shù):
所以,長(zhǎng)白成年母豬體重的變異程度大于大約克成年母豬。
注意,變異系數(shù)的大小,同時(shí)受平均數(shù)和標(biāo)準(zhǔn)差兩個(gè)統(tǒng)計(jì)量的影響,因而在利用變異系數(shù)表示資料的變異程度時(shí),最好將平均數(shù)和標(biāo)準(zhǔn)差也列出。
公式
(標(biāo)準(zhǔn)偏差SD、平均值MN)
優(yōu)缺點(diǎn)
優(yōu)點(diǎn)
比起標(biāo)準(zhǔn)差來(lái),變異系數(shù)的好處是不需要參照數(shù)據(jù)的平均值。變異系數(shù)是一個(gè)無(wú)量綱量,因此在比較兩組量綱不同或均值不同的數(shù)據(jù)時(shí),應(yīng)該用變異系數(shù)而不是標(biāo)準(zhǔn)差來(lái)作為比較的參考。
缺陷
應(yīng)用
變異系數(shù)在概率論的許多分支中都有應(yīng)用,比如說(shuō)在更新理論、排隊(duì)理論和可靠性理論中。在這些理論中,指數(shù)分布通常比正態(tài)分布更為常見(jiàn)。
由于指數(shù)分布的標(biāo)準(zhǔn)差等于其平均值,所以它的變異系數(shù)等于一。變異系數(shù)小于一的分布,比如愛(ài)爾朗分布稱為低差別的,而變異系數(shù)大于一的分布,如超指數(shù)分布則被稱為高差別的。
參考資料 >