四分位數(shù)(Quartile)應(yīng)用于統(tǒng)計(jì)學(xué)中的箱形圖繪制,是統(tǒng)計(jì)學(xué)中分位數(shù)的一種,即把所有數(shù)值由小到大排列并分成四等份,處于三個(gè)分割點(diǎn)位置的數(shù)值就是四分位數(shù)。第三四分位數(shù)與第一四分位數(shù)的差距又稱四分位距(InterQuartile Range,IQR)。對(duì)于四分位數(shù)的確定,有不同的方法,另外一種方法基于N-1 基礎(chǔ)。Excel 中有兩個(gè)四分位數(shù)的函數(shù)。以上引文中,w代表分位數(shù)位置,y代表位置的整數(shù)部分,z代表位置的分?jǐn)?shù)部分。
概念
第一四分位數(shù) (Q1),又稱“下四分位數(shù)”或“較小四分位數(shù)”,位于有序數(shù)據(jù)前25%位置的分位數(shù),即數(shù)據(jù)的第25百分位數(shù)。它將數(shù)據(jù)分成前25%和后75%兩部分,即有25%的數(shù)據(jù)小于或等于Q1。
第二四分位數(shù) (Q2),又稱“中位數(shù)”,位于有序數(shù)據(jù)中間位置的分位數(shù),即數(shù)據(jù)的第50百分位數(shù)。它將數(shù)據(jù)等分成前50%和后50%兩部分,即有50%的數(shù)據(jù)小于或等于Q2。
第三四分位數(shù) (Q3),又稱“上四分位數(shù)”或“較大四分位數(shù)”,位于有序數(shù)據(jù)前75%位置的分位數(shù),即數(shù)據(jù)的第75百分位數(shù)。它將數(shù)據(jù)分成前75%和后25%兩部分,即有75%的數(shù)據(jù)小于或等于Q3。
第三四分位數(shù)與第一四分位數(shù)的差距又稱四分位距(InterQuartile Range,IQR)。
示例
首先確定四分位數(shù)的位置:
Q1的位置= (n+1) × 0.25。當(dāng)位置帶有小數(shù)時(shí),四分位數(shù)是與該小數(shù)相鄰的兩個(gè)整數(shù)位置上的標(biāo)志值的平均數(shù),權(quán)數(shù)的大小取決于兩個(gè)整數(shù)位置的遠(yuǎn)近,距離越近,權(quán)數(shù)越大,距離越遠(yuǎn),權(quán)數(shù)越小,權(quán)數(shù)之和應(yīng)等于1。
Q2的位置= (n+1) × 0.5
Q3的位置= (n+1) × 0.75
n表示項(xiàng)數(shù)
對(duì)于四分位數(shù)的確定,有不同的方法,另外一種方法基于N-1 基礎(chǔ)。即
Q1的位置=1+(n-1)x 0.25
Q2的位置=1+(n-1)x 0.5
Q3的位置=1+(n-1)x 0.75
Excel 中有兩個(gè)四分位數(shù)的函數(shù)。QUARTILE.EXC 和QUARTILE.INC
QUATILE.EXC 基于 N+1 的方法,QUARTILE.INC基于N-1的方法。
引證:1.minitab軟件自帶“公式與方法”(methods and formulas)
內(nèi),關(guān)于第一四分位數(shù)的原文如下:
1st quartile (Q1)
Twenty-five percent of your sample observations are less than or 相等 to the value of the first quartile. Therefore,the first quartile is also refer紅色 to as the 25th percentile. Q1 is calculated as follows:
let
w = (N+1)/4
y = the truncated integer value of w
z = the fraction component of w that was truncated away
Q1 = x(y) + z(x(y+1) - x(y))
Note: when w is an integer,y = w,z = 0,and Q1 = x(y)
關(guān)于第三四分位數(shù)的原文如下:
3rd quartile (Q3)
Seventy-five percent of your sample observations are less than or 相等 to the value of the third quartile. Therefore,the third quartile is also referred to as the 75th percentile. Q3 is calculated as follows:
let
w = 3(N+1)/4
y = the truncated integer value of w
z = the fraction component of w that was truncated away
Q3 = x(y) + z(x(y+1) - x(y))
Note: when w is an integer,y = w,z = 0,and Q3 = x(y)
以上引文中,w代表分位數(shù)位置,y代表位置的整數(shù)部分,z代表位置的分?jǐn)?shù)部分。
2. 論四分位數(shù)的計(jì)算(湖南工學(xué)院工商管理系 祁德軍 南華大學(xué)數(shù)理學(xué)院 陳明)
(原文截圖)
實(shí)例1
數(shù)據(jù)總量: 6,47,49,15,42,41,7,39,43,40,36
由小到大排列的結(jié)果: 6,7,15,36,39,40,41,42,43,47,49
一共11項(xiàng)
Q1 的位置=(11+1) × 0.25=3,Q2 的位置=(11+1)× 0.5=6,Q3的位置=(11+1) × 0.75=9
Q1 = 15,
Q2 = 40,
Q3 = 43
實(shí)例2
數(shù)據(jù)總量: 7,15,36,39,40,41
一共6項(xiàng)
數(shù)列項(xiàng)為偶數(shù)項(xiàng)時(shí),四分位數(shù)Q2為該組數(shù)列的中數(shù),Q1為前半組(6項(xiàng)即為前3個(gè)數(shù))的中數(shù),Q3為后半組數(shù)字的中數(shù),此時(shí)
Q1 = 15,
Q2 = (36+39)/2= 37.5,
Q3 = 40.
1、將數(shù)據(jù)從小到大排序,計(jì)為數(shù)組a(1 to n),n代表數(shù)據(jù)的長(zhǎng)度
2、確定四分位數(shù)的位置:b= 1+(n-1) × 0.25= 2.25,b的整數(shù)部分計(jì)為c b的小數(shù)部分計(jì)為d
計(jì)算Q1:Q1=a(c)+[a(c+1)-a(c)]*d=a(1)+[a(2)-a(1)] *0.25 =15+(36-15)×(2.25-2)=20.25
3、計(jì)算如上 Q2與Q3的求法類似,四分位差=Q3-Q1
應(yīng)用
不論Q1,Q2,Q3的變異量數(shù)數(shù)值為何,均視為一個(gè)分界點(diǎn),以此將總數(shù)分成四個(gè)相等部份,可以通過Q1,Q3比較,分析其數(shù)據(jù)變量的趨勢(shì)。
四分位數(shù)在統(tǒng)計(jì)學(xué)中的箱形圖繪制方面應(yīng)用也很廣泛。所謂箱線圖就是由一組數(shù)據(jù)5個(gè)特征繪制的一個(gè)箱子和兩條線段的圖形,這種直觀的箱線圖不僅能反映出一組數(shù)據(jù)的分布特征,而且還可以進(jìn)行多組數(shù)據(jù)的分析比較。這五個(gè)特征值,從小到大依次為:最小值、下四分位數(shù)、中位數(shù)、上四分位數(shù)以及最大值。即:
有關(guān)算法
將n個(gè)數(shù)從小到大排列:
Q2為n個(gè)數(shù)組成的數(shù)列的中數(shù)(Median);
當(dāng)n為奇數(shù)時(shí),中數(shù)Q2將該數(shù)列分為數(shù)量相等的兩組數(shù),每組有 (n-1)/2 個(gè)數(shù),Q1為第一組 (n-1)/2 個(gè)數(shù)的中數(shù),Q3為為第二組(n+1)/2個(gè)數(shù)的中數(shù);
當(dāng)n為偶數(shù)時(shí),中數(shù)Q2將該數(shù)列分為數(shù)量相等的兩組數(shù),每組有n/2數(shù),Q1為第一組 n/2個(gè)數(shù)的中數(shù),Q3為為第二組 n/2 個(gè)數(shù)的中數(shù)。
參考資料 >