必威电竞|足球世界杯竞猜平台

中位數(shù)
來源:互聯(lián)網(wǎng)

中位數(shù)(Median),又稱中值。指一組觀察值,按大小順序排列,位置居中的變量值 (n為奇數(shù))或位置居中的兩個變量值的均數(shù)(n為偶數(shù))。中位數(shù)是一個位次上的平均指標。

中位數(shù)概念最早出現(xiàn)在六世紀的《塔木德》,但未廣泛流傳。此后中位數(shù)在部分著述中被提及,但都沒有明確算法及應(yīng)用,且并未得到普及。直到1774年,法國數(shù)學家皮埃爾-西蒙·拉普拉斯(Pierre-Simon Laplace)明確建議使用中位數(shù)作為后驗概率密度函數(shù)(PDF)值的標準估計量,以最小化預(yù)期誤差。1843年,法國數(shù)學家安東尼·庫爾諾(Antoine Augustin Cournot)首次使用中位數(shù)(valeur médiane) 一詞來表示將概率分布分成相等的兩半的值。

在一組觀測值的數(shù)據(jù)中,大于的個數(shù)和小于的個數(shù)相等;此外,當與某一定值的離差絕對值(也稱絕對離差)之和,以=時為最小。中位數(shù)表明總體中標志值小于中位數(shù)的單位數(shù)和大于中位數(shù)的單位數(shù)是相等的。用中位數(shù)來代表總體的一般水平可以避免受總體中極端標志值的影響,有時更具有代表性。

中位數(shù)可以應(yīng)用于任何定量資料,通常用于不適合用幾何平均值和調(diào)和平均值的偏度資料中,尤其適用于包含不完全信息的資料中。其具體可以應(yīng)用在生活、醫(yī)學及計算機等領(lǐng)域,如臨床上隨訪資料經(jīng)常包含一些中途失訪患者的某些數(shù)據(jù);在生活中,中位數(shù)能夠反映考試分數(shù)集中趨勢的量。

定義

將總體中各單位標志值按大小順序排列,居于中間位置的那個標志值就是中位數(shù):。此外,也有一些人將變量x的中位數(shù)表示為med(x)、x?、為μ 1/2或M。當發(fā)生這種使用這些或其他中位數(shù)符號,都需要在使用時明確定義。

嚴格來說,中位數(shù)就是把所有數(shù)據(jù)按照一定的順序(通常情況下按數(shù)值大小)進行排列,處于排序后數(shù)據(jù)最中間位置所對應(yīng)的那個數(shù)值。如果數(shù)據(jù)個數(shù)奇數(shù),中位數(shù)就是處在正中心的數(shù)值;如果數(shù)據(jù)個數(shù)是偶數(shù),中位數(shù)就是處在正中心位置左右兩項數(shù)據(jù)的平均數(shù)。中位數(shù)可用來說明社會經(jīng)濟現(xiàn)象各單位數(shù)量標志值的一般水平。

將研究的數(shù)列項數(shù)(無論是奇數(shù)或偶數(shù))加1除以2,即可求得中位數(shù)的位置,從而可找出中位數(shù)。設(shè)未分組的統(tǒng)計數(shù)列資料為(已按大小排序)。

當數(shù)列項數(shù)為奇數(shù)時,則第項的標志值為中位數(shù);當數(shù)列項數(shù)為偶數(shù)時,則以與這兩個標志值的和的簡單平均數(shù)為中位數(shù)。即:

由此,中位數(shù)的確定可表述為

簡史

在古代近東地區(qū),科學家們并未普遍采用匯總統(tǒng)計數(shù)據(jù),而是傾向于選擇能夠綜合多種現(xiàn)象并提供廣泛一致性的單一值。統(tǒng)計學中的平均值等概念主要是在中世紀和近代早期形成的。中位數(shù)這一概念最早見于公元六世紀的《塔木德》中,目的是用于公平地對不同的評價進行分析,但這一概念并未在科學界廣泛流傳。

與現(xiàn)代中位數(shù)最接近的祖先是中程數(shù)(mid-range),由Al-Biruni提出?,他用這一方法來分析貨幣金屬,盡管其傳播情況不詳。在他的理論提出后,大多數(shù)分析者仍然傾向于使用對他們不利的數(shù)據(jù)值,以免被認為作弊。?直到大航海時代,隨著船舶數(shù)量的增加,導(dǎo)航員需要在惡劣天氣中確定緯度,這促使人們對匯總統(tǒng)計方法重新產(chǎn)生興趣,如哈里奧特在《Instructions for Raleigh's Voyage to Guiana, 1595》中推薦了中程數(shù)。

而中位數(shù)的概念最早可能在英國數(shù)學家愛德華·賴特(Edward Wright)于1599年出版的《Certaine Errors in Navigation》一書中提出,他在討論羅盤導(dǎo)航時提到了中位數(shù)。賴特傾向于保留所有測量值,并認為中位數(shù)更有可能正確,但他沒有提供具體的應(yīng)用示例,因此很難驗證他是否描述了現(xiàn)代中位數(shù)概念。中位數(shù)在概率背景下也出現(xiàn)在荷蘭數(shù)學家克里斯蒂安·惠更斯(ChristiaanHuygens)的信件中,盡管它被視為不適合精算實踐的統(tǒng)計例子。

1757年,意大利數(shù)學家波斯科維奇(Roger Joseph Boscovich)開發(fā)了一種基于L 1范數(shù)的回歸方法,隱含地表達了基于中位數(shù)所推出。1774年,法國數(shù)學家皮埃爾-西蒙·拉普拉斯(Pierre-Simon Laplace)明確建議使用中位數(shù)作為后驗概率密度函數(shù)(PDF)值的標準估計量,以最小化預(yù)期誤差。為此,拉普拉斯在1800年代初確定了樣本均值和樣本中位數(shù)的分布。十年后,德國約翰·卡爾·弗里德里希·高斯(Guass,C.F,)和法國數(shù)學家阿德利昂·瑪利·埃·勒讓德(Adrien-Marie Legendre)開發(fā)出最小二乘法,因其計算簡便而取代了拉普拉斯的方法。

1843 年, 安東尼·庫爾諾(Antoine Augustin Cournot)是第一個使用中位數(shù)(valeur médiane) 一詞來表示將概率分布分成相等的兩半的值的人。德國物理學家古斯塔夫·費希納(Gustav Theodor Fechner)在社會學和心理現(xiàn)象中使用了中位數(shù)(Central werth)。它早些時候僅用于天文學和相關(guān)領(lǐng)域。古斯塔夫·費希納 (Gustav Fechner)將中位數(shù)推廣到正式的數(shù)據(jù)分析中。且中位數(shù)出現(xiàn)在F. Y. 埃奇沃斯(F. Y. Edgeworth)的書中。之后,弗朗西斯·高爾頓 (Francis Galton)在1869年使用了“中最值”(middle-most value),接著在1880年使用了“中值”(media),之后在1881年正式使用了英語術(shù)語中位數(shù):median。

整個19世紀,統(tǒng)計學家大力鼓勵使用中位數(shù),因為它直觀清晰。然而,中位數(shù)的概念并不像算術(shù)平均值那樣適用于高矩理論,而且更難計算。20世紀,中位數(shù)作為平均數(shù)的概念逐漸被算術(shù)平均數(shù)所取代。

相關(guān)概念

眾數(shù)

眾數(shù),是指變量數(shù)列中出現(xiàn)次數(shù)最多或頻率最大的變量值。用它來作為該變量數(shù)列的代表值,反映變量分布的集中趨勢。眾數(shù)的次數(shù)越多,集中趨勢越顯著。反之,若眾數(shù)的次數(shù)較少,眾數(shù)的代表性就較差。因此,只有集中趨勢顯著時,才能用眾數(shù)作為總體的代表值。

平均數(shù)

平均數(shù)指同質(zhì)總體某一標志值在一定時間、地點、條件下所達到的一般水平,是總體的代表值。是用來度量統(tǒng)計頻率分布集中趨勢的指標。在次數(shù)分布中,多數(shù)變量聚集于平均數(shù)的周圍因而平均數(shù)總是處在頻率分布集中的位置或附近、反映事物的集中趨勢。

方差

方差是用來描述隨機變量取值的分散程度或波動大小的特征數(shù):方差越小,說明隨機變量的取值越集中(集中于均值附近);方差越大,說明隨機變量的取值越分散。標準差是方差的算術(shù)平方根,其功能與方差相似,差別在于量綱上。由于標準差與隨機變量本身和其期望有相同的量綱,所以在應(yīng)用中常用標準差,但標準差的計算必須通過方差獲得。說明:隨機變量的數(shù)學期望存在,其方差不一定存在;但當方差存在時,由于總是成立,因此其數(shù)學期望一定存在。大多時候使用此公式:。

概率分布中位數(shù)

對于任何具有累積分布函數(shù)的實值概率分布,中位數(shù)被定義為滿足以下不等式的任何實數(shù):,

另一種等價的表達方式是考慮的隨機變量

,并且,這個定義并不要求具有絕對連續(xù)分布以及離散分布。

實數(shù)集上的任意概率分布至少有一個中位數(shù),但在特殊情況下,可能存在多個中位數(shù)。例如當分布在某個區(qū)間上恒等為 1/2(概率分布在該區(qū)間內(nèi)為0),則該區(qū)間的任何值都是中位數(shù)。

樣本中位數(shù)

樣本按大小次序排列后處于中間位置上的統(tǒng)計量稱為樣本中位數(shù),常用表示。

設(shè)是來自某總體的一個樣本,其次序統(tǒng)計量記為

則。

多元中位數(shù)

邊際中位數(shù)

邊際中位數(shù)是為在一組特定坐標系下定義的向量而設(shè)定的概念,它指的是一個向量,其每個分量均為對應(yīng)的單變量數(shù)據(jù)集的中位數(shù)值。

幾何中位數(shù)

幾何學領(lǐng)域,對于位于三維空間內(nèi)的一系列離散樣本點,幾何中位數(shù)被定義為一個特殊位置的點,該點的能夠使其自身到這些樣本點的累積距離達到最小。

幾何中位數(shù)的定義為:

幾何中位數(shù)不僅在一維數(shù)據(jù)中通過最小化各點間距離的總和來體現(xiàn)其集中趨勢,在多維空間中同樣適用。幾何中位數(shù)有時也被稱作1-中位數(shù)、空間中位數(shù)、歐幾里得最小點或托里拆利點。此外,幾何中位數(shù)對于歐幾里得相似變換(例如平移和旋轉(zhuǎn))是等變的。

全方位中位數(shù)

當一個數(shù)據(jù)集在所有坐標系中的邊際中位數(shù)都匯聚于同一點時,這一點被稱作“全方位中位數(shù)”,這個概念與投票理論相關(guān)。對于離散分布而言,當全方位中位數(shù)出現(xiàn)時,它與幾何中位數(shù)能夠達成一致。

中心點

中心點是中位數(shù)對高維歐幾里德空間中數(shù)據(jù)的推廣。其概念為:在一個位于d維空間中的點集,該集合的中心點是一個點,通過該點的任何一個超平面都將點集劃分為兩個大致相等的部分,其中較小部分的點數(shù)至少占總點數(shù)的1/(d + 1)。與中位數(shù)一樣,中心點可以不是原始數(shù)據(jù)點集中的任何一個點。任何不含重復(fù)元素的非空點集都至少存在一個中心點。

中線

1940年,匈牙利數(shù)學家瓦爾德(Abraham Wald)提出了一種處理雙變量數(shù)據(jù)集的策略,即根據(jù)獨立變量x的中位數(shù)將數(shù)據(jù)分為兩部分——一部分包含值低于中位數(shù)的數(shù)據(jù),另一部分包含值高于中位數(shù)的數(shù)據(jù)。他的方法包括分別計算這兩部分的因變量y和自變量x的平均值,并據(jù)此估算連接這兩點的直線斜率,隨后對這條直線進行調(diào)整,使其盡可能貼合數(shù)據(jù)集中的大部分點。

相關(guān)定律

詹森中位數(shù)不等式

詹森不等式指出,對于具有有限期望的隨機變量,以及對于任何凸函數(shù),都有以下不等式成立:。這個不等式也可以推廣到中位數(shù)。

如果函數(shù)對于任何滿足以下條件:

而這是應(yīng)該閉區(qū)間(允許單點或空集的退化情況)。則稱任何凸函數(shù)是一個函數(shù),但反之則不成立。如果是函數(shù),則。

中值無偏估計量

對于一個確定的一維參數(shù),估計量的分布中位數(shù)恰好等于的值,那么這個估計量就被稱為中值無偏估計量。也就是說估計值低估的次數(shù)與高估的次數(shù)一樣多。這種要求在大多數(shù)應(yīng)用中與均值無偏性同樣有效,并且具有在一對一變換下不變的性質(zhì)。

性質(zhì)

性質(zhì)一

在一組觀測值中,大于的個數(shù)和小于的個數(shù)相等。是累積頻率為0.50所對應(yīng)的的值,如下圖1。

這便是在觀測值沒有(或很少)重復(fù)的情形下中位數(shù)的性質(zhì)。

當觀測值中重復(fù)數(shù)值很多,這一性質(zhì)就不一定成立。如九名學生的成績是95,90,90,85,85,85,85,80,75。那么=85。大于的有3個,小于的有2個,個數(shù)不等。

性質(zhì)二

我們還常用到各與某一定值的離差絕對值(也稱絕對離差)之和。表示為:

得出中位數(shù)有這樣的性質(zhì):上述絕對離差和以=時為最小。

證明:一組數(shù)與某一定值的離差的絕對值之和

按分別討論,以時為最小。

設(shè)各按由小到大排列,而

將式分成兩項以脫去絕對值號,證明完畢。

計算

根據(jù)中位數(shù)的概念,確定中位數(shù)的要領(lǐng)是如何準確計算累計次數(shù)的中點。由于統(tǒng)計務(wù)實中所掌握的計算資料不通,計算中點的方法也有所不同。

第一種方法:由未分組的原始資料確定中位數(shù)的方法。要確定未分組資料的中間項,首先把不規(guī)則的原始資料按變量大小依次排列,以總次數(shù)除以2,求之。計算公式為:。

公式中:代表中位數(shù)所在的中間項次,代表總次數(shù)。如果總次數(shù)是奇數(shù)項,則居中間位置的標志值就是中位數(shù)。如果總次數(shù)是偶數(shù)項,則居中間位置的相鄰兩個變量值的算術(shù)平均數(shù)便是中位數(shù)。

第二種方法:由分組資料計算中位數(shù)的方法。在掌握分組資料時,中間位置的計算方法如下:

因為分組資料有次數(shù)分配,要以累計次數(shù)計算。累計次數(shù),可以從變量值最低組開始,稱以下累計法,也可從最高組開始,稱以上累計法。用“以下累計”法確定中位數(shù),亦稱下限法,用“以上累計”法確定中位數(shù),亦稱上限法。根據(jù)中位數(shù)的性質(zhì),下限法與上限法所計算的結(jié)果應(yīng)該一致。但是,如果采用(n+1)/2確定中間位置項來求中位數(shù),則下限法所計得的答案,不能與上限法的答案相等,這就違背了中位數(shù)是一固定中間位置值的數(shù)學性質(zhì)。故采用確定中間位置項,才能使這兩種方法的計算結(jié)果相同。

兩個計算公式如下:

下限法計算公式:

上限法計算公式:

上述公式式中:代表中位數(shù)所在組下限值;代表中位數(shù)所在組上限值;

代表中位數(shù)所在組前面各組的累計次數(shù)(以下累計);

代表中位數(shù)所在組后面各組的累計次數(shù)(以上累計);

代表中位數(shù)所在組的次數(shù);

代表中位數(shù)所在組的組距。

推廣

分位數(shù)

分位數(shù)是中位數(shù)的推廣,將數(shù)據(jù)按從小到大的順序排列后,對于,它的分位點定義為

其中,[]表示的整數(shù)部分。

百分位數(shù)

百分位數(shù)的概念是中位數(shù)概念的推廣。

定義:一組個觀測值按數(shù)值大小排列如。

處于位置的值稱為第百分位數(shù)。

中位數(shù)是第 50 百分位數(shù)。

第百分位數(shù)就是一般順序中第位的數(shù) (如不是整數(shù),取大于它的最小整數(shù))。

應(yīng)用

中位數(shù)的應(yīng)用一不受極端標志值的影響,二不受開口組的影響。可以應(yīng)用于任何定量資料,通常用于不適合用幾何平均值和調(diào)和平均值的偏度資料中,尤其適用于包含不完全信息的資料中。

醫(yī)學領(lǐng)域

中位數(shù)在醫(yī)學統(tǒng)計學中常用于描述偏態(tài)分布資料的集中位置,反映位次居中的觀察值的水平。特別是用于分布不清楚或變量值一端(或兩端)無確定數(shù)值。在醫(yī)學領(lǐng)域中還可以應(yīng)用在如臨床上隨訪資料經(jīng)常包含一些中途失訪患者的某些數(shù)據(jù);有時因受儀器和試劑的靈敏度的限制,指標的含量過低時無法準確測,只知道一組數(shù)中有幾個數(shù)低于某數(shù)值。

中位數(shù)可創(chuàng)建篩查體制:國內(nèi)首個篩查中心結(jié)合歐洲的篩查質(zhì)控經(jīng)驗,提出建立以篩查指標中位數(shù)倍數(shù)值(multiple of median,)中位數(shù)(即)為核心的評價質(zhì)控體系,該評價體系是唐氏綜合征產(chǎn)前篩查質(zhì)量控制工作的一個重要而有效的辦法。利用某醫(yī)院的發(fā)病數(shù)據(jù),可以建立中位數(shù)回歸模型,能夠預(yù)測嚴重急性呼吸綜合征發(fā)病病例。

生活領(lǐng)域

中位數(shù)反應(yīng)在生活領(lǐng)域,可以幫助工廠預(yù)估生產(chǎn)零件件數(shù)。中位數(shù)能夠反映考試分數(shù)集中趨勢的量,即反映考試分數(shù)整體水平的數(shù)值。中位數(shù)的計算不是由每個分數(shù)都參加運算求得,而是由中間位置相鄰的部分分數(shù)求故中位數(shù)一般不受兩極端分數(shù)的影響。當一組考試分數(shù)中出現(xiàn)特大或特小兩極端分數(shù)時,可用中位數(shù)代表整體水平。由于中位數(shù)僅利用了考試分數(shù)中相對位置的信息,故在充分利用考試分數(shù)整體的信息上,中位數(shù)不如平均分數(shù)。所以在一般情況下,中位數(shù)的集中代表性不如平均分數(shù),中位數(shù)的應(yīng)用也不如平均分數(shù)廣泛。

計算機領(lǐng)域

中位數(shù)還可應(yīng)用于MATLAB函數(shù)中。在Matlab中,median()函數(shù)是計算數(shù)據(jù)的中位數(shù)的內(nèi)置函數(shù),其使用格式為

參考資料 >

Edward Wright and His Work. Imago Mundi.2024-03-01

..2024-03-04

Statistical Median.MathWorld.2024-03-01

中位數(shù).術(shù)語在線.2024-03-01

How the Average Triumphed Over the Median.Priceonomics.2024-03-01

Talmud and Modern Economics.Jewish American and Israeli Issues.2024-03-01

Modern Economic Theory in the Talmud by Yisrael Aumann.Economics in the Talmud: A Glimpse.2024-03-01

The Development of the Concept of the Best Mean of a Set of Measurements from Antiquity to the Present Day (PDF) (Speech). .131st Annual Meeting of the American Statistical Association. Colorado State University..2024-03-01

The Life and Works of Luca Pacioli (1446/7–1517), Humanist Educator.Abacus.2024-03-01

encyclopediaofmath.org.Encyclopedia of Mathematics.2024-03-04

personal.psu.edu.PennState.2024-03-04

AP Statistics Review - Density Curves and the Normal Distributions.Internet Archive.2024-03-04

..2024-03-04

..2024-03-04

生活家百科家居網(wǎng)