必威电竞|足球世界杯竞猜平台

方差
來源:互聯網

方差(英文:variance)是隨機變量的重要數字特征之一,是反映隨機變量的取值與其數學期望偏離程度的量,方差越小,隨機變量的取值越集中,數據波動越??;方差越大,隨機變量的取值越分散,數據波動越大。

1918年,英國的羅納德·費希爾(R.A.Fisher,1890~1962)在論文《孟德爾遺傳假定下的親緣之間的相關性》(英文:The Correlation Between Relatives on the Supposition of Mendelian Inheritance)中提出了新的統計學分析方法,即方差分析法(analysis of variance),方差一詞作為數學用語被首次提出。

方差具有幾個基本性質,如常數的方差為零等。幾種常見的隨機變量,如離散型的二項分布、泊松分布,連續型的正態分布等,都可計算出相應的方差。與方差相關的定理切比雪夫總和不等式,它給出了大偏差發生概率的上界,在概率論中應用廣泛。在統計學中,方差分析法通過構造統計模型,利用假設檢驗的方法進行分析,可得到一些重要的結論,并應用于其他領域,例如:在金融領域,方差用于衡量股票、債券等金融資產的風險高低;在機械制造實際零件加工中,方差用于分析質量因素對產品的影響;在中醫臨床研究、環境監測自然科學領域中,方差的分析方法仍然可以發揮重要的作用。

定義

方差是隨機變量的重要數字特征之一,是反映隨機變量的取值與其數學期望偏離程度的量。方差因隨機變量類型的不同有以下定義。

離散型

設為離散型隨機變量,且數學期望存在,

若,則稱為的方差。

連續型

設為連續型隨機變量,其密度函數為,且數學期望為存在,

則稱為的方差。

綜上所述,一般地,若隨機變量的數學期望為,則數值稱為的方差。

歷史

方差是在概率論和統計中對隨機變量或一組數據離散程度的度量,統計作為一種社會實踐活動,已有四五千年的歷史。20世紀初至今為現代統計學時期,主要特征是描述統計學已轉向推斷統計學,英國羅納德·費雪提出的極大似然估計量概念成為估計參數的重要方法,并于1918年在論文《孟德爾遺傳假定下的親緣之間的相關性》(英文:The Correlation Between Relatives on the Supposition of Mendelian Inheritance)中提出了新的統計學分析方法,即方差分析法(analysis of variance),方差一詞作為數學用語被首次提出。到了20世紀30年代,行為科學家開始采用方差分析方法,但其普及進程相對較慢。隨著二戰結束后科學研究的繁榮,行為和心理科學快速發展,方差分析被使用得越來越頻繁。這一時期科學界對統計顯著性檢驗的重視也進一步推動了方差分析的應用,方差分析逐漸成為行為科學家們驗證實驗結果有效性和確保研究科學性的關鍵工具之一。

性質

方差具有如下性質:

幾種常見分布的方差

離散型

二項分布

設隨機變量的分布列,即服從,稱為二項分布,記作,由方差的定義可計算得的方差為:

因為伯努利分布是時的二項分布,所以兩點分布的方差為

泊松分布

隨機變量的分布列為泊松分布,其概率分布列為

其中參數,記為,由方差的定義可計算得的方差為:

超幾何分布

設隨機變量的分布列為超幾何分布,記為,其概率分布列為

其中且均為正整數。

由方差的定義可計算得的方差為:

連續型

正態分布

隨機變量的密度函數則稱服從正態分布,稱為正態變量,記作,其中參數

在正態分布中,其中一個參數就是的方差。

均勻分布

隨機變量的密度函數為,則稱服從區間上的均勻分布,記作,由方差的定義可計算得的方差為:

指數分布

隨機變量的密度函數為,則稱服從指數分布,記作,其中,由方差的定義可計算得的方差為:

相關概念

數學期望

數學期望(mathematical expectation)簡稱期望,亦稱平均值,隨機變量的重要數字特征之一,是反映隨機變量取值的平均水平的量。隨機變量的數學期望常用或表示。

離散型

設為一離散型隨機變量,它取值對應的概率為如果級數絕對收斂,則把它稱為的數學期望,記為

連續型

設為具有密度函數的連續型隨機變量,當積分絕對收斂時,可稱它為的數學期望,即

標準差

標準差(Standard 離差)是一種描述數據的離散程度統計量。

一般地,若隨機變量的數學期望為,無論隨機變量是離散型或連續型,若方差存在,則稱方差的算術根為的標準差,或均方差、根方差。

相關定理

切比雪夫總和不等式描述了隨機變量與其期望值、方差值之間的關系,馬爾可夫不等式為切比雪夫不等式的一般情況。大數定律描述了當隨機試驗次數很大時,概率所呈現的概率性質,也和方差這個數字特征有關。

切比雪夫不等式

設連續隨機變量的數學期望和方差都存在,則對任意常數,有

,或

證明:設是一個連續隨機變量,其密度函數為,記,有

可知(1)式對連續隨機變量成立,對于離散隨機變量亦可類似進行證明。

概率論中,事件稱為大偏差,其概率稱為大偏差發生概率,切比雪夫總和不等式給出大偏差發生概率的上界,這個上界與方差成正比,方差越大上界也越大。

切比雪夫大數定律

在一個相互獨立的隨機變量序列中,若存在,且

則對任意皆有稱服從切比雪夫大數定律。

相關計算

基本步驟

方差的基本計算步驟主要分為以下五步:

示例

例1 某人有一筆資金,可投入3個項目:房產,地產和商業,其收益和市場狀態有關。若把未來市場劃分為好、中、差3個等級,且每個等級發生的概率分別為,根據市場調研的情況得到了不同等級狀態下各個項目的年收益(單位:萬元)。如下表1所示,該投資者應該怎樣投資。

解:先求出的數學期望。

根據數學期望可知,投資房產的平均年收益最大,可選擇房產,但投資也要考慮風險,再求出的方差。

方差越大,收益波動越大,從而風險越大。從方差看,投資房產的風險比投資地產的風險大,因此將收益與風險綜合權衡,該投資者應該選擇投資地產更好。

相關推廣

方差分析是通過對數據所反映的研究對象某一特征的數量變動進行分解,并在一定的顯著水平下對其進行顯著性檢驗,以判斷數量變動屬于隨機因素引起的隨機變動,還是受控因素引起系統變動的方法和過程。按因子(或因素)的多少將方差分析分為:單因素方差分析和雙因素方差分析。單因子方差分析是只考慮一個分析型自變量對數值型因變量影響的分析方法。

單因子模型

在單因子試驗中,記因子為,設其有個水平,記為在每一水平下考察的指標可以看成一個總體,現有個水平,故有個總體,假定:

(1)每一總體均為正態總體,記為

(2)各總體的方差相同,記為

(3)從每一總體中抽取的樣本是相互獨立的,即所有的試驗結果都相互獨立。

這三個假定都可以用統計方法進行驗證。試驗結果的獨立性可由隨機化實現,即所有試驗按隨機次序進行。

比較各水平下的均值是否相同,即要對如下的一個假設進行檢驗:

其備擇假設為不全相等。

如果成立,因子的個水平均值相同,稱因子的個水平間沒有顯著差異,簡稱因子不顯著;反之,當不成立時,因子的個水平均值不全相同,稱因子的不同水平間有顯著差異,簡稱因子顯著。

檢驗方法

若成立,則定義的檢驗統計量服從自由度為和的分布,考慮到統計量的值越大越傾向于拒絕原假設,故該檢驗的拒絕域為

通常把分析計算過程列成表格,如下:

對給定的,可作如下判斷:

相關應用

金融學

在金融領域,方差用于衡量股票、債券等金融資產的風險高低。例如在Markowitz的均值-方差模型(MV模型)中,通過優化投資組合的方差來最小化風險,為投資者尋找期望回報和風險的平衡點。股票投資收益是一個隨機變量,期望收益就是隨機變量的均值。在股票期望收益相差不大的條件下,用收益的方差來度量它們的投資風險高低,方差越大風險越高,方差越小風險越低。

工程學

在機械制造實際零件加工中,很多的質量因素都會影響成品,如材料、雜質含量、工藝方法、熱處理等,每一個因素不同程度的影響著最終質量。通過方差分析來明確各因素的影響作用,先要選出樣本進行多次試驗,在根據試驗結果分析判別每個因素對產品的影響程度。

醫學

在中醫臨床研究中,通常會對主要的結果指標實施多次的測量,處理多次測量的數據會選擇重復測量資料方差分析,目的是推斷處理因素、時間因素、兩因素交互對于受試個體的作用效果,分析觀察值的發展趨勢和相關影響因子。重復測量資料的方差分析是研究中縮小個體差異所致誤差的一種有效方法,檢驗效能較高,對于有限的受試個體進行多次測量并收集足夠的數據,節省了樣本含量,在很大程度上減少人力、物力、財力的消耗。

環境監測

空氣環境的好壞是影響環境質量的重要因素之一。它是由空氣中的懸浮顆粒物濃度來度量的,通過實時環境監測對當前的空氣質量指數,了解空氣污染物的主要組成,再分析對各影響空氣質量的因素(時間、監測點),從而減輕空氣污染問題。以空氣質量數據的特征構建方差檢驗模型,通過對時間與空間兩個影響因素進行方差分析檢驗,可以了解空氣污染物對不同地區環境質量的影響。

參考資料 >

生活家百科家居網