面板數據,也稱為混合數據(pool 數據),是指在時間序列上取多個截面,在這些截面上同時選取樣本觀測值所構成的樣本數據。面板數據是一批在不同時間、不同統計單位或地點的具有相同統計指標的數據列,簡單地說面板數據就是既有時間序列又有截面成員(截面單位)的數據組合。例如2000~2018年全國各省?自治區?直轄市高級人民法院和中級人民法院管轄第一審民商事案件標準(自治區、直轄市)的地區生產總值就是面板數據。作為面板數據的地區生產總值可以用一個二維表來表示。
面板數據數量經濟學模型是數量經濟學理論方法的重要發展之一,已經形成了與截面數據模型相對應的完整的模型體系,具有很好的應用價值。
概念
其有時間序列和截面兩個維度,當這類數據按兩個維度排列時,是排在一個平面上,與只有一個維度的數據排在一條線上有著明顯的不同,整個表格像是一個面板,所以把panel 數據譯作“面板數據”。但是,如果從其內在含義上講,把panel data譯為“時間序列—截面數據”更能揭示這類數據的本質上的特點。也有譯作“平行數據”或“TS-CS數據(時間 Series - Cross Section)”。
舉例
1如
城市名:北京、上海市、重慶市、天津市的GDP分別為10、11、9、8(單位億元)。這就是截面數據,在一個時間點處切開,看各個城市的不同就是截面數據。
如:2000、2001、2002、2003、2004各年的北京市GDP分別為8、9、10、11、12(單位億元)。這就是時間序列,選一個城市,看各個樣本時間點的不同就是時間序列。
2如
2000、2001、2002、2003、2004各年中國所有直轄市的GDP分別為:
北京市分別為8、9、10、11、12;
上海市分別為9、10、11、12、13;
天津市分別為5、6、7、8、9;
重慶市分別為7、8、9、10、11(單位億元)。
這就是面板數據。
面板數據是按照英文的直譯,也有人將Panel 數據翻譯成綜列數據、平行數據等。由于國內沒有統一的說法,因此直接使用Panel data這種英文說法應該更準確一些。說面板數據也是比較通用的,但是面板數據并不能從名稱上反映出該種數據的實際意義,故很多研究者不愿使用。
研究方法
面板數據分析方法是最近幾十年來發展起來的新的統計方法,面板數據可以克服時間序列分析受多重共線性的困擾,能夠提供更多的信息、更多的變化、更少共線性、更多的自由度和更高的估計效率,而面板數據的單位根檢驗和協整分析是當前最前沿的領域之一。
面板數據的單位根檢驗的方法主要有 Levin,Lin and CHU(2002)提出的LLC檢驗方法。Im,Pesearn,Shin(2003)提出的IPS檢驗 , Maddala和Wu(1999),Choi(2001)提出的ADF和PP檢驗等。面板數據的協整檢驗的方法主要有Pedroni (1999,2004)和Kao(1999)提出的檢驗方法,這兩種檢驗方法的原假設均為不存在協整關系,從面板數據中得到殘差統計量進行檢驗。Luciano(2003)中運用Monte Carlo模擬對協整檢驗的幾種方法進行比較,說明在T較小(大)時,Kao檢驗比Pedroni檢驗更高(低)的功效。具體面板數據單位根檢驗和協整檢驗的方法見參考文獻[5-10]。
實證分析
1.指標選取和數據來源
經濟增長:本文使用地區生產總值,以1999年為基期,根據各地區生產總值指數折算成實際,單位:億元。
能源消費:考慮到近年來我國能源消費總量中,煤炭和石油供需存在著明顯低估,而電力消費數據相當準確。因此使用電力消費更能準確反映能源消費與經濟增長之間的內在聯系(林伯強,2003)。所以本文使用各地區電力消費量 作為能源消費量,單位:億千瓦小時。
環境污染:污染物以氣休、液體、固體形態存在,本文選取工業廢水排放量作為環境污染的量化指標,單位:萬噸。
本文采用1999-2006年全國30個省(直轄市,自治區)的地區生產總值、電力消費量 和工業廢水排放量 的數據構建面板數據集。30個省(直轄市,自治區)包括北京、天津市、河北省、遼寧省、上海市、江蘇省、浙江省、福建省、山東省、廣東省、山西省、內蒙古自治區、吉林省、黑龍江省、安徽、江西省、河南省、湖北、湖南省、海南省、廣西壯族自治區、重慶市、四川省、貴州省、云南省、陜西省、西藏自治區、甘肅、青海、寧夏、新疆,由于西藏數據不全故不包括在內。數據來源于《中國統計年鑒2000-2007》。為了消除變量間可能存在的異方差,本文先對地區生產總值、地區電力消費量和工業廢水排放量進行自然對數變換。
參考資料 >