在實(shí)證研究中,我們常常需要確定被解釋變量與解釋變量之間關(guān)系分析的實(shí)證模型,這一點(diǎn)非常重要,因?yàn)槟阍谥\篇布局,涉及到后文所有實(shí)證篇幅該如何進(jìn)行了實(shí)證操作,如采用何種模型、運(yùn)用什么命令、根據(jù)主效應(yīng)模型選擇處理內(nèi)生性問(wèn)題的方法以及拓展性分析的展開(kāi)等等。
因此,在實(shí)證論文的“研究設(shè)計(jì)”部分確定好自己實(shí)證分析中的模型工具非常重要,它是牽一發(fā)動(dòng)全身的作用。一單用錯(cuò)模型,全文的實(shí)證分析結(jié)果全部需要調(diào)整。
那么,對(duì)于一篇實(shí)證文章,我們?cè)撊绾未_定分析模型呢?相信大家在看經(jīng)管實(shí)證文獻(xiàn)的時(shí)候,就有發(fā)現(xiàn)很多文章旗幟鮮明地在被解釋變量的變量設(shè)計(jì)和度量方式說(shuō)明時(shí),已經(jīng)給出了說(shuō)明。對(duì)于如何確定實(shí)證模型類(lèi)型,很顯然這個(gè)問(wèn)題跟被解釋變量的統(tǒng)計(jì)分布情況密切相關(guān)。
從統(tǒng)計(jì)學(xué)變量分布情況來(lái)看,變量類(lèi)型一般可以分為連續(xù)性變量和離散型變量。其中:(1)連續(xù)型變量,是我們最為常見(jiàn)的統(tǒng)計(jì)分布,譬如企業(yè)盈利能力,總資產(chǎn)收益率ROA、凈資產(chǎn)收益率ROE等;企業(yè)創(chuàng)新,如研發(fā)投入強(qiáng)度、專(zhuān)利擁有量的自然對(duì)數(shù);企業(yè)投資,如投資效率、投資水平、金融資產(chǎn)配置等。(2)離散型變量,也是實(shí)證研究中非常常見(jiàn)的統(tǒng)計(jì)發(fā)布,譬如虛擬變量(啞變量,0-1)、計(jì)數(shù)數(shù)據(jù)(隨機(jī)性的非負(fù)整數(shù))、排序數(shù)據(jù)(典型的是李克特程度變量,1、2、3、4、5等類(lèi)似程度分布)。(3)還有一種比較特殊的數(shù)據(jù)分布,雖然是連續(xù)型變量,但是數(shù)據(jù)分布呈現(xiàn)偏右或偏左(歸左或歸右),這也是需要特定模型予以嚴(yán)謹(jǐn)?shù)亻_(kāi)展回歸分析。
為此,在實(shí)證分析過(guò)程中,將會(huì)根據(jù)被解釋變量的不同分布情況進(jìn)行模型的選擇。
一是,當(dāng)被解釋變量為連續(xù)型變量時(shí),在模型設(shè)計(jì)時(shí)通常會(huì)應(yīng)用OLS模型最小二乘法進(jìn)行因果關(guān)系的分析和探討。這是我們實(shí)證分析中最為常見(jiàn)的一類(lèi)模型,也是最為容易的模型。而且,此時(shí)解釋變量的回歸系數(shù)的經(jīng)濟(jì)含義,就是需要邊際效應(yīng),即解釋變量變動(dòng)一個(gè)標(biāo)準(zhǔn)差,此時(shí)被解釋變量會(huì)變動(dòng)多大百分比的幅度。最后,在后續(xù)的內(nèi)生性檢驗(yàn)中,對(duì)于工具變量法,我們可以采用二階段最小二乘法予以分析(2SLS)。
二是,當(dāng)被解釋變量為二值選擇變量(即虛擬變量,0-1)時(shí),在模型設(shè)計(jì)時(shí)將會(huì)采用二值選擇模型來(lái)探討因素之間的因果關(guān)系,如Probit和logit模型。這也是我們研究過(guò)程中非常常見(jiàn)的方法模型。根據(jù)筆者個(gè)人經(jīng)驗(yàn),對(duì)于這類(lèi)二值選擇模型,調(diào)查數(shù)據(jù)中應(yīng)用得更為常見(jiàn),但是對(duì)于實(shí)際的上市公司而言,二值選擇模型不常見(jiàn),因?yàn)閷?duì)于上市公司而言,更多的變量是連續(xù)變量或離散型計(jì)數(shù)數(shù)據(jù)變量。但是,需要注意的是,probit模型是被解釋變量為連續(xù)變量時(shí)進(jìn)行Heckman二階段模型第一階段的必備方法,通過(guò)第一階段獲取逆米爾斯比率。此外,對(duì)于二值選擇模型的回歸系數(shù),不能作為邊際效應(yīng),需要通過(guò)margins, dydx等命令來(lái)計(jì)算各種邊際效應(yīng)。最后,對(duì)于二值選擇模型,其內(nèi)生性問(wèn)題的檢驗(yàn)有其獨(dú)特的工具變量法方法,如ivprobit、ivlogit模型。當(dāng)然,也可以通過(guò)Heckman二階段模型進(jìn)行樣本選擇性偏差估計(jì)。
三是,當(dāng)被解釋變量為計(jì)數(shù)數(shù)據(jù)(隨機(jī)性分布的非負(fù)整數(shù))時(shí),在模型設(shè)計(jì)中最好的方法應(yīng)該是泊松分布模型(Poisson)來(lái)分析因素之間的因果關(guān)系。實(shí)際上,在我們實(shí)證研究過(guò)程中,這種非負(fù)整數(shù)的隨機(jī)分布情況不多見(jiàn),但也不少見(jiàn),如我們常常遇到的“企業(yè)專(zhuān)利數(shù)量”或者“知識(shí)產(chǎn)權(quán)擁有量”,對(duì)于企業(yè)而言,顯然企業(yè)擁有的專(zhuān)利數(shù)量是隨機(jī)性分布的非負(fù)整數(shù)。當(dāng)然在后續(xù)實(shí)證分析中,我們可以應(yīng)用多種方法相互佐證,當(dāng)被解釋變量為計(jì)數(shù)數(shù)據(jù)時(shí),也可以采用OLS回歸予以穩(wěn)健性檢驗(yàn)。而且,如果計(jì)數(shù)數(shù)據(jù)為歸左或歸右分布的,在后續(xù)的穩(wěn)健性檢驗(yàn)中也可以采用Tobit模型進(jìn)行穩(wěn)健性檢驗(yàn),此時(shí)我們?cè)谝黄獙?shí)證文章中運(yùn)用泊松模型、OLS模型和Tobit模型。對(duì)于內(nèi)生性問(wèn)題所采用的工具變量法,我們可以根據(jù)這三種方法對(duì)應(yīng)的工具變量法進(jìn)行分析。
四是,當(dāng)被解釋變量為排序變量(類(lèi)似1、2、3、4、5這種程度型分布)時(shí),在模型設(shè)計(jì)時(shí)最好的方法是排序模型,即oprobit(ordered probit)、ologit(ordered logit)。根據(jù)筆者的研究經(jīng)驗(yàn),這種排序模型更常見(jiàn)于調(diào)研數(shù)據(jù)中,主要是對(duì)某事物進(jìn)行主觀(guān)評(píng)價(jià),比如非常不滿(mǎn)意、不滿(mǎn)意、一般、滿(mǎn)意、非常滿(mǎn)意等五類(lèi)程度型選項(xiàng)。同樣的,如果從實(shí)證分析角度來(lái)看,當(dāng)然在后續(xù)實(shí)證分析中,我們可以應(yīng)用多種方法相互佐證,也可以采用OLS回歸、泊松模型予以穩(wěn)健性檢驗(yàn)。對(duì)于內(nèi)生性問(wèn)題所采用的工具變量法,我們可以運(yùn)用最為常見(jiàn)的工具變量法(2SLS)進(jìn)行分析。
五是,當(dāng)被解釋變量為連續(xù)變量或者計(jì)數(shù)數(shù)據(jù)變量,且此時(shí)有歸左或歸右的分布特點(diǎn)時(shí),在模型設(shè)計(jì)時(shí)最佳的方案是選擇tobit模型。這種歸并數(shù)據(jù)的一個(gè)重要特征是,雖有全部的觀(guān)測(cè)數(shù)據(jù),但對(duì)于某些觀(guān)測(cè)數(shù)據(jù),被解釋變量y被壓縮在一個(gè)點(diǎn)上,如專(zhuān)利擁有量或者企業(yè)研發(fā)投入強(qiáng)度的很多樣本值為0,這類(lèi)觀(guān)測(cè)值占據(jù)了相當(dāng)?shù)谋壤.?dāng)然,tobit對(duì)樣本分布有很強(qiáng)的依賴(lài)性,不夠穩(wěn)健。如果被解釋變量為歸并數(shù)據(jù)且為連續(xù)變量時(shí),此時(shí)建議作者采用OLS模型,然后在后續(xù)穩(wěn)健性部分中應(yīng)用tobit模型;如果被解釋變量為歸并數(shù)據(jù)且為計(jì)數(shù)數(shù)據(jù)變量時(shí),此時(shí)建議作者采用poisson模型,然后在后續(xù)穩(wěn)健性部分中應(yīng)用tobit模型。對(duì)于被解釋變量為歸并數(shù)據(jù)時(shí)的內(nèi)生性問(wèn)題的工具變量法,通常采用tobit模型對(duì)應(yīng)的工具變量法IVtobit模型。
到此,本文基本上介紹了實(shí)證分析中最常見(jiàn)的幾種模型,掌握他們有助于我們?nèi)ジ玫匕盐漳J皆O(shè)計(jì)的基本思路。
聯(lián)系客服