最近十年中,各類因果推斷方法層出不窮。令人欣喜的同時,也讓很多人無所適從。雖然借助 Stata,R,Python 等軟件很容易「跑出」結(jié)果,但很多人應(yīng)該都經(jīng)歷過如下「囧境」:
根源何在?可能是沒有清晰地理解「基本概念」,比如條件期望,條件獨立,無偏性以及 FWL 定理等?;A(chǔ)不牢,便會導(dǎo)致舉步維艱。事實上,一旦理清基本概念和模型,后續(xù)的 Lasso,雙重機器學(xué)習(xí) (DML) 等聽起來很高深的東西都不再困難,因為它們都是基礎(chǔ)知識和理論的組合和延伸而已。 莊子所言「水之積也不厚,則其負大舟也無力」也正是這個意思。 為此,強基班 的目的在于鞏固基礎(chǔ),理清 條件期望函數(shù),條件獨立,反事實架構(gòu),選擇偏差 等基本概念;理解 識別、估計 和 統(tǒng)計推斷 的差別。進而在因果推斷的架構(gòu)下講解 OLS,IV,F(xiàn)E 以及 DID 等方法,讓大家能夠「選擇合適的方法、做出合理的解釋」。
目錄
1. 引言在實證分析領(lǐng)域,我們經(jīng)常思考現(xiàn)有假設(shè)的準確性與完整性,以及我們能夠多大程度上完整地敘述整個故事。因此,我們常常會借助異質(zhì)性分析和機制分析來深入研究差異,并解釋內(nèi)在的因果關(guān)系。然而,雖然這兩種方法有助于揭示現(xiàn)象背后的本質(zhì),但它們也并非毫無缺陷。 一方面,異質(zhì)性分析在探索變量之間關(guān)聯(lián)時,雖然能夠揭示出相關(guān)性,但相關(guān)性并不總是等同于因果關(guān)系。這可能會忽視背后潛在的因果機制,從而限制了對現(xiàn)象深層次理解的可能性。 另一方面,機制分析深入挖掘事件的因果鏈條,雖然能夠幫助理解事件的根本原因,但大量的觀察和閱讀文獻尋找可能的解釋變量往往需要耗費更多時間和資源,而且可能受到研究者主觀判斷的影響,引發(fā)不確定性。 為克服上述方法的限制,本文將探討競爭性假設(shè)檢驗 (Analysis of Competing Hypotheses,ACH)。該方法通過比較多個可能的解釋或假設(shè),協(xié)助研究者選擇最具可能性的解釋,從而為強化因果關(guān)系和完善機制分析提供新的思路。 2. 什么是競爭性假設(shè)檢驗競爭性假設(shè)分析 (Analysis of Competing Hypotheses,ACH) 最早由美國中央情報局 (CIA) 的情報分析師在 1980 年代末提出,并在 1997 年公開發(fā)表。 作為一種基于認知心理學(xué)、決策分析和科學(xué)方法的結(jié)構(gòu)化方法,實證分析中的競爭性假設(shè)分析能夠有效評估和權(quán)衡多個可能的解釋和假設(shè),從而減少認知偏見,提升分析準確性,并實現(xiàn)多維解釋。 在建立假設(shè)或選擇解釋變量和控制變量時,不論是從既定的問卷調(diào)查、統(tǒng)計年鑒,還是自行收集數(shù)據(jù),我們經(jīng)常需要在眾多變量中做出選擇。然而如何綜合考慮每一個變量和假設(shè)卻頗具挑戰(zhàn)。 通常我們會傾向于選擇直覺上可能成立的假設(shè),并從支持這一假設(shè)的角度來分析現(xiàn)有信息。然而,這種方式容易導(dǎo)致認知偏見的產(chǎn)生。為了避免這一問題,技術(shù)手段上我們可以采用諸如 Lasso 等方法。 此外,競爭性假設(shè)分析可以在思維層面上對我們進行幫助。通過這種方法,我們可以系統(tǒng)性地構(gòu)建和比較各種可能的解釋和假設(shè),而不僅僅局限于直覺上的傾向。這種方法有助于防止個人偏好或預(yù)設(shè)觀點對分析過程的影響,從而更加客觀地評估每個假設(shè)的優(yōu)劣。 3. 競爭性假設(shè)檢驗在實證中的作用提出的競爭性假說可能正確,也可能錯誤。正確的假設(shè)能夠提供多方面的解釋,這時實證檢驗不僅是爭性假說的驗證,也是機制分析。而錯誤的假設(shè)則類似于“反彈琵琶”,即提出一個競爭性假設(shè),然后將其納入模型中進行驗證。如果競爭性假設(shè)無法 (完全) 解釋已有的因果關(guān)系,那么這表明基準結(jié)果很可能是正確的。 3.1 完善機制分析多維度探索可以為解釋事件的因果關(guān)系提供更有力的支持。 在使用截面數(shù)據(jù)的經(jīng)典論文 The Slave Trade and the Origins of Mistrust in Africa 中,面對“奴隸貿(mào)易是否導(dǎo)致那些接觸到它的人的后代變得不那么信任他人“這一問題,作者提供兩個假設(shè):
為了區(qū)分這兩種可能性,研究采用了三個檢驗。 在第一個檢驗中,作者檢驗了個人對當?shù)卣瘑T會的信任。通過檢驗個人對當?shù)卣瘑T會的信任,作者發(fā)現(xiàn)即使同時控制對地方議會評價的三個變量,奴隸出口和信任之間的關(guān)系仍然是負的并且高度顯著 (下表第 1-2 列) 。另一方面,被奴隸貿(mào)易影響更嚴重的個體,對當?shù)卣男湃味雀汀R虼?,在估計的奴隸貿(mào)易與信任之間的關(guān)系中,不能完全用地方議會信譽的惡化來解釋。 在第二個檢驗中,作者進一步通過內(nèi)部信任規(guī)范的改變和他人的可信賴性的改變來區(qū)分奴隸貿(mào)易的影響。對于每個觀測值,作者計算了居住在受訪者所在城鎮(zhèn)、地區(qū)或地區(qū)的不同民族的奴隸出口強度的平均值。這項指標旨在捕捉奴隸貿(mào)易對居住在其附近的其他種族的可信度的任何影響。 從下表的 3-5 列中我們可以看出,在控制了奴隸貿(mào)易對信任的影響后,奴隸貿(mào)易對群體間信任的負向效應(yīng)具有穩(wěn)健性。然后,作者通過控制奴隸貿(mào)易對同一地區(qū)不同民族的影響,進一步證明了奴隸貿(mào)易對群體間信任的負面影響。 在第三個檢驗中,作者通過構(gòu)建了基于種族和基于位置的奴隸出口變量,以區(qū)分奴隸貿(mào)易通過內(nèi)部規(guī)范和外部環(huán)境對信任的影響后發(fā)現(xiàn),奴隸貿(mào)易主要通過影響個體的內(nèi)部規(guī)范和信仰來影響信任水平 (下表第 2 行) 。 通過競爭性假說,作者驗證并完善了奴隸貿(mào)易對信任的影響機制。 3.2 強化異質(zhì)性分析的因果關(guān)系引入新的競爭性假說并將其納入模型驗證,若該新假說無法充分解釋已確定的因果關(guān)系,這可能意味著已有的因果關(guān)系具有可靠性。 例如,Brown (2011) 驗證了在錦標賽機制中,超級明星的參與對其他選手的競爭意愿的影響 (因為有超級明星存在,其他選手可能會感到自己只是陪襯) 。然而,在進行實證分析時,出現(xiàn)了一種競爭性的假設(shè):超級明星可能只參加較難的比賽,其他選手表現(xiàn)較差可能是由于比賽的難度造成,而不是超級明星的影響。 為了解決這個問題,作者將選手按排名分為高、中、低三個層次。如果選手表現(xiàn)下降可以歸因于比賽難度,那么可以預(yù)期低水平選手會受到更大影響,即系數(shù)更大。然而,回歸結(jié)果卻出現(xiàn)截然相反的情況:高水平選手受到的影響更大且在統(tǒng)計上顯著,而低水平選手的影響較小且統(tǒng)計上不顯著 (下表第 1 行)。實證結(jié)果與競爭性假設(shè)完全背道而馳,進一步加強了原有的論述。 4. 競爭性假設(shè)檢驗的基本步驟第一步確定假設(shè):確定所有可能的假設(shè)。為了從眾多的假設(shè)中提煉出有利于實證研究的競爭性假設(shè),可以借助頭腦風暴的方法,提出所有可能的假設(shè)。在篩選看似不太可能的假設(shè)時,有必要區(qū)分那些似乎已被反駁的假設(shè)和那些根本未經(jīng)證實的假設(shè)。 在早期階段就拒絕未經(jīng)證實但尚未被反駁的假設(shè),可能導(dǎo)致后續(xù)分析產(chǎn)生偏見,因為我們錯過了可能支持這些假設(shè)的證據(jù)。在這個階段,無需過多考慮最終的“正確”假設(shè)數(shù)量。當然,當假設(shè)數(shù)量超過 7 個時,可以將幾個相近的假設(shè)組合在一起,以便更高效地進行分析。 第二步列出證據(jù)與論點:列出支持和反對每個假設(shè)的重要證據(jù)和論據(jù)。首先,列出適用于所有假設(shè)的一般證據(jù),接著單獨審視每個假設(shè),詳細羅列可能支持或反駁該假設(shè)的因素。與此同時,務(wù)必注意證據(jù)可能存在缺失的情況。 第三步構(gòu)建一個矩陣:構(gòu)建一個矩陣,列出每個假設(shè)以及支持和反對它的證據(jù)。 構(gòu)建矩陣是競爭性假設(shè)檢驗的核心環(huán)節(jié)。首先,將第一步的假設(shè)和第二步的證據(jù)與論點分別列在矩陣的頂部和左側(cè)。其次,分析每一項證據(jù)與每一個假設(shè)之間的關(guān)系,考慮該證據(jù)與每個假設(shè)的一致性。然后,在矩陣中每個假設(shè)下的相應(yīng)單元格內(nèi)標記一致性 (C)、不一致性 (I) 或不適用 (N/A)。 在下圖的例子中,我們設(shè)想一個關(guān)于伊拉克是否會對 1993 年美國轟炸其情報總部進行報復(fù)的情景??梢钥吹剑C據(jù) E1 與所有假設(shè)一致。換句話說,它沒有辨識價值。這是因為我們對薩達姆在這個問題上的公開聲明不給予足夠的信任。他可能說不會報復(fù),但最終卻報復(fù)了;或者宣稱會報復(fù),但最終未采取行動。 然而,證據(jù) E4 具有辨識價值:如果伊拉克計劃報復(fù),那么更有可能觀察到伊拉克特工的無線電廣播頻率或時長增加。E6 的雙重減號表示這是一個很有力的反駁 H1 假設(shè)的論據(jù)。這個假設(shè)在支撐 H2 或 H3 假設(shè)的結(jié)論中起到關(guān)鍵作用。需要注意的是,這個矩陣所反映的一些判斷在分析的后期階段可能會受到質(zhì)疑。 在某些情況下,也可以用數(shù)值概率來表示每個證據(jù)與每個假設(shè)之間的關(guān)系。 第四步精煉矩陣:重新考慮假設(shè)并刪除沒有診斷價值的證據(jù)和論據(jù)。我們需對現(xiàn)有假設(shè)進行重新思考,考慮以下幾個方面:
第五步得出初步結(jié)論:根據(jù)對矩陣的分析得出結(jié)論,考慮支持和反對每個假設(shè)的證據(jù)的強度。 在第三步中,我們通過橫向分析關(guān)注單個證據(jù)或論據(jù),并研究它們與每一個假設(shè)的關(guān)系。而在第五步中,我們需要從整體上審視每一個假設(shè)。在評估其他假設(shè)的相對可能性時,首先要尋找能夠拒絕假設(shè)或至少確定其不可能性的證據(jù)或邏輯推論。 無論有多少信息與某個假設(shè)相符,我們都無法證明該假設(shè)為真,因為同樣的信息也可能與一個或多個其他假設(shè)相符。另一方面,與某一假設(shè)不一致的單項證據(jù)也可能成為否定該假設(shè)的充分理由。需注意的是,缺點最少的假設(shè)可能是最有可能的假設(shè),而缺點最多的假設(shè)可能是最不可能的假設(shè)。 第六步敏感性分析:考慮如果這些證據(jù)是錯誤的、誤導(dǎo)性的,或有不同的解釋,會對你的分析產(chǎn)生什么后果。在第六步中,需要回顧那些對分析結(jié)果起到關(guān)鍵作用的假設(shè)和證據(jù),質(zhì)疑其中可能存在的問題或矛盾。我們應(yīng)該檢查這些假設(shè)的基礎(chǔ)和解釋是否可靠,是否存在替代的解釋,以及是否可能出現(xiàn)證據(jù)不完整導(dǎo)致誤導(dǎo)的情況。 當然,即便某一競爭性假設(shè)是錯誤的也可以推進實證研究。例如 Brown (2011) 通過拒絕新引入的競爭性假設(shè)--比賽難度對其他選手表現(xiàn)的影響,加強了“超級明星會降低其他選手的努力程度”這一既定的因果關(guān)系。 第七步報告結(jié)論:討論所有假設(shè)的相對可能性,而不僅僅是最有可能的假設(shè)。在實證研究中,因果關(guān)系往往呈現(xiàn)復(fù)雜多樣的鏈條。為了將整個故事完整呈現(xiàn),需要綜合考慮不同的解釋變量對被解釋變量的相對影響。 例如,Nunn & Wantchekon (2011) 通過驗證奴隸出口和信任之間的關(guān)系,發(fā)現(xiàn)地方議會信譽的惡化不能完全解釋這種關(guān)系。此外,進一步的驗證表明奴隸貿(mào)易對群體間信任產(chǎn)生了負面影響,并且還證明了個體的內(nèi)部規(guī)范對信任水平的影響更為顯著。 5. 總結(jié)綜上所述,本文從競爭性假設(shè)檢驗的角度為機制分析和異質(zhì)性分析提供了一種新的思路。與常見的注重因果的機制分析和強調(diào)差異的異質(zhì)性分析不同,競爭性假設(shè)強調(diào)各種假設(shè)之間的相對可能性。然而,在所有方法中,理解因果關(guān)系仍然是關(guān)鍵,以便解釋現(xiàn)象并找出最有可能的解釋。綜合運用這些方法,有助于研究者更全面地理解復(fù)雜的社會現(xiàn)象,并提供更準確的洞察。 6. 參考資料
7. 相關(guān)推文
?
|
|
來自: 郝好961 > 《假設(shè)檢驗》