免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

R語言結構方程SEM中的power analysis 效能檢驗分析

 拓端數(shù)據(jù) 2021-07-19

原文鏈接:http:///?p=23085 

簡介

本文對結構方程模型進行效能分析。

本文從一些簡單的例子開始。其余部分提供了一些關于統(tǒng)計背景的說明,各種效應大小的定義,以及本包所含函數(shù)的詳細描述。

背景介紹

數(shù)學模型的統(tǒng)計評價通常是通過考慮測試統(tǒng)計量來進行的,測試統(tǒng)計量表示觀察數(shù)據(jù)和擬合模型的數(shù)據(jù)之間的差異。在SEM中,大小為N的樣本的相關測試統(tǒng)計量由T = F?(N - 1)給出。F?表示所選差異函數(shù)(如最大似然)的最小化樣本值,從而表明模型與樣本數(shù)據(jù)的不匹配。因此,T允許對模型正確的無效假設(H0)進行似然比檢驗。如果假設的模型在總體中成立,可以證明T在漸進上遵循中心χ 2(df)分布,df=.5-p(p+1)-q自由度,其中p是表現(xiàn)變量的數(shù)量,q表示自由參數(shù)的數(shù)量。這就是為什么T經(jīng)常被稱為 "卡方模型檢驗統(tǒng)計量"。

給出一個卡方檢驗統(tǒng)計量的觀察值,可以進行一個無效假設的顯著性檢驗。通常的檢驗過程如下。給定一個特定的α-誤差水平(通常是α=0.05),從漸近中心χ 2(df)分布中得到一個臨界卡方值。如果卡方檢驗統(tǒng)計量的觀察值超過臨界值,則拒絕模型符合數(shù)據(jù)的無效假設。否則,H0被保留。發(fā)現(xiàn)觀察統(tǒng)計量超過臨界值(意味著上尾概率低于指定的α水平),就會導致統(tǒng)計學上的判斷,即假設和實際人口協(xié)方差矩陣之間的差異太大,不能僅僅歸因于抽樣誤差。因此,具有統(tǒng)計學意義的卡方檢驗統(tǒng)計數(shù)字提供了反對假設模型有效性的證據(jù)。

當使用這個框架測試統(tǒng)計假設時,會出現(xiàn)兩種類型的錯誤。不正確地拒絕一個真正的H0(一個正確的模型)的α錯誤(或I型錯誤)和不正確地保留一個錯誤的H0(一個錯誤的模型)的β錯誤(或II型錯誤)。

如果H0為假,則卡方檢驗統(tǒng)計量不再是中心χ 2(df)分布,而是可以證明遵循非中心χ 2(df,λ)分布,具有非中心性參數(shù)λ和期望值df + λ(MacCallum, Browne, & Sugawara, 1996)。非中心性參數(shù)λ將非中心χ 2(df,λ)分布的期望值移到相應中心分布的右邊。在確定了與中心χ 2(df)分布的期望α概率相關的臨界值之后,可以通過構建具有一定非中心性參數(shù)λ的相應非中心χ 2(df,λ)分布并獲得該分布向右的面積(即。相應地,統(tǒng)計效能是非中心χ 2(df,λ)分布在臨界值右邊的面積(即積分)。一般情況如圖1所示。

圖1描述了中心(實線)χ 2(df)和非中心(虛線)χ 2(df,λ)分布,df=200,λ=100。中心分布χ 2(df)在臨界值右側的面積反映了α誤差。實線表示臨界值為234,對應于α=0.05。虛線表示從折衷效能分析中得到的臨界值為244,與α=0.018有關。臨界值左邊的χ 2(df,λ)分布區(qū)域是β-錯誤概率(臨界值234和244的β=0.006和β=0.018)。統(tǒng)計效能定義為1-β,即臨界值右邊的非中心χ 2(df,λ)分布下的面積。

衡量標準

為了定義H0和H1模型之間的差異,可以使用任何基于非中心性的效果測量。

F0

F0是最大似然擬合函數(shù)的總體最小值,定義為

其中Σ是p總體協(xié)方差矩陣,Σ?是p模型隱含的協(xié)方差矩陣,p是觀測變量的數(shù)量。如果模型是正確的,Σ?=Σ,F(xiàn)0=0。否則,F(xiàn)0>0,數(shù)值越大,表示模型與數(shù)據(jù)的差異越大(不匹配)。

RMSEA

近似根均方誤差(RMSEA;Browne & Cudeck, 1992;Steiger & Lind, 1980)通過模型的自由度來衡量F0。

使RMSEA以零為界,較低的值表示較好的擬合。隱含的F0是: 

用RMSEA來定義一個效應需要說明自由度。

Mc

Mc(McDonald,1989)是F0在0-1區(qū)間上的變換,數(shù)值越大表示越適合。

GFI

擬合指數(shù)(GFI;J?reskog & S?rbom, 1984;Steiger, 1990)在0-1的區(qū)間內(nèi)對F0進行標度,數(shù)值越高表示擬合度越好。 

由于GFI取決于觀察變量的數(shù)量(p),在用GFI定義效能時需要提供這個數(shù)字。

AGFI

調(diào)整后的擬合指數(shù)(AGFI;J?reskog & S?rbom,1984;Steiger,1990)對GFI進行了修改,包括對自由參數(shù)數(shù)量的懲罰,由模型的自由度來衡量。

用AGFI來說明效果,需要同時說明觀察變量的數(shù)量(p)和模型的自由度(df)。

不基于非中心性的方法

不基于非中心性的擬合指數(shù)與F0沒有直接的關系,因此不太適合于效能分析。但是,如果通過H0和H1協(xié)方差矩陣來定義效應,至少可以計算出度量。

SRMR

標準化根-均方殘差(SRMR)是對(標準化)模型和總體協(xié)方差矩陣之間平均(平方)差值的衡量,因此它的范圍是0到1,數(shù)值越小表示擬合度越高。設E0為模型隱含與人群協(xié)方差矩陣之間的差值,E0=Σ-Σ?,vech表示矢量化變換,Q為維度為.5p(p+1)的對角矩陣,包含觀測變量i和j的標準差的乘積的逆值,那么,SRMR可以定義為

殘差矩陣E0與F0的關系很復雜,取決于模型隱含的協(xié)方差矩陣,所以SRMR不太適合用F0來定義效應(基于ML估計)。

CFI

比較擬合指數(shù)(CFI)是一個增量指數(shù),表示假設模型(F0H)相對于空模型(F0N)的不合適比例減少,空模型被定義為一個將所有協(xié)方差約束為零的模型。在總體中,CFI的范圍是0到1,數(shù)值越高表示越適合。

雖然從CFI獲得F0很簡單,但這需要知道F0N,而這是很難先驗確定的。

Power Analysis效能分析

進行效能分析時,一般需要說明要檢測的效應的量度和大小,并提供模型的自由度。根據(jù)效能分析的類型,還需要進一步的論據(jù)。本節(jié)假設效應是以上述方法之一來指定的,如何借助模型隱含的和總體協(xié)方差矩陣來定義效應。

A-Priori:確定所需的N,給定α、β、效應和df

先驗效能分析的目的是在給定的α誤差下,確定檢測一個效應所需的樣本量。在結構方程模型的語言中,先驗能力分析問的是:"我需要多少個觀測值才能達到效果?如果我的模型實際上是錯誤的(在所選效應定義的范圍內(nèi)),我需要多少個觀測值才能以X%的概率(力量)來證偽我的模型?

進行先驗的效能分析需要指定α誤差、所需的效能(或者,等同于可接受的β誤差)、效應的類型和大小以及模型df。根據(jù)所選擇的效應大小指標,可能還需要定義觀察變量的數(shù)量。 

假設,我們想要檢測一個模型(涉及df=100個自由度)的錯誤說明所需的樣本量,在α誤差為0.05的情況下,效能為80%,其中失擬量對應于RMSEA=0.05。將結果存儲在一個名為ap1的列表中。

effect = .05, effect.measure = 'RMSEA',
alpha = .05, power = .80, df = 100

在ap1上調(diào)用總結方法,輸出結果和相關的中心和非中心卡方分布圖 

這表明N=164產(chǎn)生了大約80%的效能來檢測指定的效果。輸出結果進一步顯示了臨界Chi-Square,非中心性參數(shù)(NCP),以及錯誤概率之間的比率(隱含Alpha/Beta比率)。在這個例子中,阿爾法和貝塔之間的比率是0.25,表明犯Beta錯誤的可能性是犯Alpha錯誤的四倍。這顯然是所選輸入?yún)?shù)的結果,因為0.80的效能(1-β)意味著0.20的β誤差,是所選0.05的α誤差的四倍。

effect = .05, effect.measure = 'RMSEA',
alpha = .05, power = .80

現(xiàn)在我們也得到了RMSEA=0.05的GFI和AGFI等效值,假設df=100,p=20。當然也可以不指定所需的效能,而是指定可接受的β誤差。例如,調(diào)用

effect.measure = 'RMSEA',
alpha = .05, beta = .20, df = 100, p = 20

給出了與上述相同的輸出。如果你對一定范圍內(nèi)的樣本量的效能變化感興趣,要求提供效能圖是很有用的,下面會詳細說明。

事后分析Post-hoc:給定α、N、效應和df,確定達到的效能

事后效能分析的目的是確定在給定的樣本量下,在一定的α誤差下檢測特定效應的實際達到的效能。用結構方程模型的語言來說,事后效能分析問的是:"在我手頭的樣本中,有多大?在我手頭的樣本中,如果我的模型確實是錯誤的(至少在所選效應定義的范圍內(nèi)),那么偽造我的模型的概率(力量)有多大?進行事后效能分析需要明確阿爾法誤差、樣本量、效應的類型和大小以及模型df。同樣,根據(jù)所選擇的效應大小指標,可能還需要定義觀察變量的數(shù)量。假設,我們希望在樣本量為N=1000的情況下達到的效能能夠檢測到模型(涉及df=100自由度)的錯誤,α誤差為0.05,其中錯誤擬合量對應于RMSEA=0.05。我們將結果存儲在一個名為ph1的列表中。

posthoc(effect = .05, effect.measure = 'RMSEA',
alpha = .05N = 1000

在ph1上調(diào)用總結方法,顯示效能非常高(效能>.9999)。相關的誤差概率是以更高的精度提供的。具體來說,β誤差為β=2.903302e-17,轉化為2.9-10-17=0.000000000000000029。在實踐中,在這些條件下,一個RMSEA>=.05(或F0>=0.25或Mc<=.882)的模型很不錯。隱含的α/β比率是1.722177e+15,表明犯α錯誤的可能性是犯β錯誤的2萬億(1015)倍。如果你對一系列不同程度的效果(例如,對于RMSEA從0.01到0.15)的效能變化感興趣,要求提供效能圖是很有用的,下面會詳細說明。

折衷效能分析:給定α/β比率、N、效應和df,確定α和β

折衷效能分析的目的是在給定的效應、一定的樣本量以及期望的α和β比率的情況下,確定α和β(以及相關的卡方檢驗統(tǒng)計量的臨界值)(Moshagen & Erdfelder, 2016)。用結構方程模型的語言來說,折衷分析問的是:"在我手頭的樣本中,應該如何處理?在我手頭的樣本中,我應該如何選擇卡方模型檢驗的臨界值,來決定我的模型是與完全擬合的假設相一致時獲得相應的α和β誤差?

假設,我們想確定臨界卡方和相關的α和β誤差,使它們相等(即比率為1)。我們的模型涉及100個df,我們的樣本量為N=1000,我們將不可接受的不合適H1模型定義為RMSEA至少為0.08的模型。將結果存儲在一個名為cp1的列表中。

compromise(effect = .08, effect.measure = 'RMSEA',
 N = 1000df = 100)

結果顯示,選擇臨界Chi-Square=312與平衡錯誤概率有關,α=1.2e-23和β=1.2e-23。按照要求,這兩個錯誤概率都一樣大。如果出于某種原因,你希望錯誤概率不同(例如,因為你認為錯誤地接受一個不正確的模型比錯誤地拒絕一個正確的模型要差100倍),你可以改變abratio參數(shù)。例如,要求α誤差是β誤差的100倍,可以通過設置 abratio = 100 來實現(xiàn)。

compromise(effect = .08, effect.measure = 'RMSEA',
abratio = 100N = 1000df = 100)

Power Plots效能圖

效能圖顯示了隱含的效能與其他一些變量的關系。你可以繪制在不同樣本量范圍內(nèi)檢測某一效應的實現(xiàn)效能?;蛘撸憧梢栽诮o定的N下繪制達到的效能,以檢測不同效應大小的范圍。

確定給定效應的效能是N的函數(shù)

創(chuàng)建了一個圖,顯示了在一定的樣本量范圍內(nèi)檢測一個給定的效應的達到的效能。然而,由于很難指定給定效應的診斷樣本量,我們需要提供所需的效能范圍。例如,假設我們對檢測RMSEA=.05的效應的效能如何隨N的變化而變化感興趣,我們對從.05到.99的效能感興趣(注意效能不能小于α)。可以通過設置參數(shù)power.min = .05和power.max = .99來實現(xiàn)。此外,與任何先驗的效能分析一樣,需要定義效應的類型和大小、df和α誤差。

powerPlot

這表明,當N>250時,一個相關的RMSEA=0.05的模型被拒絕的效能非常大,而當N<100時,效能就很小。

在給定的N下,確定效能與效應大小的函數(shù)關系

創(chuàng)建了一個圖,顯示在給定的樣本量下,在效應大小范圍內(nèi)達到的效能。例如,假設我們對N=500時的效能如何隨效應大小的變化而變化感興趣,對應的RMSEA范圍是0.001到0.10。此外,與任何事后效能分析一樣,需要定義樣本量、df和α誤差。

PlotEffect

這表明,在N=500的情況下,一個相關的RMSEA>0.04的模型被檢測到的效能非常大,而RMSEA<0.03的效能則相當小。

參考文獻

· Browne, M. W., & Cudeck, R. (1992). Alternative ways of assessing model fit. Sociological Methods & Research, 21, 230–258.

· J?reskog, K. G., & S?rbom, D. (1984). LISREL VI user’s guide (3rd ed.). Mooresville: Scientific Software.


    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多