2008年3月1日 星期六

非實驗研究(non-experimental research)

實驗與非實驗研究的差別在於前者有研究者所操縱的介入措施(manipulation of intervention),後者沒有。在非實驗研究中,研究者不去干預被研究者或所關切的現象,而讓介入措施在自然的情況下發生,在事後或從旁收集資料,來進行分析,以試圖了解其中的關係。因此非實驗研究有時也被稱為「觀察式研究」(observational study),社會科學和健康照護服務大多數的研究都是屬於非實驗研究。非實驗研究又可以分為兩大類,一類是關連性研究(correlational research),另一類是描述性研究(descriptive research)。

關連性研究最大的特色就是探討事情發生以後的現象,比如我們想了解健保開辦後,國內的健康差距(health disparity)有沒有縮短[1]?在此一研究中,政府開辦健保形成了一個措施或事件,產生一個自變數,讓研究者能夠去探討這個事件是否對我們所關心的結果(國內的健康差距)有影響,以及兩者的關係是如何。

關聯性研究可以告訴我們兩個或多個因素之間是否有關連性(correlation/ association),但是卻不太能明確指出其中的因果關係(causality)。假如我們發現健保開辦十年之後,國內的許多健康差距指標有縮小的情況,我們只能說這兩者之間有關連,但是我們還是不能肯定說健保的實施就是健康差距縮小的原因。

因果關係的證實(比如我們要證明A是造成B的原因),必須同時滿足三個條件:
(1) 相關性:A與B之間必須要有實證上或統計上的相關性,如果A與B是各自獨立的事件,那A就不可能是B的原因,此一因果關係是不存在的。
(2) 時間性或方向性: A必須在B之前發生或存在,或至少影響的進行關係是由A到B。如果B在A之前就出現,那A就不可能是B的原因。
(3) 排除其他可能因素的影響。A與B之間的相關性不能再被其他因素所解釋或引起。
在前面所提到的例子中,條件(1)與(2)是滿足了,但是條件(3)可能還有待商榷。因為其它衛生政策也有可能影響國內城鄉健康差距的縮小,而不見得是實施健保的結果,除非我們能夠排除其他所有可能的影響因素。

由於非實驗研究沒有主動去操縱或控制研究的進行,因此可能有許多因素同時存在並且產生互動,所以要同時符合以上三個條件事實上是非常困難的,也因為如此,關連性研究對於因果關係的證實能力是相當薄弱的。

對於這個缺陷,目前有四種加強非實驗研究的因果關係解釋能力的方法:

一、 自然實驗(natural experiments)
自然實驗有愈來愈被廣泛運用的趨勢,但是有時候引起的爭議也不小。自然實驗主要是透過一些不是人所能控制的事件,去形成自然的介入措施。因為這些”自然[2]”事件的影響對象應該是不分性別、種族、年齡等的,所以等於不只提供了介入措施,還自然地幫我們進行了隨機分配,造成了一個類似隨機控制實驗的設計。

自然實驗的例子有像911事件對紐約市民宗教信仰態度影響的研究;神戶大地震對人們儲蓄習慣的改變;美國越戰期間被抽籤而上前線服役的軍人退伍後的所得是否有所影響(抽籤就是一個自然事件)等等。

一般來說,非實驗(觀察式)研究最容易被詬病的地方,在於因果之間的互動方向不容易確立(因果倒置)的問題,到底是因造成果,還是果引起因,單單從觀察式的橫斷性研究中看不出來。自然實驗的優點,在於這些自然事件不是人所能控制的,因此所形成的自變數不可能是我們所要探討的結果所造成的。因此在因果關係準則中的因果方向或時間順序上顯得比較明確。如果再加上該事件所形成的「假隨機分配」(pseudo randomization)很理想的話,那就更有說服力。

有兩位著名的學者Newhouse和McClellan曾用IV的自然實驗方法去研究血管內視鏡檢查以及後續心導管、氣球擴張術等處置對急性心肌梗塞(AMI)病人死亡率的影響[3]。如果用傳統的方法,直接去比較有接受這些處置與沒有接受這些處置的AMI病人的死亡率,最大的問題是這兩組病人的基本條件(年齡、性別、曾患其它相關疾病等)並不相同,因此比較的基準不一樣,所做出來的比較並不客觀。因此他們改藉由一個工具變數(IV)來探討這個問題,他們所用的工具變數是AMI1病人從最近的急診醫院到下一個可以從事血管內視鏡檢查以及後續心導管、氣球擴張術等處置的醫院的相差距離(differential distances)。這個變數對AMI病人的死亡率沒有影響,但與AMI病人接受進一步血管內視鏡檢查以及後續處置的機會有很大的決定作用;而且透過這個變數可以將AMI病人進行隨機分組,因為對這些病人來說,這個相差距離是一個隨機亂數(不是由他們或研究者刻意造成的)。他們以相差距離的長短將病人分為兩組,果然這兩組病人除了接受血管內視鏡檢查以及後續處置的比例不同之外,其它基本條件大致都很類似。因此比較這兩組AMI病人的死亡率比傳統的研究設計更能看出血管內視鏡檢查以及後續處置的有與無的差別。這是運用IV從事自然實驗的一個實例。

二、 回顧式非實驗設計(retrospective non-experimental designs)
回顧式研究在流行病學界很常見,如果研究人員要探討造成幼童自閉症的原因,可以找來兩組幼童,其中一組幼童(案例組cases)已經確定診斷出自閉症,另一組(控制組controls)則是沒有自閉症的幼童。然後研究者以回溯的方式,去找這兩組幼童有哪些顯著差異的因素是有可能造成不同結果(有或無自閉症)的原因。假設研究者發現個案組幼童大多有長期接觸電視的經驗,且情況顯著高於控制組幼童,那接觸電視是一個可能的因素。不過在做出具體結論之前,研究者要確定這兩組幼童在其它可能因素上有相似的特質。比如我們也猜想幼童所居住的社區與家中的環境可能是一個影響因素,那我們就要找來兩組家中環境相似的幼童,但一組幼童有自閉症,另一組沒有,這樣才能了解社區或家中環境這項因素是否有影響。如果無法找到這樣的兩組幼童,那研究者必須收集社區或家中環境這項變數的資料,透過回歸模式去加以控制,以呈現在這項因素情況都相同的狀況下,主要的可能原因(接觸電視)對結果是否仍有顯著的影響或解釋能力。

三、前瞻式非實驗設計(prospective non-experimental designs)
相對於回溯式研究的另一種方式是前瞻式研究設計,這時研究者找來兩組都未曾被診斷出自閉症的幼童,但其中一組在家中經常接觸電視(曝露組),另一組在家中不常(或不曾)接觸電視(控制組),然後研究者長期追蹤這兩組幼童發生自閉症的情況,瞭解曝露組幼童是否有顯著較高的自閉症發生率。一般來說,前瞻式研究比回溯式研究更能提供我們解釋因果關係的證據,而且較容易控制可能的外部影響變數。但是前瞻式研究需要較大量的研究樣本數,特別是當我們所探討的疾病的發生率很低或案例很少的話;而且前瞻式研究較耗費耗時;另外,研究者還要確定兩組中的幼童在研究開始的時候真的都沒有自閉症,不能有已經有潛在疾病,只是還未診斷出來這樣的情況。

四、 因果關係模型(Causal Modeling)
這個方法主要包括較簡單的「途徑分析」(path analysis)與較複雜的「線性結構關係分析」(Linear structural relations analysis, LISREL)這兩種,共通之處是運用統計方法,去同時探討眾多可能變數之間的互動途徑或因果關係,目前已經有幾個較被廣泛使用的電腦軟體幫研究者進行這樣的分析。更具體一點來說,研究者先將根據自己的假設所建立的互動關係模式輸入應用軟體中,然後再輸入各項變數的資料或餵資料給該應用軟體,電腦便會去分析我們所提供的資料,據此去檢驗我們所預設的關係模式與資料的符合程度。這個方法對我們所探討的問題或現象有眾多互動因素時特別有幫助,因為它可以測試整個系統的運作模式,不單是考慮兩個因素之間的關係而已,因此蠻適合用來研究研究社會科學的問題。但是運用此方法的前提是研究者必須對各個變數之間的互動關係已經有一定的掌握或心中已經有可能性很高的假設,否則無法建立適當的因果/互動模式給電腦去進行分析。

非實驗研究的另一大類是描述性研究,這一般又分為「描述性關連性研究」(descriptive correlational studies)以及「單一變數的描述性研究」(univariate descriptive studies)。前者主要目的只是想描述不同因素之間的可能相關性,而沒有試圖要去解釋這些因素之間的因果關係。比如我們去描述醫院的文化與病人安全是否有關係,但不深入去證實這兩者之間是否有因果關係;我們可以從觀察不同文化的醫院所呈現出來不同的病人安全措施去描述,也可以從強調病人安全對醫院文化的影響去討論,或者去討論醫院文化與病人安全都有相關的第三個因素。

單一變數的描述性研究是就我們所關切的單一因素去進行。在流行病學中,疾病的發生率(incidence)和盛行率(prevalence)便是最佳的例子。有些流行病學學者一直在研究某一種疾病的發生率或盛行率,讓人了解該種疾病的出現頻率、地區等等;也有些經濟研究人員一直在調查及計算某些物價指數,公布給政府、學界或社會各界知道。

事實上,非實驗性研究的發現(因素之間的相關性)經常可以做為實驗研究的探討問題,提供實驗研究的方向或素材。可是有時候實驗研究在一些健康相關或醫學研究上不可行,比如我們不太可能為了探討長期接觸電視是否會觸發幼童自閉症,找來一群幼童,隨機分配到實驗組(給他們天天接觸電視)和控制組(不讓他們接觸電視),然後再比較兩組的自閉症發生率是否有顯著差別。有些社會現象也根本無法在實驗室裡面複製或控制,因此就得靠非實驗研究來探討。

在有些方面,非實驗研究要比實驗研究來得理想,像是比較經濟、可行,而且其外部效度通常比較高。實驗研究經常被批評為太過人工化,因為經過人為刻意的操作,而非實驗研究比較沒有這樣的問題。一般認為,實驗研究的內部效度較高,因為有盡可能控制干擾因素;但其外部效度較低,因為是在特殊的實驗情況下所得到的結論,不容易擴大應用到其他的場合。而非實驗研究的情況則相反,其內部效度較低,但外部效度較高。瞭解這兩大類研究設計的利弊,有助於我們根據所關切的議題,選擇最適合的研究設計來進行我們的研究。

[1] 比如原住民與平地人的預期壽命有沒有拉近;都市與鄉村的死亡率差異情況是再增加還是減少?
[2] "自然”事件不一定都是大自然所造成的,只要是非人為所能控制的,都可以視為自然事件。
[3] Newhouse, JP and McClellan M. 1998. Econometrics in Outcomes Research: The Use of Instrumental Variables. Annual Review of Public Health 19:17-34.

沒有留言: