2008年9月27日 星期六

從嬰兒死亡率、肥胖症談到社經不平等

上個禮拜「健康方案評估」這門課請到VCU醫學院流行病學與社區健康研究所的Dr. Saba Masho來課堂中跟我們介紹一種較新的嬰兒死亡率的指標,叫做”Perinatal Period of Risk” (PPOR),因此我們就從不同族群之間明顯的嬰兒死亡率差別討論到一些在美國造成嬰兒死亡率可能的危險因子,包括教育及收入的差異等社經不平等的問題。剛好另外上禮拜我們研究所裡的師生午餐研討會後,Dr. Cathy Bradley邀請我與其他兩位老師與講員Dr. Robert Graboyes一起去用餐,在用餐時我們聊到美國民眾肥胖症的問題,這剛好是Dr. Graboyes很感興趣的問題,因此與Dr. Bradley有一場很精彩的討論。這兩個不同的場合分別從流行病學與健康經濟學的角度共同討論到人口健康與社經不平等的關聯性。

胎嬰兒死亡率

在瞭解與比較各個國家或地區的健康情況時,嬰兒死亡率(Infant mortality rate, IMR)是一個主要的衡量指標,其定義是每一千個活產嬰兒中,滿一歲前的死亡率。由於嬰兒的生命相當脆弱,其存活率受到遺傳、懷孕期間母親的健康與照顧狀況、產後的照顧與環境衛生的影響很大,因此嬰兒死亡率很能夠反映出一個地區整體的民眾健康狀況、生活水準與環境衛生條件。不過嬰兒死亡率在一個指標中同時涵蓋太多的健康風險影響因素,於是即使在嬰兒死亡率很高的情況下,衛生與醫療工作者仍不知道到底根本問題出在哪裡,因此對預防保健與醫療的實際應用價值很有限。

為彌補嬰兒死亡率的不足,1990年代世界衛生組織研發出「周產期[1]風險」(Perinatal Period of Risk, PPOR)指標,PPOR是將胎兒從500公克到產後滿1歲這段期間,分成幾個重要的階段,分別去計算各階段的胎兒、新生兒與嬰兒死亡率。在PPOR的計算中並沒有包括未滿500公克、懷孕未滿24週以及體重不明的死胎與死嬰。

PPOR將胎兒與嬰兒的死亡分為四類,第一類是體重介於500-1499公克之間的死胎或死嬰;第二類是體重在1500公克或以上的死胎;第三類是體重在1500公克或以上但出生後未滿28天的死嬰;第四類是體重在1500公克或以上但出生後未滿一年的死嬰。

PPOR=平均每一千個死嬰與活產嬰兒中,每一類胎兒或新生兒的死亡率
=1000*(某期間內該類的死亡數)/(同期間內所有死嬰與活產嬰兒總數)

第一類的胎兒與嬰兒死亡率主要原因是早產,這是反應出母親健康(maternal health)的問題,包括母親(當然父親也有責任)對健康偏差的觀念與行為,以及妊娠期間的照顧;第二類的胎兒死亡率主要是反應出母親懷孕期照顧(maternal care)的問題,包含產前照顧、醫療轉介,與高風險孕婦的照顧;第三類的新生兒死亡率可以反應出新生兒照護(newborn care)的問題,包括周產期的健康管理、醫療系統與新生兒科醫療;至於第四類的嬰兒死亡率主要反應出嬰兒健康(infant health)的問題,包括嬰兒睡眠姿勢、母乳哺餵與嬰兒意外傷害事件的預防。因此每個地區的衛生人員可以根據每一類胎兒或嬰兒死亡率的情形,去研判該地區哪一個環節的問題比較嚴重,而針對較嚴重的方面著手改善。

Dr. Masho以Richmond地區的PPOR資料為例,指出不同族群之間存在很明顯的差距,特別是黑人的PPOR各個指標明顯比白人高出許多,其中讓她特別憂心的是未成年少女懷孕的問題,此外她也提到在接觸新生兒死亡的相關資料時,發現有非常高的非計畫懷孕,以及很高比例的嬰兒出生證明上父親一欄是空白的。她也用各個次區域的社經情況去對照各區的PPOR指標,發現有很明顯的吻合現象,也就是比較貧窮的社區PPOR也都偏高。

Dr. Masho說他曾經到過不少中學去做性教育,有時候看到的情況讓她很傷心,有不少弱勢族群的青少年觀念偏差、缺乏責任感、自暴自棄的程度令她驚訝。甚至曾經有一位高中女生不以為然地告訴她,之所以要年紀輕輕就生小孩的原因是有小孩之後就可以向政府申請廉價住宅,這樣她就可以搬出家裡,不必與父母同住。可是完全沒有想到是否有能力可以照顧好小孩,以及未來的生活。

其實我覺得用族群所看到的PPOR的差別可能不是真正的原因,也許真正的原因是收入不平等,只是剛好不同的族群之間有很不平等的收入分配,因此我問Dr. Masho是否有比較過不同收入的群體之間PPOR的差別,她說她也是這麼猜測,可是PPOR所收集的資料中沒有收入,因此無法直接從收入去做比較。不過她個人接觸的經驗告訴她收入與教育是兩個很重要的因素,以及因此衍生出來的喪失盼望、自我肯定與缺乏愛的環境與支持系統,是表面上所看到的健康不均等的根本原因。

肥胖症經濟學

有些專家用肥胖流行病(obesity pandemic)來形容美國肥胖症普遍與嚴重的情況。根據美國疾病管制局(CDC)的公布資料,美國成人肥胖人口(BMI≥30)已經高達三分之一;此外,若以體重超過標準(overweight,25≤BMI<30)與肥胖加起來的情況來看,平均每三個人,有兩個人已經過重或肥胖。

Dr. Graboyes說從從幾個方面來看,肥胖與經濟因素有很密切的關係。在第二次世界大戰以前,美國肥胖的人很少,那時肥胖的人大多是經濟能力或家境較好的人;現在從國際的比較來看,各個國家肥胖人口的比例似乎也與經濟指標成正比,這表示經濟能力帶給民眾較大的食物購買力,因此攝取較多的熱量,導致體重的增加;此外,經濟較好的國家也多有效率較高的食品生產技術,因此可以降低食物的價格,這些國家的民眾普遍有較高的收入,與較便宜的食物,很容易就消耗過多的食物,導致過重或肥胖。但是經常在一個國家內的分析會發現,民眾的體重與其收入卻大致有相反的走勢,也就是體重較重的民眾通常收入較低,或者收入較低的人體重較重[2],這個現象又要怎麼解釋呢?

Dr. Bradley認為在美國,很多廉價的食物(像速食、甜甜圈、洋芋片等)都是高熱量食物,相反地,強調自然、低熱量的健康食物大多較貴,因此收入較低的民眾攝取高熱量食物的機會通常會比收入較高的人來得高出許多,增加肥胖的可能性。此外,她用經濟學中的時間偏好(time preference)來解釋這個現象。時間偏好是指看重現在消費所帶來的效用高於未來消費的效用的程度,因此時間偏好較高的人對金錢的折舊率也較高,所以會較注重當前的消費;相反地,時間偏好較低的人會較願意將金錢留到未來再做消費,也就是比較重視長期效用,較願意投資未來。收入較高的人通常時間偏好較低,當然也有可能是因為時間偏好較低,因此較願意投資與儲蓄,因此收入較高。時間偏好較低的人也會比較注重健康,並且在消費上比較節制或慎用其收入,因此攝取過多熱量的可能性也相對較低。

用非經濟學的術語來說,收入較高的人對未來比較所有期待,也比較注重並有能力照顧自己的健康(花時間運動或花錢去健身房),因此降低肥胖的機會。相反地,收入較低的人對未來比較沒有太多的期待,傾向將目前擁有的金錢用於當前的消費,也比較不關心自己的健康,所以較容易導致肥胖。

其實我覺得胎嬰兒使亡率與肥胖症背後都有類似的根源,就是對未來所持的盼望,成長過程中或教育所得到的基本價值觀念,進而影響其與生活或健康有關的決定與行為。然而在一個社會不平等、收入差距很大的社會中,會更強化這些問題的程度,因此我們會看到即使在一個經濟發展的國家,若存在有嚴重的社經不均等的問題(如美國),通常其整體的健康指標並不會特別理想。反而是在一個社經較平等的開發中國家(如古巴),整體國民的健康指標卻讓人印象深刻。

[1] 周產期醫學會定義周產期為懷孕準備之前以及懷孕期間,直到生產完後和新生兒狀況的醫學。一般來說,周產期是指從產前5個月到產後1個月之間這段期間。世界衛生組織對周產期的界定是從懷孕滿22週(第154天,胎兒體重大約是500克)開始,到產後滿7天為止。
[2]不過有一份研究比較不同族群與性別的體重與收入的關係,發現很有趣的現象。對女性的民眾,體重與收入呈相反關係在白人特別明顯,黑人反而比較沒那麼顯著。但是對於男性來說,白人的體重並不影響其收入,甚至黑人的體重與收入呈正相關。不過對講西班牙語(中南美洲)的男性來說,體重與收入又是呈現相反的關係。

藉由雙胞胎進行Panel study

由於大部分社會科學的研究都是觀察式的研究(observational research),研究人員並不主動介入或去操控被研究對象,而是讓被研究的現象自然發生,研究者再從旁觀察或被動收集資料,進行分析比較;此外,社會科學的研究大多以人或機構為研究對象及資料來源,因此這類的研究有幾個先天上的缺點或限制:(1)由於沒有刻意透過實驗設計去導入原因並觀察之後所產生的結果,所以很難認定其中的因果關係,經常社會科學研究人員所探討的兩個變數之間的關係很可能是互為因果關係,無法確定到底誰是因誰是果;(2)觀察式的研究沒有藉由隨機分配研究對象到實驗組與對照組,因此我們缺乏客觀公平的基礎去比較實驗組與對照組的結果,因為實驗組與對照組有可能原來就存在會影響結果的差異性,研究術語稱此為干擾因素(confounding factor)或選擇偏差(selection bias);(3)由於社會科學的研究資料大多來自人或機構,資料的正確性是一個問號,這裡除了人在提供資料時會受到很多因素的影響外,人的記憶與機構資料收集與記錄的過程中也充滿很多錯誤的機會,研究人員稱此為測量錯誤(measurement error)。

在這些先天不足的情況下,迴歸分析與計量經濟學就是要透過數理與統計的原理,提供方法讓社會科學研究人員去克服/降低這些問題,盡可能使分析研究的結果達到準確的地步。如果運用得恰當,計量經濟學的模式確實是很有幫助。有不少研究藉由巧思與計量經濟學原理的搭配運用,提出讓人眼睛為之一亮的研究方法,成為社會科學研究的經典案例。最近看到一篇研究論文[1]便是一個計量經濟學教科書上經常引用的例子。

在勞動經濟學中,教育程度與收入的關係是一個古典的議題,不少經濟學者曾經研究教育程度增加是否真的對收入有所貢獻這個問題。這個問題看起來很簡單,我們只要去隨機找出一群已經在工作的人,去問他們的教育程度(接受學校教育的年數)與收入多寡,然後用任何一種統計軟體的迴歸分析就可以算出這兩者之間的關係。

可是這樣做所得到的答案可能有嚴重的偏差,主要原因有兩個:(1)測量誤差—受訪者有可能記錯或算錯自己的上學年數與收入;(2)干擾因素—受訪者的能力與家庭背景很可能會影響其收入與所受的教育,因此光從一個人的收入與教育程度的資料,我們還不能確定這個人的收入多寡是因為其教育程度所導致的,有可能其實這是由他本身的能力所造成的。可是,研究人員通常沒有一個客觀衡量個人能力的指標,而且家庭背景的資料也不容易獲得,計量經濟學稱此為忽略或遺失變數的偏差(missing variable bias或omitted variable bias)。在遺失變數偏差與測量誤差的情況下,用迴歸分析所得到的結果便有偏差。

針對遺失變數的問題,這份研究很聰明地採用了同卵雙胞胎予以克服。研究人員們到1991年美國的第16屆全國雙胞胎節活動中,訪問了146對同卵雙胞胎,因為每一對同卵雙胞胎的基因一樣,因此先天的能力一致,且家庭背景也一致。藉由計量經濟學的panel analysis,就可以將這兩個因素加以排除,其中所用的數學原理並不會太難,可以用以下的公式來了解:

(1) y1i=αXi + βZ1i + ui + ε1i
(2) y2i=αXi + βZ2i + ui + ε2i

這裡,第一個公式是在描述雙胞胎中的146位哥哥或姊姊(用1代表)的收入與各個相關變數之間的關係;第二個公式是在描述雙胞胎中的146位弟弟或妹妹(用2代表)的收入與各個相關變數之間的關係。i是代表第i對雙胞胎;y1i是指第i對雙胞胎哥哥(或姊姊)的收入,y2i則是指第i對雙胞胎弟弟(或妹妹)的收入。Xi是指第i對雙胞胎共同且可以被觀察到的因素,比如年齡、性別、家庭、父母教育程度與收入與成長環境等等。ui是指第i對雙胞胎共同但無法被觀察到的因素,如先天能力。Zi是指第i對雙胞胎可能不同且可以被觀察到的因素,比如受教育的年數,雙胞胎兄弟或姊妹上學讀書的年數有可能不同,這也是這份研究主要的自變數;因此,Z1i代表第i對雙胞胎哥哥或姊姊上學唸書的年數,Z2i則指第i對雙胞胎弟弟或妹妹上學唸書的年數。最後,ε1i與ε2i則各代表公式(1)與公式(2)的誤差,我們假設它們都是隨機亂數。

如果將公式(1)與公式(2)相減,我們會得到以下的公式:

(3) y1i - y2i = β(Z1i – Z2i) + ε1i - ε2i

很明顯地,我們將Xi與ui這些可能的干擾因素加以排除了。我們可以將公式(3)改寫成下面的公式:

(4) ∆ yi =β∆Zi +∆εi

在計量經濟學稱這樣的分析模式為「首差估算[2]」(first-difference estimation),這是panel study主要的計量模式之一。這時我們透過迴歸分析所得到的β就比較能反映教育程度與收入的關係。

現在研究人員還有一個問題要處理,就是測量誤差所造成的估算偏差。為了討論的容易,我們先用下面的公式:

(5) y =βz +ε

這裡可能有兩種測量誤差,一個是收入的測量誤差,由於收入在這個研究中是屬於應變數,所以這是屬於應變數(y)測量誤差;另一個是受教育年數(z)的測量誤差,在這個研究中是屬於自變數的誤差。應變數誤差比較容易處理,只要這個測量錯誤與教育年數沒有關聯性,那公式中的ε便涵蓋了這個誤差,不會影響β的估算結果,但會影響到標準誤差(standard error)與p值的計算。如果是自變數(受教育年數)的測量誤差,問題就比較複雜一點。

假設我們所測量到的不是真正的z,而是有包含測量誤差的z*,我們可以將z與z*的關係寫成:z*=z+ν,ν代表誤差,我們必須假設ν是一個與z(受教育年數)無關的誤差。因此:z=z*-ν,得到以下公式:

(6) y =β(z*-ν)+ε = βz* + (ε-βν)

這裡我們要特別注意(ε-βν),如果(ε-βν)與z*沒有相關,我們即使取得有誤差的受教育年數的資料z*,還是能夠估算到正確的β。可是,由於z*=z+ν,因此很明顯地,z*與ν有正相關,所以也連帶z*與(ε-βν)產生某種程度的負相關。在此情形下,我們會得到偏差的β。要解決這個問題,計量經濟學運用工具變數(instrumental variable, IV)的方法,IV必須與z*有關係,但與ν無關(也與ε無關),因此也與(ε-βν)無關。

在這篇研究中,研究人員採用的IV是在不受姊姊或哥哥的影響下,請雙胞胎妹妹或弟弟告訴研究人員其雙胞胎哥哥或姊姊的受教育年數;並同樣在不受妹妹或弟弟的影響下,請雙胞胎姊姊或哥哥告訴研究人員其雙胞胎妹妹或弟弟的受教育年數[3]。因此研究人員同時訪問雙胞胎的兄弟或姊妹,使其所提供的資料不受另一方的影響,並取弟弟所報告的哥哥受教育年數來做為哥哥受教育年數的IV,也拿哥哥所說的弟弟受教育年數來做為弟弟受教育年數的IV,帶入IV的迴歸分析模式中,以校正偏差。

用直覺的方式來理解,我們可以說當我們懷疑某一種變數的資料可能有嚴重的測量誤差時,這時我們若可以針對同樣的變數,取得另一種獨立(與前一種資料來源沒有相關)的資料來源,這第二種資料來源可以幫助我們獲得較正確的估算。比如我們想要測量一群人的身高,可是沒有精確刻度的量尺,這時我們可以採用多種簡單的測量方式,如用手掌,或用自己的身高去比量,或用目測,拿其中用手掌測量的數值來當主要的變數資料,然後再用其他方法所得到的數值來當IV。

這個研究實例給我的啟示是,一份好的研究決定於研究者的理論功力、巧思與對研究議題與對象的瞭解。其實社會科學研究所根據的資料不可能是完美的,研究的情境多半也很不理想,但是如果對這些限制有所了解,並知道理論上可以怎樣與以克服,透過精心的設計與嚴謹的分析,還是能夠得到讓人相當滿意的結果。同樣的簡單的材料,一般人可能要感嘆煮不出好菜,可是高明的廚師就是能變出令人垂涎三尺的料理。

[1] Ashenfelter, Orley and Krueger, Alan. (1994) Estimates of the Economic Return to Schooling from a New Sample of Twins. The American Economic Review 84 (5):1157-1173.
[2] 首差估算模式如果用直覺來了解,其實是當一對同卵雙胞胎兄弟收入不同,可是他們之間除了受教育的年數不同之外,其他的條件都一樣。這時我們便可以將這對雙胞胎兄弟之間收入的差異歸咎於其受教育年數的差異所造成的。
[3] 這樣做的目的是因為弟弟所說的哥哥受教育年數應該會與哥哥自己所說的受教育年數有一定的吻合(因此IV與Z*有相關),但是弟弟所提供有關哥哥的資料應該與哥哥講錯自己的受教育年數的原因沒有關聯性(因為是分開訪談)。

2008年9月21日 星期日

美國2008年總統選舉候選人的健康醫療政見

再過大約四十天就是2008年美國總統大選投票日(11月4日),雖然最近美國受到華爾街金融危機的衝擊,經濟議題分散了一些人們對將總統大選的注意力,但隨著選舉日期的逼近,選局的緊繃與激烈程度應該是可以預期的。

就我所知,這次美國大選有幾個最主要的議題,包括經濟、國家安全、健康政策與改革以及伊拉克撤軍的問題。國家安全與伊拉克問題與軍事及外交有很深的關係,經濟與健康政策改革則是內政方面最受到美國民眾關切的問題,而這兩者也會互相牽動,尤其在經濟景氣不佳的情況下,絕大多數美國家庭對於是否能保有工作與健保,民眾與雇主對於節節高升的健保與醫藥費、醫療品質與就醫可近性的問題的擔憂程度也就更加白熱化,因此都寄望下一屆總統能夠提出有效的對策。

這禮拜我剛好在校內聽到兩場討論目前兩位總統候選人所提出的健康醫療改革政見的演講。第一場是由健康專業聯合學院(School of Allied Health Professions)主辦,邀請VCU人文與科學學院的院長,也是政府與公共事務研究所的教授Robert Holsworth分析兩位候選人對健康醫療改革的方案;另一場是我們系上的師生午餐研討會,請到系上的校友及兼任教授,目前並擔任美國中小企業聯盟資深醫療顧問的Dr. Robert Graboyes對目前候選人所提出健康醫療改革計畫進行評估。

Dr. Holsworth在進入主題之前,先介紹了政策學者常用來觀察總統選舉選情的三種角度,首先是社會大眾對現任總統的評價如何?再來是選前這段期間民眾認為國家或社會的運作是否良好?他說目前各種民調顯示,認為美國社會與政經情況不滿意的民眾超過八成,這麼高的社會不滿意度是過去罕見的。第三個角度是候選人如何自我定位?是將自己定位為局內人(insider),還是局外人(outsider)?將自己定位為局內人的候選人會去強調自己的施政經驗,將自己定位為局外人的候選人會強調改變與改革。Prof. Holsworth說從過去的經驗來看,局外人的選舉定位策略的勝算比較大,甚至像雷根總統在競選連任時也是採取局外人的定位,強調要去改革國會與政府官僚。在目前社會大眾對現任布希總統施政與社會局勢普遍不滿的情況下,這次兩位候選人都很聰明地採取局外人的選舉定位,都提出要改變的口號,雖然程度上有所不同。Prof. Holsworth認為希拉蕊這次民主黨內初選之所以落馬,最主要的原因就是定位錯誤,因為她採取局內人的策略,強調自己有足夠的施政經驗與能力。

Dr. Holsworth指出從各種方面來看,健康醫療改革無疑地是這次大選最重要的議題之一,美國目前國內的支出每6元就有1元是用在健康照護上面,而且健保費用年年上漲;此外,有四千多萬人沒有健保,形成就醫的障礙與漏洞。因此在這次選舉中,醫療費用的控制與就醫可近性的保障與加強是健康醫療政見中最受注目的部分。

民主黨的總統候選人歐巴馬(Barack Obama)所提出的改革方案,主要是在現有的基礎上加以強化並擴大健保涵蓋的範圍。大部分工作中的美國人都是透過雇主所提供的健保而納保,不過許多小型公司由於財務因素,以及保費較貴,無法提供健保福利給員工;此外有許多自雇者(如個人工作室)或沒有工作的人由於買不到健保,或保費太貴買不起,或不想投保,因此也沒有納保。因此,歐巴馬主張立法要求所有兒童都要納保,以及一定規模以上的公司必須提供健保福利給員工。至於沒有提供健保的小型公司員工與未受雇的個人可以透過由聯邦政府所成立的國家健保交流方案(National Health Insurance Exchange)獲得保費合理的健保;應該為員工提供健保卻沒有做到的公司則必須繳付一定的金額,去分擔政府提供健保的成本[1]

在醫療費用與成本管控方面,歐巴馬陣營主張獎助採用電子病歷與發展醫療資訊;透過國家健保交流方案的運作強化健保組織之間的競爭,並立法規定健保組織必須將一定比例的保費用於給付被保險人的醫療;增進公衛、預防保健與慢性病管理;藉由政策鼓勵使用學名藥、開放藥物進口以及解除Medicare不得與藥廠議價的限制;要求醫療提供者公布醫療成本與品質的指標;改善醫師執業責任保險公司的壟斷情況,避免保險公司對醫師收取過高的醫療風險保費。

共和黨的總統候選人馬侃(John McCain)所用的健康醫療改革取向與歐巴馬的政見相當不一樣,他主張鬆綁由雇主提供健保的制度,並回歸市場的機制來解決當前的問題。馬侃陣營提出取消雇主提供健保的繳稅優稅措施,政府將這筆稅收拿來提供退稅優惠[2]給民眾做為自行購買健保的經費。聯邦政府並補助州政府設立「保障就醫方案」(Guaranteed Access Plan),讓有重大疾病無法在一般民營健保組織買到保險的民眾可以納保,聯邦政府並提供額外的保費補助給這些民眾。此外,馬侃陣營也主張讓民眾可以跨州購買健保(讓全國性健保組織不受州政府的規範),這些措施都是希望促進全國健保市場的自由競爭,使成本可以得到適度的控制,同時使品質獲得確保。

在管控保費、醫療費用與成本方面,馬侃陣營與歐巴馬陣營有一些相似之處,如加強預防保健與慢性病管理、鼓勵使用學名藥、開放藥物再進口以及要求藥廠公開藥價資訊;要求醫療提供者提供醫療成本與結果的資訊給消費者。不過比較不一樣的地方在於馬侃主張改革醫療糾紛訴訟,以限制巨額的賠償,並讓依照標準醫療準則或程序執醫的醫療人員免除被告的風險,獲得保障;此外還希望藉由增加替代醫療提供者(如執業護理師)的使用,來降低醫療成本。

整體看來,馬侃的方案比較著重醫療費用與成本的管控,但是健保涵蓋範圍是否能夠擴大是一大問題,而且他的方案對中上收入的民眾(繳稅會超過2,500美元的人)比較有誘因,對中低收入的民眾比較沒有保障。反觀歐巴買的政見,可能對擴大就醫保障與納保範圍有所助益,但對於健保與醫療成本的控制可能就無法讓人太樂觀,而且歐巴馬的改革方案必須透過訂定許多新法規,政府的介入程度也會更加深,這也是讓人詬病的地方。不過,如同Dr. Robert Graboyes所指出的,目前兩個陣營所提出的改革方案到底誰優誰劣其實還無法分辨,因為有許多重要的細節都還沒交代清楚,比如相關財源要如何籌措?合理的健保給付項目與內容到底包括哪些?健康照護服務體系(如健保組織、醫院、醫師組織、護理之家等)的改革方向與計畫,都還沒有被具體提出來。

不管哪一位候選人在11月的大選中勝出,在面對經濟不景氣與財政赤字的現實下,要實現競選政策,對健康與醫療進行有效的改革,都絕對不是一件容易的事。如果歐巴馬當選,他的方案的財源要從哪裡來?國會是否會通過?企業是否有能力配合?都是很嚴苛的考驗。如果馬侃當選,在經濟不景氣之下,民眾可能會期待政府扮演較重的角色,因此他是否能順利將健保與醫療回歸市場運作,也是一大問題。不過,如果從反方向來看,這也代表任何一位當選人其實都有一些契機可以運用,來實踐其政見。

我自己的看法是歐巴馬的改革方案比較可行,因為它是架構在現行的制度上面,並加以強化,變革幅度不會太大。而馬侃的改革方案要將在美國行之有年的雇主提供健保的主要納保管道移開,改由退稅給民眾自行購買健保,可能會引起民眾較大的顧慮,對整個健康照護產業的運作模式也會造成不小的震撼,而且納保的行政成本會大幅增加。

如果想要進一步瞭解這兩位候選人的相關政見與方案主張,請連結到以下的網站:http://www.health08.org/

[1] 有人稱這個政策為”pay or play”,意思是說雇主要麼就替員工投保(play),不然就付錢給政府(pay),由政府來替其員工納保。
[2] 個人每年2,500美元,家庭5,000美元的減稅優惠,用於購買健保。

如何評估社區健康方案的成效?

鑒於健康促進與預防保健的重要性,衛生署國民健康局與中央健保局都有不少社區健康的方案委託給醫院或社會團體去執行,如社區健康營造、健康城市、安全社區、山地鄉IDS等方案。門諾醫院長期以來致力在花蓮原住民社區進行社區保健或醫療服務工作,投注了許多心力、人力與物力在上面,我們要怎麼知道這些努力與方案的成效到底是如何呢?這禮拜「健康方案評估」這門課所上的內容,就是在討論社區健康方案的效果評估方法。

社區健康方案的效果評估是指研究人員要去了解在某個社區中,實施某種介入方案後,社區居民在該方案所關心的健康狀態是否有明顯的改善。由於社區健康方案的目的主要是在改善居民的健康,而比較不是專為研究的目的,因此評估社區健康方案的效果通常無法透過實驗控制的方式去進行[1],而必須採取從旁觀察與收集資料的非實驗研究設計(non-experimental design)。在這樣的前提下,就最理想的狀況來說,社區健康方案的成效評估設計應該是要達到以下的條件或目標:

1.設計介入方案評估計畫的設計要妥善且明確,對於介入方案所要達到的目標非常清楚;
2.介入方案須是非常明確的一個或一組活動,其介入的強度可以很具體地測量;
3.介入方案實施的時間點或期間很明確;
4.要找到一群可以對照的對象,對照組的組成人員與接受介入方案組成員必須非常相似,而且沒有受到介入方案的任何影響;
5.有關方案介入組與對照組的資料必須非常齊全,讓評估人員能夠很清楚了解這兩組對象的差別;
6.評估人員須同時取得方案介入組與對照組在方案實施前的基礎時間點資料;
7.評估人員必須給實施的方案有足夠的時間去影響方案介入組的成員的健康,也就是確保方案有足夠的時間去產生方案所想達成的健康效果;
8.任何其他對方案介入組與對照組會造成類似健康效果的事件與因素都必須明確加以辨認與記錄;
9.在方案實施之前、實施期間與之後持續觀察、衡量與紀錄方案所要達的健康指標。

事實上在社區中實施與評估健康方案,有太多的變數與問題,因此要做到上述這麼理想的境界是幾乎不可能的。常見的困難包括:(1)資料收集不易,特別是方案實施前的基礎期資料經常是找不到,或是沒有收集;(2)要找到理想的對照組很不容易,我們不可能找到兩個原本完全相同的社區,即使是相似的社區恐怕也不簡單找;經常這樣的對照社區是方案介入社區鄰近的社區,而在介入方案實施的過程中,位於鄰近的對照社區很可能也受到了該方案的影響(學者稱此為溢出效果(spill-over effect));(3)缺乏理想的健康衡量指標,社區健康的衡量指標經常很不明確,這裡除了牽涉到資料來源正確性之外,還有所採用的健康指標是否與介入方案有明確的關聯性,如果該健康指標還會受到介入方案以外的因素影響,則該指標就不是很理想的指標。在社區的情況中,這些問題是相當常見的;(4)資料收集方法不一致,在社區方案實施時,資料一般是透過許多不同的工作人員去加以收集,而不同的工作人員所用的資料方法或判斷標準可能就不一樣;此外,在方案實施社區與對照社區中可能也存在資料定義與收集方式不一致的情況,導致比較上的困難;(5)時間問題,介入方案的計畫通常有一定的期限,有時候方案實施若沒有達到臨界點,效果是看不出來的,但問題是研究人經常不知道這個時間臨界點是多長,因此有可能在方案產生真正效果之前去評估,於是看不到方案的效果;(6)介入方案本身經常就不很明確,社區健康方案通常是由很多人一起推動,也可能有許多活動同時進行,因此不是一個很整齊或一致的情況,而是相當鬆散的行動組合,不同的居民所接受到的介入措施的強度、廣度與深度可能都不一樣;在此情況下,要去探討介入方案本身的效果,就有先天上的限制。雖然如此,上述的社區健康方案評估的理想條件對研究與評估人員還是很有幫助,可以讓我們在方案設計時就考慮到評估的相關問題,因此可以事先做必要的準備與因應,減少可能問題的產生,使評估的進行事半功倍,達到令人滿意的地步。

[1] 因為實驗控制的研究設計中,研究者會主動介入,去操控被研究對象,比如透過隨機分配的方式,使某些居民接受介入方案(實驗組),另外的居民無法接受到介入方案(對照組),就公共衛生推廣或社區保健的角度看,這麼做會有實質上與倫理上,甚至政治上的困難。

2008年9月13日 星期六

感受組織支持理論(Perceived Organizational Support)

感受組織支持理論主要是指出組織員工會對其機構形成某種整體的感受,認為機構是否重視他們的貢獻以及關心他們的福祉。這個由員工所感受或體認到機構對自己的支持與照顧的程度就是「感受組織支持」(Perceived Organizational Support, POS)。POS這個名詞與概念是在1986年一篇由Eisenberger等人所撰寫的論文[1]中首度被提出並給以正式的定義。不過以POS為主題的研究當時還不多,一直到1990年中旬,相關的研究才多起來。2002年有一篇meta-analysis的文章[2]收集並分析了1999以前發表的70篇與POS相關的實證研究,發現POS的相關論點大致上是成立的。而從1999年之後,已經有超過200篇討論POS的研究論文。從這些研究的結果,學者漸漸知道POS的重要前因、後果與作用機制,並得到更多支持POS理論的證據[3]

POS理論除了本身的見解之外,也運用了其他幾個相關的理論或假設做為理論的基礎。這些理論包括:(1)社會交換理論(social exchange theory)、(2)成效-獎勵期待(Performance-reward expectancy)、(3)組織擬人化(Personification of organization)與(4)組織是員工社會與情緒資源的重要來源。社會交換理論認為各種社會行為在本質上即是交換。比如員工與機構就存在一種交換關係,員工貢獻其努力與忠誠度,以換取機構所給予的實質利益與社會獎勵。這個理論提到在這個交換行為的過程中,如果對方提供東西是出於心甘情願與真誠,而非被逼或不得不提供的,這時接受的一方會覺得這件東西的價值或意義比較大。「成效-獎勵期待」是期待理論(expectancy theory)當中的一個重要概念與因素,意思是說當一個人愈能夠預期其工作所得到的成效可以帶來他所想要的獎勵時,便會對其追求工作成效產生愈高的動機或動力。「組織擬人化」是說在某種程度上,員工會將自己與機構的關係當成一種自己與另一個勢力較大的個人之間的人際關係。在這個關係中,員工會將機構的政策、措施、規範、主管的言行等都當成是機構對員工的行為與對待方式,因此這些都會帶給員工某種對機構的理解與感受。最後一個假設是說組織除了是員工工作並與員工進行交換的場所之外,也扮演員工社會與情感資源重要管道的角色,這些社會情感資源包括情緒上獲得支持、歸屬感、自尊與獲得認可或認同等。員工除了從親人朋友得到這些資源之外,也期待從所服務的機構獲得這些資源,於是對機構會產生相關的需要或要求。

根據前面所提到的一篇POS的meta-analysis,學者們整理出POS主要的運作機制。機構對員工福利的關心與對員工貢獻的肯定與重視(這是POS的前因,)的情況會讓員工產生某種程度的POS; POS則會導致幾種結果:(1)員工所期望的結果,包括對工作的滿意、正向的工作情緒、與工作壓力的減緩等;(2)員工產生成效-獎勵期待;(3)員工反過頭來也會關切機構與目標;(4)由於(2)與(3)的共同作用,因此會加強員工對機構的向心力與投入感,提升工作表現並降低離職率,這些則是機構所期待看到的結果。不過,在這個POS的因與果的過程中,有幾個重要調節因素必須考慮。首先,POS的程度大小會受到員工的個性所影響,如比較熱情的員工所產生的POS程度通常也較大,個性較冷漠的員工所形成的POS強度通常不會很高。第二,如前所述,如果員工認為機構的措施與舉動是出於機構的主動與甘心樂意(discretionary treatment),這時所形成的POS會比較顯著;相反地,如果員工認為機構的措施與舉動是出於被逼或外在的要求所不得不做的(比如法令的規範、與工會談判後的協議),那麼即使該項措施對員工很有利,員工也不會有很強的POS。第三,POS與員工所期望結果的關係會受到員工本身的社會情感需求程度的影響,如果員工對社會情感需求程度較高,正面的POS有助於導致較高的工作滿意度、工作情緒與壓力的減緩;對於社會情感需求較低的員工而言,POS的作用便來得比較輕微。最後,當員工感受到機構的支持與關心時,通常員工也會反過來支持與關心機構,以往學者認為這主要是因為當員工感受到機構的支持與關心時,也會覺得有一種義務與關切機構的責任感(felt obligation);最近學者則進一步發現在這種責任感其實是來自員工的回報意識(reciprocity norm),對於這種意識較強的員工來說,責任感也會比較強,因此當他們感受到機構的支持與關心時,反過來支持與關心機構的程度也比較大。

POS理論對管理有幾個重要的參考價值:
1.研究歸納出有幾個機構的措施與因素對POS有明顯的增強作用,分別是(1)公平(fairness),包括公平的辦法、合理與公平的資源分配、資訊的分享、對員工的尊重等;(2)主管對員工的支持(supervisor support)—這點相當重要,因為員工通常將主管視為機構的代表或代名詞,於是員工會將主管對他們的重視與關心程度認為是機構對他們的重視與關心程度,將主管對他們的評價等同於機構對他們的評價,甚至因為主管的言行決定他們對機構的感受;(3)機構對員工的獎勵與工作條件(organizational rewards and job conditions),包括對員工的表揚與肯定、薪資報酬、升遷、工作保障、自主性、訓練機會等。

2.機構不能一廂情願以為對員工的福利措施都一定會被員工所感激或感受到,反而,機構是在怎樣的考量、動機與情境下提供這樣的福利可能是更重要的地方,如果福利是員工經由爭取所得來的,員工不會覺得這是機構的善意與關心,如果是機構主動所提出的,哪怕只是一點點的幫助,員工也會滿懷感激。

3.一般來說,員工是相當務實的,他們所在意的,是機構可以做到的地方。如果機構處於惡劣的經營環境,無法提供很好的條件給員工,或知道某種對員工不利的措施不是機構所能控制的,員工也不會因此對機構有很負面的感受。這也告訴我們,機構平時就有必要提供正確的資料與訊息給員工瞭解,並做好雙向溝通。

4.根據個性與特質慎選員工,正向、樂觀、知道回報並心存感激、具責任感等特質都有助於使員工的POS對員工本身與機構產生更明顯的正向結果。

5.人際互動關係的原理能夠被用於強化或增進員工與機構之間的關係。

[1] Eisenberger, R., Huntington, R., Hutchison, S., & Sowa, D. (1986). Perceived organizational support, Journal of Applied Psychology , 71(3), 500-507.
[2] Rhoades, L., & Eisenberger, R. (2002). Perceived organizational support: A review of the literature, Journal of Applied Psychology , 87(4), 698-714.
[3] 如果對SOP理論有興趣,可以連結到這個專門介紹POS的網站,有很詳盡的資訊。http://pos.psych.udel.edu/default.asp

假設檢定(hypothesis testing)的統計原理

假設檢定是推論統計中相當重要的一環,也是其主要目的之一,絕大多數的實證研究的結論也是來自或根據假設檢定的結果。不過假設檢定的統計原理其實有點吊詭,與我們直覺上所想的有些不一樣,有時候不同學者的見解也不一定完全相同,比如去年我上計量經濟學時,授課的Dr. Harless告訴我們單尾的虛無假設與對立假設的敘述方式分別是:H0: β≤0; H1:β>0;可是最近教我們計量經濟學的群組追蹤與非線性方法的Dr. Stratton卻告訴我們正確的敘述方式應該是:H0: β=0; H1:β>0[1]。這讓我想要進一步將相關的原理弄懂一點,並回顧一下以前所學的,希望能釐出一個較清楚的面貌。

推論統計的目的是要讓我們能夠根據一組樣本的資料,去推論母體的狀況,其中主要是透過母體參數的估計(population parameter estimating)以及假設檢定(hypothesis testing)來達成這個任務。首先,母體參數的估計讓我們用樣本去推算某一個母體參數的值,但是因為抽樣會有誤差,因此我們的估算值也會有誤差,這時假設檢定就是要透過一套系統的方法,提供客觀的訊息幫助我們知道估算值可靠的程度大概有多大。假設有一家醫院檢驗科實施一套新的抽血作業標準,希望將病人的抽血平均等候時間降到2分鐘以內。因此我們想去了解該醫院檢驗科實施新措施之後,病人抽血平均等候時間是否有低於2分鐘。首先我們可以隨機抽出一組病人,去取得他們在檢驗科等候抽血所花的時間,算出其平均等候時間(假設是1.7分鐘),藉此值去代表該院檢驗科所有抽血病人的平均等候時間,可是由於我們從樣本所得到的估算值有誤差,我們不能因此就斬釘截鐵說該檢驗科抽血病人平均等候時間就是1.7分鐘,已經達到目標。這時我們必須藉由假設檢定,去探討這個估計值在統計上是否顯著低於2分鐘?

假設檢定的基本根據是抽樣分布(sampling distribution),為容易討論起見,這裡僅就一組數字的檢定來看,而不考慮其他較複雜的兩變數或多變數的關係檢定。如果我們想藉由抽樣調查去了解某家醫院檢驗科病人抽血平均等候時間,於是隨機抽樣取得10個病人的等候時間資料(單位是分鐘),假設是以下的數字:
1 2 2 3 0 1 2 4 2 0

這個樣本的樣本數N為10,平均值μ是1.7,樣本標準差s是1.25。
若依照統計原理,理想的狀況應該是要取得愈多組樣本資料愈好(重複抽樣很多次),因為當我們進行愈多次抽樣,我們就能得到很多μ值,而這些μ值便能夠成一個新的分布,稱為抽樣分布,這是一個根據統計理論所建立起來的虛擬分布,而不是一個真實的分布,但是如果我們真正去做許多次抽樣,就可以建構出抽樣分布。統計學告訴我們,這個抽樣分布會是一個常態分布,其平均值會很接近真正的母體平均值(在這個例子中即為該醫院全部檢驗科病人抽血的平均等候時間)。

我們有辦法抽樣無限多次時,這個抽樣分布正好會是一個以母體平均值為中心的常態分布,此取樣分布的標準差就叫做平均值標準誤差(standard error of the mean),簡稱標準誤差(以se表示)。不過實際上我們只做一次抽樣,而拿這組抽樣的平均值做為我們的參數統計(代表)值,而且統計學家告訴我們,s/√N這個值會非常接近取樣分布的標準誤差se。於是我們就根據一次的抽樣,以其平均值1.7為中點,se=s/√N=1.25/√10=0.39為標準誤差來模擬真正的取樣分布。

當我們用一個樣本的平均值(統計值)來代表母體的平均值時,儘管會有誤差,但有一個好消息是樣本平均值是一個一致(consistent)或不偏差(unbiased)的統計估算值,也就是,當我們的樣本數N(一個樣本中所含的數目量)愈大時,其平均值會愈接近母體平均值,所以我們可以靠增加樣本數來提升估算值的準確度。

不過,因為我們的樣本數總是有限的,因此實際上我們沒有十足的把握可以從樣本中得到完全正確的代表值,但是有一個辦法可以大致讓我們知道誤差的程度有多大。前面我們從樣本建構出一個以1.7為中點,0.39為標準誤差的取樣分布,由於取樣分布是一個常態分布,根據常態分布的特性,告訴我們當我們取樣100次時,大概有95次的樣本平均值會落在[0.92, 2.48]的區間(1.7±0.39*2)內,統計學稱這個區間為95% confidence interval(95%信心區間)。在這個例子中,1.7是一種點估算值,而[0.92, 2.48]是一種區間估算值。

這個樣本所給我們95%信心區間包括了2.0以上的值[2],即(2.0~2.48),這時我們要問,到底我們根據此樣本所得到的1.7分鐘與2分鐘到底有沒有不一樣?或者我們也可以問,我們是否有把握(或有多少把握)說這1.7分鐘確實低於2分鐘?前一個問題是屬於雙尾的假設檢定(two-tailed test),後一個問題則是單尾的假設檢定(one-tailed test)。第一個問題的假設應該是這樣:
H0: 統計估算值=2
H1: 統計估算值‡2 (包括大於2或小於2)

H0稱為虛無假設(null hypothesis),H1稱為對立假設(alternative hypothesis),其實在統計學中,H1才是我們真正關心並且想要了解的條件/狀況,可是樣本估算有誤差,因此我們無法直接證明這些狀況是否為真,只好退而求其次,以推翻或拒絕相反的狀態(虛無假設),來間接求證對立假設。

前面提到,根據這個樣本,我們所得到的是一個中間值為1.7,標準誤差為0.39的虛擬取樣分布,統計學家為了檢定以上的假設,提出檢定統計值(test statistics)的概念,不同型態的分布有不同的檢定統計值。在這個例子中是常態分布,因此所使用的檢定統計值z statistics[3]=(1.7-2)/se=-0.3/0.39=-0.77。其實是將取樣分布轉換成一個以0中點,標準差為1的標準化常態分布(standardized normal distribution)稱為z分布,我們便要去檢定這個z statistic在統計上是否與0有沒有明顯差別,或其差別的程度有多大。

由於我們所得到的z statistic是0.77,在標準化常態分布下,小於-0.77與大於0.77之間的面積占整個分布圖面積的0.426(42.6%),意思是說當我們取樣100次時,大致有42.6次的z值會落在超過±0.77以外的兩端。在這裡,統計學稱0.426為p值,p值是一個介於0與1之間的值,當p值愈大,虛無假設(H0)成立的機會就愈高,我們就愈沒有立場去推翻虛無假設[4]。因此在假設檢定中,我們總是希望看到p值愈小愈好。在實務上我們會先根據z statistic去計算p值(此處是0.426),代表當我們抽樣100次時,所得到的估算值會涵蓋到2的情況大致有42.6次的機會。因此雖然我們從該樣本所得到的估算值是1.7,但是如果我們真正取樣100次,我們可能有42.6次會得到等於或超過2的估算值。

不過,p值要多小,我們才有足夠的證據去推翻虛無假設呢?這是一個很不容易有定論的判斷。一般學術界是以0.05或0.01為一個基準值,當p值低於0.05或0.01時,我們便會推翻虛無假設。可是0.05或0.01並非一個亙古不變的定律,而且如果p值是0.055或0.012時,我們要怎麼辦?此外,是不是不管樣本數大小,都必須用同樣的基準值呢?事實上0.05的基準值是早期資料取得不易,也沒有電腦協助進行統計分析工作時所常用的基準,現在資料取得已經比以前容易,並且有電腦的輔助,大量資料的統計分析要比過去容易很多,當樣本數很大時,要達到0.05或0.01的基準值可以說易如反掌,所以p值的基準值應該也要調整才對。此外,有些研究對於假設檢定的標準要求較高,有些條件比較寬,因此也可能會採取不同的基準。比如與生命有關的研究(如藥物療效的檢定),檢定的標準會比一般社會科學研究(如評估某種新教學方法的效果)的標準來得嚴格。
此處,我們所選擇的p值的基準值,統計學上也稱為α,是代表我們在做假設檢定的所用的顯著水準(significance level),α值愈小表示我們採用愈嚴格的檢定標準。當我們決定採用的α值時(假設是0.05),便在標準化常態分布圖形中設定了臨界區(critical region),如果是雙尾的假設檢定,α所代表的區域是分布圖形下方超過臨界值兩端的面積臨界區佔整個分布圖型面積的比例(每一端的臨界區各佔0.025)。當我們得到的z值落在臨界區中時,表示我們可以推翻虛無假設。

如果我們想要了解的是我們能不能(或有多少把握)說從樣本所估算的這1.7分鐘確實低於2分鐘?這時我們要用單尾假設檢定(one-tailed test),假設的敘述如下:
H0: 統計估算值=2 或 統計估算值≥2
H1: 統計估算值<2

這時如果我們得到的估算值是大於2時,代表無法推翻H0,不用再計算z值。如果我們得到的估算值是小於2,如1.7,我們便去計算z值=-0.77,並得到p值=0.426。但由於此時我們所要檢定的只是左端(單尾)臨界區,但是p值是兩端的臨界區,因此我們再將p值除以2,得到單尾的p值=0.213。如果我們採用α=0.05的話,這個單尾p值還是比0.05大,因此我們無法拒絕虛無假設,表示我們從樣本得到的1.7分鐘還是無法給我們足夠的把握或證據,去下結論說檢驗科已經達成抽血病人平均等候時間低於2分鐘的作業目標。

如果用臨界區的圖形來看,在單尾的檢定中,左端臨界值以外的分布圖下方的面積會是整個分布圖面積的α,因此單尾的臨界值會比雙尾的臨界值更往右移,我們的z值會更容易落在臨界區內,虛無假設會更有機會被拒絕。一般來說,與雙尾檢定比較,單尾檢定比較容易呈現顯著的結果(比較沒那麼保守)。

至於單尾的假設敘述哪一種才對,H0:統計估算值=2還是H0:統計估算值≥2?主張前者(simple approach)的論點是說我們所要想推翻的虛無假設,總是針對某一個值(如2),而非一個區間(如≥2),這種論點應該是從先確定α值,訂出臨界區(拒絕區),再看z值是否落在臨界區內來做假設檢定,因此是針對某一個值去考量虛無假設。不過我覺得這種主張有一個問題,當我們推翻H0:統計估算值=2時,並不能自動告訴我們H1:統計估算值<2,也有可能是h1:統計估算值>2的情況,因此有其敘述上的缺陷與不確定性。

主張後者(compound approach)的思考比較是從先算出z值,再求得小於z值的區域佔整個分布圖型的比例(單尾p值),最後與α做比較,因此是針對某一個區段去考量虛無假設。

在進行假設檢定時,另外有幾個重要的統計概念。由於檢定是根據機率的法則,由於資料的誤差不可避免,不管再怎麼嚴謹,都還是有可能做出錯誤的結論。統計學列出四種主要的情況:(1)事實上虛無假設是對的,我們並予以接受、(2)事實上虛無假設是對的,我們卻加以推翻(型一錯誤)、(3)事實上虛無假設是錯的,我們並予以推翻、(4)事實上虛無假設是錯的,我們卻予以接受(型二錯誤)。

型一錯誤的機率剛好是我們所採用的檢定顯著水準α,因為當p值低於α值時,我們便會推翻虛無假設,所以我們還是會有α的機會將不該推翻的虛無假設給拒絕掉,犯下type 1 error。由此可見,當我們採用愈小的α值時,我們犯type 1 error的機率就愈小,而做出正確決定的機率(1-α)就愈大。

統計學用β來代表犯型二錯誤的機率,因此當虛無假設是錯的而我們加以推翻的機率就是(1-β),統計學中稱此為power,代表我們能夠偵測出存在於母體中某種關係的精確度,這是研究的主要目的。理論上我們希望將α與β同時降到愈低愈好,可是這兩種錯誤事實上很難兼顧,因為當α降低,(1-α)增加,因此增加接受虛無假設的機會,也會增加犯型二錯誤的機會(β)。因此在現實的狀況中,α與β經常是要做取捨。

α與β這兩個值,α是由我們決定的,β則受到幾個因素的影響,第一個因素是α;第二個因素是樣本數,當樣本數增加,β減少,power增加;第三個因素是母體的關係強度(population effect size),當母體中我們所關切的關係本身很明顯時,能夠被我們偵測出來的機會也就愈大,所以我們犯type 2 error的機率也就降低。

[1] 其實這兩種假設的敘述方式都有人使用,各有道理,前者稱為compound approach,後者稱為simple approach,但是出發點不太一樣。
[2] 如果我們得到的95%信心區間包括我們想要檢定的值,那表示我們所得到的估算值與該檢定值在統計上並沒有顯著差別。當我們抽樣100次,大致有5次以上的樣本所得到的估算值會靠近這個檢定值。
[3] 在原來的取樣分布中,z值代表的意義是距離我們的估算值z倍的se的一個點,當z絕對值愈大,表示該點離估算值愈遠。
[4] 此處,最妥當的假設檢定的陳述方式應該是:根據該樣本的估算,有以下這有兩種狀況:(1)要不是我們的虛無假設是錯的,不然就是(2)我們的虛無假設是對的,不過當我們隨機取樣100次時,這種情況會出現42.6次。

2008年9月7日 星期日

組織的信任(Organizational trust)

組織的信任(organizational trust, OT)近年來成為組織研究一個相當受重視的課題,首先有系統地去討論OT的是Mayer, Davis, and Schoorman這三位學者,他們在1995年一起發表一篇論文[1],為OT提出完整理論架構,後來有許多學者使用這個理論架構進行實證研究,持續為這個領域加入新的元素或見解。

以往一般認為trust(信任)是與個人個性(trait)或組織特性有關,因此有些人比較容易信任別人,或有些人很容易贏得別人的信任。不過Mayer, Davis, & Schoorman認為trust與關係(relationship)有很密切的關聯性,也就是trust會隨關係的不同而改變。比如A對B很信任,但是A對B不信任,因為A與B已經有某種可以建立信任感的關係,而A與C缺乏這樣的關係。

組織信任(OT)可以從幾個不同的關係層次去探討,我們可以討論組織內部人與人之間的信任,或從組織中的群體與群體之間的關係去探討(如護理人員對醫院管理部門的信任),可以探討機構員工對機構的信任感,也可以去分析機構與機構之間(比如某家醫院與其供應商之間)的信任關係。

Mayer, Davis, & Schoorman對組織信任的定義是”the willingness of a party to be vulnerable to the actions of another party based on the expectation that the other will perform a particular action important to the trustor, irrespective of the ability to monitor or control the other party.”主要的意思是說當我們對某一個人信任程度愈大時,我們將自己的安危交在對方的行動的意願也會愈大。我記得唸中學時參加團契經常接觸到增進人際關係的活動,其中有一個活動就是在培養小組成員之間的信任感:首先自己站好,眼睛閉上,然後慢慢往背後倒下,這時背後有一群小組的弟兄姊妹已經張開雙手準備好將我穩穩接住。如果自己愈是信任後方的弟兄姐妹一定會安穩地將我接住,我就越願意往後倒,如果信任感不足,我應該是不願意冒著可能腦袋撞地的危險往後倒下。這個定義提供OT研究的操作型定義,使得研究人員可以試著去衡量OT。

Mayer, Davis, & Schoorman所提出的OT理論架構,核心點是指出OT主要是由三個因素所決定的:(1)對方的能力(ability)、(2)對方的善意(benevolence)、(3)對方的信用(integrity),當這三個因素具備或程度都很高時,我們愈容易信任對方。首先,當我們覺得對方能力可以勝任做某一件事時,我們便比較容易在該件事上對對方具有信心。比如我要去休假,但休假期間有一件重要任務必須處理,因此我一定會找一位能力足以處理該件任務的同事來擔任職務代理人,並信任他扮演這樣的角色。接下來是考量對方的善意,如果這位有能力的同事平常就不太樂意擔任別人的職務代理人,我應該也無法信任他會將這個角色扮演好,妥善處理該件任務。最後是信用,我所信任的這位同事,除了有能力與善意之外,還必須是說到做到、重視承諾的人。否則即使他有能力勝任,也有助人之心,可是如果當他自己有事情要處理時,就會先將別人的事擺在一邊,這也會使我對他的信任大打折扣。

這三個因素中,能力與信用度的資訊比較容易客觀取得,可以藉由對方過去的表現或行事記錄了解到,因此在兩人的互動關係的初期大致會有一個輪廓。不過善意就比較沒那麼具體,因此必須花一段時間去嘗試與觀察,才能比較準確地了解對方善意的程度。

從這個理論來看,信任的建立是透過理性的認知過程(a cognitive approach to trust),不過,有些學者發現情感也會影響信任感的建立,因此信任其實也有情緒的成分在裡面。只是,理性認知主張的學者相信情感也許會暫時影響理性的判斷,但當時間繼續進行,信任的維持或產生終究要回到理性的層面上。

一般來說信任是互相與彼此的關係,如果A信任B,B也會信任A。不過在這個理論中,這個相互關係不是必然的,也就是有可能雖然A信任B,但是B卻不信任A的情況,主要是因為各自對對方在以上三個因素的認知不一致所產生的。根據這個理論,我們不能一廂情願地認為當我信任某個人,對方也一定會信任我,儘管這樣的關係在大多時候是存在的。

另外一個有趣的問題是「信任」與「不信任」(distrust)是兩個不同的概念,還是同一個概念的兩端?主張這是兩個不同概念的見解所持的理由是在同一個關係中,「信任」與「不信任」有可能同時存在。比如我在某些方面信任A,但在另外的方面不信任A。不過,Schoorman, Mayer, & Davis[2]認為「信任」與「不信任」應該是同一個概念的兩端,也就是「不信任」是「信任」的相反,因此「信任」與「不信任」不太可能同時存在於某一個關係中。不過,他們指出,由於對方的能力會決定我對他的信任度,而能力與任務種類有密切的關係,沒有一個人有能力勝任所有的工作,而是對不同的任務有程度不一的擅長,因此我們對人的信任度基本上不是因為他是誰,而是要看他是做甚麼事。比如我可以很放心地將美工的任務交給A,但是不信任由他去進行文編的任務。因此,我在X事上信任A,但在Y事上面不信任A的情況是可能發生的。不過,應該不會發生我在X事上既信任A,又不信任A的矛盾狀況。

機構的控制措施(如績效評估、員工考核等)與信任感有相當微妙的關係,有時候兩者是互補的關係,因為機構的控制措施某種程度可以減少機構主管的危機感,將冒險程度降到一個可以接受的地步,因此有助於機構對員工的信任。不過有時兩者會互相排擠,比如有學者發現當機構採用很強的控制措施時,會阻礙內部信任感的發展。

目前的實證研究普遍發現,機構中當員工對機構或對主管產生信任時,通常員工及機構的成效會比較高,而且員工滿意度較高、流動率較低。

此外,在討論員工對機構的信任感方面,有學者提到五個重要的決定因素,分別是員工所認知到的:(1)同事與機構領導者的能力(competence)、(2)機構對員工的坦誠度(openness and honesty,包括重要資訊是否會正確地與員工分享)、(3)機構對員工的關心程度(concern for employees)、(4)機構領導者的行事與決策的一致性(reliability)、(5)員工對機構使命、價值觀與信念的認同程度(identification)。

[1] Mayer, R.C., Davis, J.H., and Schoorman F.D. 1995. An Integrative Model of Organizational Trust. Academy of Management Review, 20: 709-734
[2] 他們在2007年又發表一篇文章,將這十幾年來的相關討論與其理論做了一次深入淺出的整理,並回應相關的討論。F. David Schoorman, Roger C. Mayer, James H. Davis. 2007. An Integrative Model of Organizational Trust: Past, Present, and Future. Academy of Management Review, 32(2): 344-354.

Prof. Avedis Donabedian, M.D.

最近上「健康方案評估」的課程,讀到及討論到許多醫療品質的議題。在談醫療品質時,有一位學者的見解是一定會被一再提到的,這位學者是Avedis Donabedian。

Avedis Donabedian教授曾是密西根大學公衛學院醫務行政研究所的終生職榮譽教授,在台灣可能他的名字不是很讓大家熟悉,可是醫界受他的影響卻是很深遠的,現在我們將醫療品質的衡量分成結構面、過程面與結果面這三類指標的概念,就是由他在1966年首先提出來的,美國及台灣的醫院評鑑也都依照這樣的架構在發展與改進。

我第一次聽到Donabedian,是從門諾醫院醫療副院長陳清義醫師的一次有關醫療品質的演講,他引用Donabedian教授的話:「我相信品質的奧秘就是愛心,去熱愛我們的專業,關愛別人以及敬愛上帝。」這段話當時給我很大的震憾,心想為什麼有人可以用這麼簡潔的話,將品質的真諦表達得如此貼切、深入與崇高?他是怎樣的一個人?這個問題一直到我四年前到密西根大學進修時才獲得解答。

進修時有一門課老師用Donabedian一本著作”Aspects of Medical Care Administration”的一章,討論醫療行政的社會價值觀,我才知道原來Donabedian教授曾在我們系上任教,可是他已經在2000年底過世,享年81歲。Donabedian教授是亞美尼亞人(位於歐亞交界山區,是全世界第一個基督教國家,曾經被土耳其及蘇聯統治,1991年從蘇聯獨立成為一個共和國),在黎巴嫩出生,完成醫學院教育,成為醫生,並曾擔任黎巴嫩美國大學的教職,後來移民美國,在哈佛取得公共衛生碩士學位,之後分別在哈佛大學及密西根大學任教,並曾獲選為IOM的院士。他的著作很豐富,前面所提的”Aspects of Medical Care Administration”於1973年出版,是一本醫務行政的古典著作,內容紮實。後來他一直專研醫療品質的研究、教學與發表,應該可以說是第一位有系統且深入探討及介紹醫療品質的概念與實務的學者,因此他的想法廣被引用,奠定後來相關領域發展的基礎。

在Donabedian教授罹患癌症的末期,他的學生及好友希望他再完成一本著作,因此他在癌症末期完成最後一本書”An Introduction to Quality Assurance in Health Care”,做為他留給世人的最後贈禮,這本書也可以說是他畢生對醫療品質的體認與投入成果的總結。在這本提獻給他的苦難的同胞亞美尼亞人的書中,可以感受到他對醫療品質的熱愛與對後輩的期許。陳副院長所引用的那一句話,就在本書的結語(Some Concluding Remarks[1])中,這段代表Donabedian教授的告別詞很讓人感動,他一再與讀者分享,在運用書中所介紹的種種有關醫療品質的想法與方法之前,我們先要具有對醫療品質的承諾(commitment),同時在改善醫療服務系統與流程以提升醫療品質時,我們的決心(will)是來自於盼望,相信只要我們願意,任何醫療品質的阻礙都可以被克服。對醫療品質的承諾與決心,他曾經認為是來自專業的自我期許與成就感或社會責任的道德要求,但是在他生命即將結束之前,他體認到對醫療品質的承諾與決心是來自宗教信仰當中的愛心。我覺得這段話有很深的涵義,我自己非常喜歡,因此把它抄錄下來,與大家分享:

Some Concluding Remarks

Performance monitoring and readjustment, the subject upon which I have lavished so much attention in this work, does not in and of itself create a commitment to quality; it only serves that commitment. A genuine, persistent, unshakable resolve to advance quality must come first. If that is present, almost any reasonable method for advancing quality will succeed. If the commitment to quality is absent, even the most sophisticated methods will fail.

Some, acutely aware of the ineradicable presence of human fallibility, have put their faith in redesigning the processes of care in ways that substitute technology for human decisions and actions. It is a worthy and useful approach. But to design and implement such modifications requires the prior commitment to quality that I have already emphasized. Besides, there is a limit to how far this process of “mechanization” can be taken.

Another approach to improving the quality of care is to redesign the system of care itself in ways that channel patients, depending on what they suffer from, to the most appropriate and most highly qualified source of care in a regional system of institutions. This, too, is useful and, in some cases, necessary. But even in the most specialized institutions, the need for monitoring and readjustment will remain.

That the pursuit of quality depends ultimately on human will has been, for me, a source of hope rather despair. It is exhilarating, even ennobling, to believe that every obstacle to good care can be removed or circumvented if only we were ardently to wish it.

I have looked in many places for the source of the commitment that would bring about such dedication to quality. I have seen it in professional values and traditions. It is implicit in the contract between the professions and society—a contract that confers privileges on the former in return for responsibilities toward the latter. I have wished to see it in each practitioner’s need for the respect of colleagues and the gratitude of patients; in the quest for acceptance, for success, for the joy in virtuosity. Often I have cast the commitment to quality in moral terms, preferring to see it as the ethical imperative that must govern the conduct of all caregivers.

More recently, as I contemplate the imminent end of my every activity, a religious, a transcendent element has crept into my thinking. The secret of quality, I wish to believe, is love: love of one’s profession, love of one’s fellow man, and love of God.

I cannot, of course, impose any of my own feelings and beliefs upon the reader. I can only hope that each reader of these pages will extract from them what seems most pertinent and useful and, perhaps, go away strengthened and inspired.

And now, farewell.

[1] In Avedis Donabedian, 2003, An Introduction to Quality Assurance in Health Care (Ed. Rashid Bashshur), Oxford University Press: New York, pp.137-138.

醫師對醫院的專業與行政認知感受對其表現的影響

這週讀到一篇研究論文[1],剛開始看標題實在不知道它在討論什麼主題,後來將文章讀了一遍,覺得還蠻有意思的。

這篇文章主要是指出在醫院工作的醫師對於其工作有兩大類的想法,或者也可以說醫師對醫院所扮演的角色或職責有兩種期待,一類是專業方面的期待(professional ideology/role obligation),另一類是行政方面的期待(administrative ideology/role obligation)。前者是指醫院在提供讓臨床人員可以專注為病人服務的環境,捍衛醫療專業自主性與維持醫療水準與標準等方面的責任,包括對內維繫與支持專業團隊(professional group),對外擔任社區公僕(community servant)的角色;後者主要是指財務的健全與資金來源的確保、市場的鞏固、行政支援等方面的任務,包括對內建立一個運作良好的行政體系(bureaucratic system)與對外進行市場開拓(market enterprise)的角色。

當醫師對醫院這兩大類的期待與其實際所感覺到的情況有落差時,這時醫師心理上會產生對醫院專業與行政期待的「感受裂痕」(perceived breach),這些感受裂痕會對醫師的工作滿意度、對醫院的向心力(affective organizational commitment)、離職的想法(thoughts of quitting)、實際流動率(turnover)、病人對醫師滿意度、與醫師的工作產能(productivity)產生負面影響。

作者引用之前相關的文獻指出,醫師與醫院的契約除了有形的行政契約之外,其實還有無形(心理上)的專業契約,前者是建立在正式的合約上面,這是屬於一種「交易合約」(transactional agreement),也就是醫師提供其時間與專業能力,醫院提供報酬與行政支援的交易。後者是建立在雙方要共同履行理想與使命的合作上面,這是屬於一種「關係合約」(relational agreement)。其中,交易合約與醫師對醫院的行政職責期待關聯性比較大,而關係合約與醫師對醫院的專業角色期待比較有關係。

這篇文章的作者根據以上的學理,提出以下幾個假設,並用透過問卷所收集的資料與醫院的資料進行分析,去檢定這些假設:

假設1:醫師對醫院專業與行政職責的感受裂痕對其工作滿意度有負面影響。

假設2:醫師對醫院專業職責的感受裂痕要比對行政職責的感受裂痕更會使其對機構的向心力產生負面影響。

假設3a:醫師對醫院行政職責的感受裂痕要比對專業職責的感受裂痕更會使其產生想要離職的念頭。
假設3b:醫師對醫院行政職責的感受裂痕要比對專業職責的感受裂痕更會對醫師實際的流動率造成負面影響。

假設4a:醫師對醫院專業職責的感受裂痕要比對行政職責的感受裂痕更會使其工作產能受到負面影響。
假設4b:醫師對醫院專業職責的感受裂痕要比對行政職責的感受裂痕更會造成病人對醫師滿意度的負面影響。

他們的實證研究發現這些假設正如他們所預期的,基本上都是成立的,也就是說,在醫院服務的醫師對工作的滿意度會同樣受到其對醫院的專業與行政期待的差距的影響。在對醫院的向心力方面,醫師對醫院的專業職責期待影響程度較大。對於醫師的穩定度而言,醫院的行政職責與功能是否完善是比較大的影響因素;然而對醫師的工作成效來說,醫院的專業職責角色是否有讓醫師滿足是比較重要的影響因素。如果這個學說成立的話,那對台灣的醫院來說,醫務副院長或醫務主任的領導對醫師的臨床工作表現與對醫院的向心力影響比較深遠,而行政副院長或行政部門的功能對醫師的穩定與離職有比較密切的關係。如果要讓醫師的工作滿意度提高,醫務部門與行政部門的角色則是同樣重要。其實這個學說不只是針對醫師,而是在探討專業人員對機構的職責角色認知與其表現之間的關係,因此其實也可以擴大到以醫院中的護理人員、醫技人員、社工、資訊、財務等專業人員為對象去做探討。

[1] Bunderson, J. S. 2001. How work ideologies shape the psychological contracts of professional employees: doctors' responses to perceived breach. Journal of Organizational Behavior 22(7): 717 – 741.