2009年2月7日 星期六

回答調查問題的心理機制(psychology of survey responses)

最近「調查研究」(survey research)這門課都在學問卷內容設計。本來我以為設計問卷內容應該是很單純的ㄧ件事,只要把想要了解的問題問清楚,自然可以收集到很準確的回答或資料。修了這門課之後,才發現事情沒有想像的這麼簡單。

一個問卷內容大致是由三個要素構成的—問題(question stem)、回答選項(response category)與整體編排設計。光是問題要問得明確與恰當這件工作上面,就有許多原則要考慮,不過只要參考這些原則,應該不會有太大的問題才對。挑戰比較大的地方,在於受訪者如何回答,這方面牽涉到很複雜的心理機制,許多並非調查設計者所能完全掌控的。有許多學者已經投入這個領域的研究,使得回答調查問題的心理學(psychology of survey response)成為一門專門的學問,我們最近大多在讀這方面相關的書或文章,由於自己缺乏心理學的底子,一時之間被弄得昏頭轉向,不過漸漸地會覺得是蠻有意思的。

回答問題的心理步驟

受訪者如何回答調查的問題,會影響到問題該如何問,回答欄或選項要採用何種方式,以及問卷的次序與整體編排要如何規劃,因此對調查工作來說,瞭解受訪者的問題回答心理機制是一個非常關鍵的基礎。學者指出,當一個受訪者要回答一份調查(如問卷)中的每一個問題時,都要經過四個步驟:(1)理解(comprehension)、(2)擷取(retrieval)、(3)判斷(judgment)、與(4)回答(response)。首先,受訪者必須先試著去了解問題的意思,然後從腦海中叫出相關的印象、想法或感受,再從中進行判斷與選擇,決定回答的內容,最後才將答案填上去或講出來。通常受訪者在進行這四個心理步驟時,會同時受到問題的本身、相關的提示/說明,回答的方式(開放式或封閉式)與選項,以及同一份調查中其他的問題與訊息的影響,因此其實是相當複雜的心理過程。

在這四個步驟中,第二與第三的步驟是心理學家最感興趣,探討最多而且影響調查回答最大的部分。「截取」的步驟牽涉到記憶,「判斷」的步驟則與訊息刺激、選取和受訪者的處境有直接的關係。

行為調查與態度調查

調查的種類大致可以分為行為調查(behavioral survey)與態度或意見調查(attitude/opinion survey)這兩大類。前者像是收集病人就醫的次數或頻率、中學生吸菸的行為、年長者運動的習慣等等;後者的實例有調查病人對某家醫院門診服務的滿意度、民眾對廢除死刑的贊成與否、或對消費券政策的態度等等。

受訪者在回答行為調查的問題時,所根據的是對實際狀況或數字的判斷,比如若有人問我過去一週做了幾次的運動,我可能會直接去翻行事曆或記事簿,算出運動次數;我也可能去回憶過去一個禮拜內哪一天有去運動,再將運動次數加總;或者我只是憑我過去一般運動的習慣,比如大約兩天一次,去計算這一週內的運動次數。

一般來說,行為調查的回答比較有客觀的基礎,但是也不免受到許多種因素的影響。比如當問題所問的期間愈久遠的話,受訪者要正確回答的困難度也會愈高,也越容易產生誤差。不過行為資料的收集除了透過調查之外,還有其他管道可以進行,比如檔案記錄(病人健保IC卡中的就醫檔案)、或直接去觀察與記錄,因為行為是外顯的而且客觀存在的活動。

相較之下,態度或意見調查的回答依據就比較沒有客觀的基礎,每個人對某件事的意見與態度完全存在一個人的心中或腦海中,這是無法從外表觀察得到的,只能透過詢問與回答來取得。不過這並非說要了解別人的意見或態度,只能藉由進行問卷或調查來獲得。比如我們若要了解民眾對消費券的態度(贊同與否),可以從親朋好友的交談或對話中略知一二,也可以從各種媒體的報導、評論、或讀者/聽眾的call in反應,網路搜尋,或從相關的研討會或公聽會中去獲得。這些管道與方法都各有優點,只是,它們也都有嚴重的缺點與限制。到目前為止,透過問卷或其他方式的調查仍是一種相當普遍且可以大規模進行的意見或態度收集途徑,這可以讓我們將許多個人的意見統合起來,去了解整體而言民眾對某種議題或政策的態度取向。

回答問題的心理學模式

學者在研究受訪者回答態度調查問題的心理模式方面,提出幾種不同的見解。較早的學者認為每個人對某個議題早都有既定的評價,放在自己腦海中,而且每一個人心中對各種議題的評價或態度是蠻穩定的,不太會隨時間改變。這個見解被稱為「檔案櫃」(file drawer model)模式,比如當一個人被問到對消費券的意見時,他只要從腦中打開「消費券」這個櫃子,將原本就存在裡面的意見單取出來,照實回答,就大功告成。

這個模式很容易理解,但是根據這個理論,當同樣的人在不同的時間或場合被問到同一個問題,照理說都應該做出同樣的回答才對。可是實證研究發現,受訪者對同一個問題的回答經常有不一致的情況,有研究發現同一批美國的受訪者被問到對美國與蘇聯的關係的看法,在相隔半年的調查中,做出相同的回答的人只有一半。

針對這個問題,有學者認為原因主要出在有些受訪者並未對該議題有明確或既定的評價或意見,但基於對訪問者的禮貌,因此隨意提供一個答案給訪問者。另外有些學者認為受訪者的心中確實是有既定且穩定的態度與意見,可是由於調查問題本身的模糊或回答選項與受訪者心中的態度不相符,導致受訪者有困難將自己心中的態度套進回答欄裡面,結果造成調查的「測量誤差」,這也就是調查回答不一致的原因所在。

有的學者提出的見解是:存在受訪者腦海中的不只是對某個議題的評價或看法而已,還包括ㄧ些模糊的印象、受訪者自己的價值觀、其他相關的感覺或信念等等。當受訪者被問到某個問題時,腦海中會浮現某種評價、印象、感覺、價值或信念的組合,受訪者會根據當時所持的考量與回答該問題所需要用到的心思多寡程度,去決定要依照現有的想法去回答,還是將自己的意見再略做調整,或者提出新的看法。這個模式被稱為信念抽樣模式(Belief-sampling model)。

有一篇論文[1]提到另一個類似的見解,作者將其理論分成三個部分,第一個是指出大多數的人對各種議題經常持有各種矛盾或不同的考量,這些不同的考量點會將受訪者對該議題的態度導向不同的回答。第二個部分是說人們在回答調查的問題時,會就心中最容易想到的正反考量點,做快速整體評估,求得其平均值,拿來做為當時回答問題的態度取向。最後一個部分是指出人們在回答問題時,心中所想到的考量點是由某種機率取得的,比如若受訪者在最近曾經想過某個考量點,則這個考量點會有比較大的機會被受訪者使用來決定其態度。

後面所提到的這兩種見解是近年來較被廣泛採用的調查回答心理模式,我覺得是蠻有道理的,而且在這篇文章中有得到實務研究的證實。

比如若有人問我對死刑的看法或態度,我所想到的可能不只是一種意見,讓我可以很容易回答贊成或反對。事實上浮現我心中的,是一組錯縱複雜的想法以及各種不同的考慮,比如我會想到生命的價值與權利、社會成本、以命償命、基督教信仰的主張、誤判或冤獄、被害人與家屬的感受、遏止犯罪等等。這些考慮有些會讓我反對死刑,有些會使我贊成死刑。如果昨天我剛好參加一個由教會舉辦探討廢除死刑的研討會,聽到許多牧者講述為什麼不應該有死刑,今天有人問我這個問題時,我可能會將較多反對死刑的考量點納入評估,而做出反對的回答;不過如果最近我剛好與被害人的家屬有接觸,聽到他們的心聲與感受,受到這些影響,也許我所採取的態度與回答會傾向贊成死刑。

不過這不是說每個人對任何議題都有不明確的態度或考量,每個人應該對某些議題有很清楚的立場,不過應該沒有任何人對所有的議題都已經有斬釘截鐵、恆久不變的意見。大多數人對許多議題應該不是有那麼絕對的態度才對。

影響回答問題的其他狀況作用(context effects)

此外,受訪者回答調查的問題時有時也會受到調查中其他問題的左右。有一份很有名的研究就是在冷戰時期去問美國人贊不贊成讓蘇聯派駐新聞記者進入美國做採訪報導。研究人員將受訪者隨機分成兩組,一組受訪者的問卷中只問這個問題,另一組受訪者在被問到這個問題之前,還有另一個問題問說他們認不認為蘇聯應該接受美國的新聞記者派駐進行採訪報導。研究結果發現,兩組受訪者在對蘇聯記者派駐美國的問題上有很明顯不同的態度,前一組受訪者以反對居多,後一組受訪者當中贊成的比例明顯高於前一組。其實其中的道理不是很難理解,由於後一組受訪者的問卷中的問題,讓他們多了一層「對等」或「平等」對待的考量。

還有,調查方法研究人員也發現,調查中問題的排列順序也是影響受訪者回答的因素之一,特別是當兩個問題之間有關聯性時。比如上一個例子中,第二組受訪者的問卷中,將兩個問題順序對調,也會得到很不一樣的結果。另一個例子是一組受訪者在一份調查中被詢問對整體生活的快樂程度,另一組受訪者在這個問題前還被問到有關婚姻的快樂程度。結果發現第二組與第一組的受訪者對整體生活快樂程度的比例很不一樣,其中主要的關鍵在於第二組受訪者的回答明顯受到其婚姻快樂程度的回答的影響。通常愈籠統的問題(整體生活的快樂程度)的回答較容易受到具體的問題(婚姻生活的快樂程度)的回答的影響,這就是一個實例。

有一個研究是去詢問民眾對好幾個新聞議題或社經事件關切的程度,研究人員發現問題的排列順序會影響每個問題所得到的回答。通常相較於被排在第一個,同樣的問題被排在最後時,所得到受訪者回答密切觀察的程度會較高。這主要是因為當問題排在最先時,受訪者一時回想的印象比較淺,而對於排在後面的問題,之前的問題有勾起受訪者印象或提示的作用,因此受訪者對後面的議題會回答有較密切的關注。

學者也提到問題的問字遣詞也是一個影響回答的狀況因素,比如同樣針對墮胎的議題,一個問題問說是否應該「禁止」(forbid)墮胎?另一個問說是否應該「容許」(allow)讓孕婦決定是否墮胎?兩者所得到的結果是不一樣的,也就是前一個問題贊成的比例與後一個問題反對的比例有不小的差異。

運用

瞭解這些不僅對設計問卷或調查問題很有幫助,也對我們要去解讀或瞭解一個調查的結果或意義很有參考價值。在設計問卷或調查方面,如果調查是有連續性的(比如每季例行的病人滿意度調查),應該不宜去改變問題的順序,也不宜加入與原本的問題有相關的問題,這樣可以降低相關問題所帶來的效應,使前後的結果比較能夠做對照。現在有些用電腦協助的調查,在問題的排序上可以隨機調換,這樣可以減少排序所帶來的影響。

在調查的解讀與瞭解方面,這些探討與問題提醒我們,影響受訪者回答與調查結果的因素有很多,因此我們在解讀時必須特別小心,必須盡可能將重要的影響因素都考慮進來,才比較不會產生偏差與誤導。調查方法絕對不是十全十美的工具,事實上可以出錯的地方非常多,我們不應該毫無批判或警覺地全盤接受。不過如果慎重使用,將各種可能的影響因素考慮好,加以避免或考量,則調查還是可以提供給我們很重要的資訊。

[1] Zaller, J. & Feldman, S. 1992. A simple theory of the survey response: Answering questions versus revealing preferences. American Journal of Political Science, 36(3):579-616.

沒有留言: