2009年6月20日 星期六

如何評估民意調查的品質?

上學期選修調查研究方法這門課,最大的收穫是瞭解到一份調查中可能有哪些會導致結果偏差的問題存在,而影響到調查的品質。瞭解這些問題不僅有助於自己在執行一份調查研究時能夠盡量加以避免,更有助於評估調查研究的品質或可信度。

我覺得調查研究的頻繁與否應該也是衡量一個國家自由民主、社會發展的指標。越先進、開放的國家越可以看到各種民調活動與結果;政府與學界則相當依賴民意調查來了解國內的民意或社經發展的動態。在臺灣,報章媒體經常報導各種針對某個社會或政治議題所做的民調結果,提供民眾了解社會的重要管道。民調事實上已經與我們的生活息息相關。

不過,每一份民調的品質可能參差不齊,我們不應該照單全收。我覺得「盡信書,不如無書」這句話如果改成「盡信民調,不如無民調」也很貼切。做為一個民調結果的閱聽者,我們必須保持某種程度的警覺與批判性。如果媒體記者在報導每一份民調結果之前,以及每位民眾在閱讀某個民調的結果時,都採取質疑的態度去看待,要求執行機構將民調的內容與過程交代清楚,讓我們能夠判斷該份民調的品質,這樣應該可以刺激或督促這些民調機構做出更謹慎的調查,使民眾較準確地得知社會的動態。

從這樣的角度來看,讓一般民眾具備辨別民調品質的基本能力便顯得相當重要。不過大部分的人並沒有機會接觸這方面的知識,但基本上我覺得這些概念並不難懂,這篇文章是我應用上學期修課的心得,所做的一點嘗試。

學者將調查研究的誤差來源歸納為四大類:(1)覆蓋誤差(coverage error)、(2)抽樣誤差(sampling error)、(3)未回覆誤差(non-response error)、(4)測量誤差(measurement error)。我認為我們可以用這四類的調查誤差做為我們去判斷一份民調品質的架構,以下就每一類的可能誤差,提出相關的問題,並加以說明:

造成覆蓋誤差的問題

調查的母群體是哪些對象?範圍是否很明確?

對於任何一份民調,我們最先要了解它的研究對象是誰?或是這個調查的結果可以代表哪些對象或範圍?每份民調一定有其所設定的研究對象範圍,這也就是調查研究中所說的母群體(population),民調機構在對外公布一份調查結果時,有必要很清楚地交代其調查的母群體。比如一份政府施政滿意度的民意調查,如果沒有說明白其母群體的範圍,我們便沒有辦法知道這份調查的結果到底是代表或反應哪些人的意見。母群體是否界定清楚對後續調查進行有絕對的影響,當民調機構越能夠明確講出該調查的母群體範圍時,通常其調查執行過程也會更準確。如果連母群體都講不清楚,後面所進行的取樣也會跟著很模糊;樣本若失去代表性,所得到結果的可信度也就大打折扣了。

民調機構有沒有一份可以與母群體中所有對象聯絡的正確名單與資料?

當一份民調有很明確的母群體時,無論接下來是要採普查或是抽樣調查,都要知道如何與這些對象接觸/聯繫,以便寄問卷給他們或者跟他們進行訪談。調查術語稱此名單或資料為「取樣清冊[1]」(sampling frame)。民調機構所掌握或採用的取樣清冊內容才是民調真正的母群體,如果調查機構所使用的取樣清冊無法涵蓋其所界定的母群體,其中未涵蓋到的部分便會造成覆蓋誤差。

比如許多民意調查所設定的母群體是國內20歲以上的民眾,可是我們如果仔細去探究,事實上並不是如此。原因是絕大多數的民調都是採用家用電話隨機撥號去取樣,而家用電話隨機取樣的取樣清冊其實是由中華電信的所有家用電話用戶所構成的,並不是個別的民眾;而且有不少20歲以上的民眾未被涵蓋在這個清冊裡面,像是住在營區的軍人、住校的學生、住在護理之家或療養院的民眾等等。因此,這些民調真正的母群體其實是中華電信的所有家用電話用戶,而不是國內20歲以上的民眾,如果這些民調結果要去代表20歲以上民眾的意見,便會產生覆蓋誤差。此外,若以家戶為單位的取樣清冊去調查個別民眾,嚴格來說在分析時必須用適當的權重(weight)去校正[2],否則有可能得到偏差的估計。

民調的方法是甚麼?可能會遺漏哪些對象?

前面的例子讓我們看到,覆蓋誤差直接與調查所使用的方法有關。不同的調查方式會有不同的覆蓋誤差。目前調查研究較常見的方式有:(1)電話訪問、(2)郵寄問卷、(3)家戶訪調、(4)網路調查。電話訪問是最方便迅速,成本也較低的調查方式,且有覆蓋率相當高的取樣清冊,很方便進行隨機抽樣,因此廣受運用。不過除了上述的問題之外,隨著行動電話的普及,有越來越多的民眾不再使用家用電話,這些家戶或民眾就會成為電話訪問的漏網之魚。美國已經有一些研究去探討採用傳統家用電話進行取樣與訪問所造成的誤差程度。我不清楚台灣是否有學者做過類似的探討。目前手機取樣與調查還有一些問題,像是沒有一套完整的全國性取樣清冊(手機用戶的資料是散在各個電信業者)、很多人同時持有兩門甚至更多手機門號、手機計費較昂貴,拒絕受訪的比例較高、手機的接聽場合與習慣也會導致較高的拒絕受訪率,這些都是手機調查所要考慮的問題。

郵寄問卷主要是透過郵局所掌握的家戶地址做為取樣清冊,美國郵局有發展出一套可以設定區域範圍的家戶地址隨機取樣系統,做為郵寄問卷或家戶訪調的取樣方法。這套取樣清冊仍然有其覆蓋率的問題,比如有些集合式住宅大樓是多個家戶共用一個門牌號碼,或是住在照護機構、學校宿舍與軍營中的個人與家戶也是沒有單獨的地址,這些家戶與個人就無法被涵蓋到。此外公司機構與住家的地址經常是混在一起,不容易區分。

拜網路的普及,網路調查有越來越普遍的趨勢。不過一般來說,即便是參與人數眾多,利用網路去進行一般民調時,覆蓋率仍有很大的問題,我們必須特別注意。最主要的原因是網路的普及率與100%仍有一大段距離,就算是100%,並不是每一個人都會使用電腦或上網,這些沒有網路或不使用電腦的人便無法被網路調查所覆蓋到。

目前較常見的網路調查有兩大類,第一類是一些大型入口網站(如Yahoo, MSN等)針對某種議題所進行的攔截調查(intercept survey),比如有時候我們進入或在瀏覽某個網站時,會跳出一個邀請我們參與網路調查的頁面,這就是攔截調查。第二類網路調查是有一些調查網站或機構會透過網路去邀請並收集一群願意接受網路調查的民眾名單,做為該機構或網站實施各種調查的受訪對象,調查術語稱此為Opt-in panels。有些機構所建置的名單數量相當龐大(好幾萬,甚至好幾十萬人),然後這些機構再根據調查主題的性質以及其名單中參與者的基本資料,隨機篩選出樣本,再寄發網路問卷給被篩選到的受訪者。這兩種方式基本上都不是機率取樣(probability sampling),而是屬於方便取樣(convenience sampling)。他們所使用的取樣清冊只包含那些有意願或興趣參與網調的網友,而不是一般民眾。雖然有些使用這些網調方法的機構或網站,強調其所使用的取樣清冊名單或樣本在重要的人口特徵(如性別、年齡、職業、教育程度等等)與整體人口的情況很相似,但是這些有意願或興趣參與網調的網友很有可能在一些動機或想法上有別於一般民眾,所以還是無法確定所得到的調查結果有多大的代表性。

但這不是說所有的網路調查都沒有代表性,使用網路可以針對特定的對象進行具有相當代表性的調查,比如某家公司或機構若要進行員工滿意度調查,而其每位員工都有電子郵件信箱,也都可以在機構內使用電腦與網路的話,那透過網路去進行調查是很恰當的方式。此外,如果某個網站想要對其使用者進行意見調查,用攔截調查也是一個好方法。在這兩個例子中,都有很清楚的調查母群體與取樣清冊,大大降低覆蓋率不足以及後續取樣的代表性偏差所衍生的問題。

我認為覆蓋率是調查最關鍵的要求,如果所使用的取樣清冊與母群體之間有嚴重的落差,不管後面的取樣方法有多正確、樣本數有多大、問卷內容設計的多好、統計分析的方法有多嚴謹,基本上所得到的結果都可能是有偏差的[3],更嚴重的是我們無法知道偏差的程度有多大。因此在評估一份調查的品質時,我們一定要去質疑或確定這份調查是否有覆蓋率的問題。

造成抽樣誤差的問題

民調的樣本是透過甚麼方式選擇的?是機率取樣,還是非機率取樣?

當一份民調有很明確的母群體以及覆蓋率很高的取樣清冊時,我們接下來要關心的是取樣的過程與方法是否恰當。掌握一份完整的取樣清冊的好處是可以讓研究人員很容易進行機率取樣,而根據不同的機率取樣方法,研究人員便可以估算調查的抽樣誤差。調查的抽樣誤差是所有抽樣調查都一定會發生的誤差,不過透過機率抽樣方法的運用,研究人員可以將抽樣誤差控制在可以估算且可以接受的範圍。主要的幾種機率取樣方式包括:(1)簡單隨機抽樣(simple random sampling, SRS)、(2)系統抽樣(systematic sampling)、(3)分層抽樣(stratified sampling)、(4)群集抽樣(cluster sampling)[4]。比較複雜的調查可能會混合運用這些抽樣方法。

有時候研究人員可能因為沒有適當的取樣清冊,或者因為某種原因而捨取樣清冊不用,改用非機率取樣去選取樣本。常見的非機率取樣方法有:(1)便利抽樣(convenience sampling)、(2)立意抽樣(purposive sampling)、(3)配額抽樣(quota sampling)。在這些情況下,不管樣本數有多大,我們都無法去估算調查的抽樣誤差,也就是說我們無從去判斷這份調查結果準確的程度有多大,因此所獲得的結果只能參考參考,千萬不要太信以為真。

樣本數是多少?

在機率取樣的情況下,樣本數是決定民調抽樣誤差的主要因素。樣本數愈大,抽樣誤差愈小,民調結果也就愈能夠準確反應真實的情況。更精確來說,一份民調所需要的樣本數大小決定於幾個因素:(1)母群體的大小、(2)信心水準、(3)抽樣誤差的範圍、(4)民調的現象出現比例。母群體是某次民調要研究的所有對象,也是這份調查的結果可以代表的那一大群個體。一般來說,當母群體愈大,所需要的樣本數也愈大。可是很有趣的是,當母群體大超過某一個程度之後,在其他要求條件不變的情況下,所需要的樣本數幾乎不須要額外增加,這是抽樣民調的最主要優點—讓我們透過有限的樣本去了解廣大民眾的意見。信心水準與抽樣誤差範圍都是衡量民調品質的主要指標。由於透過抽樣的管道去探討某種現象,我們只能用所得到的樣本去估算該現象可能的發生比例,不太可能獲得真正的答案,不過統計學可以提供我一個在某種信心水準(通常都設定在95%)的估算區間,這表示如果我們能夠重覆取樣100次的話,應該會有95次的估算值會落在這個估算區間(通常以估算值加減多少百分比來表示)之內。當我們要求的信心水準愈高,或所容許的估算區間就愈小,所需的樣本數就越大。最後,民調的現象出現比例就是我們進行調查最想了解的,比如對執政者施政滿意度,通常是有多少比例的民眾對政府的施政表示滿意。事實上研究者並不知道這個比例值(假設是p)是多少,還好我們可以設定某些特定的狀況,去估算樣本數。因為會影響樣本數的是p與(1-p)的積,即p(1-p),而當p=0.5時,p(1-p)會最大,因此一般都採取較保守的方式,寧願高估,不要低估樣本數的原則,假設p=0.5,去估算樣本數。藉此所估算的樣本數,可以確保抽樣誤差不會超過我們的估算區間。

以在國內進行的一般民調為例,假設母群體是國內20歲以上的民眾,2008年底台灣20歲以上人口總計超過1750萬人,若以1800萬人算,信心水準訂在95%,抽樣誤差範圍定在±3個百分點,所需要最多的樣本數是1068。

調查結果的抽樣誤差範圍有多大?

每一份民調應該至少要交代清楚該民調的抽樣誤差。最近世新大學民調中心指導公共關係系學生進行的「台灣樂活大調查」,就有下面的描述:「這項調查根據全國各縣市15歲以上民眾進行分層比例抽樣,5月19至21日進行電話訪問,成功訪問1189 份有效樣本,在95%的信心水準下,抽樣誤差不超過正負2.84個百分點。」該調查所得到的一個結果是:民眾認為最重要的樂活行為是每天固定運動,佔59.2%。59.2% x 2.84%=1.68%,也就是說,這份調查在該項目上面的估算區間是[57.52, 60.88](59.2%±1.68%)。

不過我們不要忘了,一份民調的誤差不只是抽樣誤差而已,其他的誤差也同樣重要,而且可能更不容易客觀去估算。以下接著討論未回覆誤差(non-response errors)的問題。

造成未回覆誤差的問題

未回覆率是多少?

假如我們有一份涵蓋母群體中的取樣清冊,並從中抽出具有能夠代表母群體的樣本,對樣本中的個體進行調查。可是在實際的狀況中,很少能夠達到100%回覆率,經常是樣本中的一部分對象願意接受調查或回填問卷,另一部分的對象不願回覆,因此我們所收到的實際民調回覆數並不齊全,與樣本數有落差。這種情況一方面會減少樣本數,產生較大的抽樣誤差,另一方面如果未回覆的對象與樣本中其他對象在民調議題上有很不一樣的意見時,便會導致未回覆誤差。

對單純的民調來說,回覆率當然愈高愈好,這樣的結果愈能夠代表母群體整體的情況。但是對選舉民調來說,情況不一定是這樣,因為如果未回覆人傾向不去投票,為了降低未回覆率,刻意請這些人表達投票意向,反而有可能扭曲所預測的選舉結果。

就我所知,台灣的民調在公布時,有些會交代未回覆率,有些則沒有交代。比較嚴謹的民調應該是要交代未回覆率。舉TVBS最近公布的國內民眾對今年下半年展望的民調為例,就有比較詳細的說明:「本次民調是TVBS民意調查中心於6月2日及3日晚間18:30-22:00進行的調查,共接觸1,335位20歲以上台灣地區民眾,其中拒訪為275位,拒訪率20.6%,最後成功訪問有效樣本1,060位,在95%的信心水準下,抽樣誤差為±3百分點。抽樣方法採用電話號碼後四碼隨機抽樣,人員電話訪問,所有資料並依母體性別、年齡、地區、教育程度、政黨結構進行統計加權處理。調查經費來源為TVBS。[5]

未回覆的可能是哪些對象?

在知道未回覆率之後,我們便要進一步去探究,未回覆的可能是哪些人?或者去了解是哪一類的人。如果該份民調有收集一些受訪者的基本資料(如年齡、性別、教育程度、居住地區,政黨支持傾向等),研究人員可以從比較最終樣本的組成與母群體組成之間的差異,去描述拒訪者的特質(假設原先的取樣很能夠反應母群體的整體條件),這有助於研究人員在分析時進行未回覆率的校正。我認為一份負責任的民調應該要交代拒訪率或未回覆率,同時呈現最終樣本的組成分析,如果可以的話,並說明最終樣本與母群體之間有何顯著的差異。

調查的議題是甚麼?

如果民調公布時並未提供這些訊息,我們也可以根據該民調的性質或主題試著去思考有哪些對象比較可能拒訪或未回覆。以前面提到的世新大學學生所做的「台灣樂活大調查」為例,這個民調的議題與用詞有比較濃厚的年輕人與都會型色彩,若再加上如果學生的電話訪問是採用國語[6],那可能對居住在鄉村、年長、非國語使用者的對象比較引不起興趣(或者無法了解調查的內容),受訪的動機也會比較低,那麼這個民調的未回覆率就會導致這些人的意見受到低估,而住在都會、較年輕、國語使用者的意見會被高估。如果這兩群人對此議題的想法有明顯的差異,民調的結果便會產生偏差,這便是未回覆誤差。

敏感議題也比較容易導致拒訪或較高的未回覆率。通常未回覆率是就整份調查來計算的,其實更仔細的話是應該要就每一個問題去看未回覆率。有時一份民調中會有一部分較敏感的問題,其未回覆率要比其他問題來得高。

調查是由哪一個機構執行的?

許多研究已經知道,調查的參與與否和受訪者對該調查機構的喜好或信賴程度有密切的關係。所以,對於由國民黨所執行的民調,泛綠民眾的拒訪率應該會比較高,因此這些民調的結果會低估泛綠民眾的意見。相反地,對於由民進黨所執行的民調,泛綠民眾的回覆率會偏高,這些民調的結果因此會高估泛綠民眾的意見。最近民進黨民調中心公布一份對馬英九總統兼任國民黨主席的民調[7],指出約有六成的民眾反對,我認為應該會有高估的可能(如果這份民調沒有考慮這個因素的話)。

很有趣的是,在國人的心目中,媒體也是有特定的政治色彩,因此由媒體民調中心所做的民調,也有類似的問題。有位學者劉夏念[8]比較聯合報、中國時報與TVBS民調中心在2008年台灣總統大選所做的民調結果,推估聯合報民調中,未表態選民約有75%把票投給長昌配,25%投給馬蕭配;中國時報民調中,未表態選民約有70%把票投給長昌配,30%投給馬蕭配;TVBS民調中,未表態選民的藍綠隱藏支持度約是65%與35%。他認為這個「藍綠隱藏支持比」間接表示了這些媒體在選民心目中的「藍綠屬性程度」。這是因為「受訪選民傾向拒絕透露自己的投票意向給予和本身政治立場不相同的媒體民調機構。因此,綠色選民受訪者如果認為某一媒體「愈藍」,就「愈不願意」透露其本身投票意向;綠色選民傾向不信任那些在他們(她們)眼裡視為「親藍」媒體的民調系統,因為他(她)們不相信自己的意見會得到公平的呈現,他(她)們害怕擔心自己的投票意向會受到不當的資訊利用。」如果這樣的觀點沒錯的話,那或許可以看出在一般選民(特別是綠色選民)的心目中,聯合報親藍的程度要大於中國時報,中國時報又大於TVBS。
這並不是說媒體所做的民調都不可信,事實上根據這個論點,如果這些媒體在選民中的政黨或意識形態取向沒有太大的改變的話,這些民調中心還是可以根據這些資料進行民調結果的校正,相當準確地預測選舉結果。不過這提醒我們,在觀看到這些媒體民調中心所做的民調結果時,要去注意該民調是否有進行受訪民眾政黨支持傾向的校正,將拒訪或未表態民眾的意見考慮進來。此外,對於非政治性議題的民調,這樣的影響可能會減輕一點。

所以,在評估未回覆所造成的誤差時,我們必須知道未回覆率的大小、未回覆或拒訪的原因是甚麼、以及這些未回覆對象與回覆對象在該民調議題上是否有明顯不同的意見,來評估可能的未回覆誤差程度。

造成測量誤差的問題

調查的性質是甚麼?

測量誤差是指調查的回覆者所提供的回答錯誤或不準確所造成的誤差。測量誤差有可能是故意或非故意的,比如病人在住院期間填寫醫院服務的滿意度調查時,擔心負面的意見會被醫療人員知道,因此故意只提供正面的評價。有時候問卷的填寫人或調查的受訪者不了解問題的意思,於是隨便找個答案回答,或者對問題理解錯誤,而填入錯誤的答案。這些都是屬於調查的測量錯誤。

前面提到的選舉民調中未表態受訪者如果事實上已經有投票意向,但基於對民調機構的不放心,而故意回答「尚未決定」或「不知道」,這也會造成民調的測量誤差。

學者將調查研究分為兩大類,一類是事實或行為的調查(如生活習慣、就醫情形的調查),另一類是意見、態度、或感受的調查(民意調查大多屬於此類)。受訪者在回答前者的問題時有比較客觀的根據,但在回答後者的問題時所依據的是主觀的判斷。前者的測量錯誤多半是因為回想錯誤所引起的,後者的測量錯誤主要原因包括沒有明確的意見、受當時環境的影響、敷衍了事(satisficing)、符合社會期待(social desirability bias)[9]、或對敏感議題的顧慮等等。

民調問卷的編排是如何設計的?

影響民調測量誤差最大的因素是問題的設計與問卷的編排。在問題的設計方面,重要的考量點有:調查的問題清不清楚、會不會模稜兩可?是否一個問題只問一件事?問題是否是中性、不帶任何立場或隱涉特定價值判斷?問題所用的句子是否簡單且平舖直述?所用的詞彙是特定人士才懂的術語,還是一般人都能夠瞭解的用詞?這些因素都會直接影響到受訪者對調查問題含意涵意的理解,以及後續回答的正確性。

回答選項的設計也是影響問卷品質的關鍵之一,每一個問題的回答選項不能有重疊的情況,而且必須涵蓋所有可能的回答選項;如果是採取正負兩端的選項設計(比如從最同意到最不同意),正反意見的選項必須平衡,中間是中立的選項(沒有特別的意見)。此外,有些問卷有「不知道」或/和「拒答」選項,有些問卷則否。前者容許受訪者不表態,可是遺失或空白資料會比較多(未回覆誤差);後者強迫受訪者表態,但是可能導致較多的測量誤差。

在問卷的整體編排上,必須注意連貫與流暢,不要使受訪者在問卷中迷路;也不要用太困難回答的方式(像是要受訪者排列優先順序或重要性),否則受訪者不是放棄受訪,就是敷衍了事,增加測量誤差。還有,有些問題的排列順序也會影響受訪者的回答。比如在調查民眾對定期運動的態度時,其中有兩個問題:(1)您認不認同「定期運動能夠維持或促進健康」?(2)您認不認同「我所居住的社區有足夠的運動設施」?對第二個問題來說,排在(1)之前,與排在(1)之後,所的到的答案可能是不同的,這是因為第一個問題可能會提醒許多受訪者定期運動的重要性,進而改變這些受訪者對運動設施的態度。

民調是如何執行的?

不同的民調執行方式有不同的測量誤差要考量。一般來說,郵寄或網路民調的隱私性或匿名度要比電話訪問來得高,電話訪問給受訪者的安全感又比當面訪談來得高。因此對於有爭議性或敏感性的民調,訪談的方式比郵寄或網路調查的測量誤差機會來得高。此外,研究也發現受訪者在回答問題時,會受到回答選項的先後順序影響,在紙張問卷或網路調查中,受訪者是靠視覺去選擇答案,因此第一個看到的回答選項被選擇的機率會高於其他選項(學者稱此為primacy effects);相反地,在電話或當面訪問的調查中,受訪者是憑聽覺去回答問題,這時受訪者會傾向選擇最後聽到的一個選項(學者稱此為recency effects)。現在有很多電話訪問或網路調查在電腦的輔助下,可以做到使回答選項排列方向隨機變化,以降低這些效應。

此外,紙張問卷的民調必須考慮到受訪民眾的識字能力;而訪問式的民調則必須考慮所使用語言的問題。目前大多數的民調都是採用電話訪問,應該有必要交代是使用哪一種,或哪些語言來進行民調。

電訪或家訪民調中,訪調員的經驗與素質也會對調查品質造成影響,民調中心必須使用經過訓練的訪調人員,以降低未回覆率,同時提高民調的測量準確性與一致性。

用以上的查檢表來檢視台灣的民意調查,我覺得可以努力的空間還很大,大部分的民調機構在公布民調結果時都相當籠統,交代不清楚,無從讓人評估其品質,也無法讓我們對其結果有十足的信心。美國有些著名的民調機構,如Pew Research Center for the People & the Press[10],對其民調的執行過程與分析方法都有相當詳盡的說明,並提供問卷內容供民眾下載,甚至有些還可以下載分析資料。我相信當民調中心對這些資訊愈透明,愈是負責任的表現,也愈能夠取信於社會。更重要的是,如果大多數民眾與媒體工作者具備評估民調品質的能力,對民調品質的要求愈高,民調機構在執行與公布民調過程中會更嚴謹,這時民調會真的成為了解社會民意的途徑,而不是成為製造民意或左右民意的工具。

[1] 取樣清冊(sampling frame)有很多種形式,不一定是記載於一本冊子中的名單。比如某個摸彩活動中,裝在摸彩箱裡的所有參與者的號碼簽條就是一種取樣清冊。如果我們要用系統取樣去研究醫院某一天病患滿意度調查,假如所有的病人都會去批價,則到批價處排隊等候批價的病患就是一份取樣清冊。
[2] 隨機取樣的基本原則是所有母群體中每個個體被抽中的機會是相同的,但是在從家戶中取出個別民眾時,每家戶中的成人民眾被抽到的機會不一樣。從兩個20歲以上成人組成的家戶被抽到的民眾代表兩個成人,而從四個成人組成家戶抽到的民眾則代表四個成人(假設一個家戶中所有成人的意見都是相同的),因此後者應該被賦予較高(2倍)的權重。
[3] 請參考這篇文章所舉生動的實例http://tw.myblog.yahoo.com/mclee632008/article?mid=2076&prev=2081&next=2075
[4] 請參考http://thchou.blogspot.com/2009/04/sampling-methods.html
[5] 請參考http://www.tvbs.com.tw/FILE_DB/DL_DB/even/200906/even-20090609185818.pdf
[6] 這必須進一步去看調查所用的問卷內容的用詞才能確定;此外,嚴格來說,採取電話訪問的民調也應該要交代是使用哪一種語言。
[7] 請參考http://www.dpp.org.tw/news_content.php?menu_sn=7&sub_menu=43&sn=3810
[8] 請參考http://www.npf.org.tw/post/1/4076,與 http://www.npf.org.tw/post/2/4312這兩篇文章

[9] 請參考http://thchou.blogspot.com/2009/02/blog-post_15.html
[10] 請連結http://people-press.org/

2 則留言:

匿名 提到...

分析的很棒,很清楚,謝謝分享。

盧秉謙 提到...


老師您好,關於您有一段話我不太了解:

「該調查所得到的一個結果是:民眾認為最重要的樂活行為是每天固定運動,佔59.2%。59.2% x 2.84%=1.68%,也就是說,這份調查在該項目上面的估算區間是[57.52, 60.88](59.2%±1.68%)。」

想詢問老師為什麼估算區間不是59.2%±2.84%,而是59.2%±1.68%?也就是說,為什麼需要59.2% x 2.84%=1.68%?

由於對於抽樣誤差有些疑問,偶然間看到您的這篇文章,故有此一問。

不好意思冒昧留言,感謝老師撥冗回答。