2009年6月1日 星期一

從研究方法看消費券效果的評估

在學術研究的主題中,某種措施或方案有沒有效果一直是一個讓人很感興趣的題目。在醫學方面有很多研究都在探討服用某種藥物對病人病情或症狀是否有所改善,以及某種癌症手術的施行對病人的存活率有否幫助;公共衛生學者經常會針對某種健康介入措施(如定期運動或健康篩檢)對健康改善或疾病及早的發現與預後是否有正面的影響,或者某種保健政策(如補助年長者施打流感疫苗)對民眾的健康有否產生功效等主題進行研究。在經濟學或政治學領域,公共政策的實施效果更是一個重要的研究對象。

最近台灣政府所實施的政策中,最受到廣泛討論的可能就是消費券的發放。政府為此花了八百多億的經費,希望藉此刺激民眾消費與景氣。到底這個政策有沒有效?是否有達成原先設定的目標(發揮加乘效果,挹注GDP一個百分點)?一直是各界關切與討論的議題。最近聽說政府委託學界進行的評估報告即將出爐,屆時答案應該可以揭曉。不過這禮拜已經可以在媒體上看到不同學者對消費券效果評估不同的意見。這也可以讓我們瞭解到這一個看似簡單的問題,事實上並沒有想像中的那麼直接了當。

前經建會主委,現任台灣智庫董事長陳博志教授從消費券替代一般貨幣(金錢)的角度去分析,他的研究「鎖定農曆年前央行現金發行量,檢視民眾使用現金是否比正常情況減少;換言之,減少的程度,大致就是消費券替代現金的程度,也就是消費券『沒有發生作用』的程度。若民眾把消費券用在新增加的支出,要領出來的現金就不會減少,反之,若民眾把消費券用在原本就要買的東西上,則領出來的現金就會比正常時期少。」陳博志教授接著指出:「據央行資料,一月十八日發放消費券後,十九日至廿三日這五天央行新台幣發行額銳減,和二○○六至二○○八年三年平均值比較,足足少了四四五億元。再拿景氣和今年一樣差的二○○二至二○○三年的平均發行額比較,今年的發行額也減少了四四七億元。」這個數字跟估計在這段期間開始流通的消費券金額四三六億非常接近[1],使得他的假設(民眾只是將消費券拿來替代在這段期間原本要支出的現金,並沒有額外增加消費,因此對GDP並沒有挹注效果)得到支持。

針對陳博志的質疑,現任經建會主委陳添枝表示:「政府發放消費券造成民眾農曆年期間減少持有現金,並不意味著消費券所創造的消費完全是『替代消費』,就像『寒冷的冬天燒一把火』一樣,從過年期間大型賣場人潮,與搭配促銷盛況可以看出,消費券是有效的。陳添枝強調,如果光看一月十八日發放消費券後,零售、餐飲業營收數據,都比去年同期增加一成以上,就可以看出消費券效果十分明顯。」他說:「現鈔發行量多寡,是央行依據民間需求自行決定的,陳添枝說,央行過年期間印製很多新鈔,主要是應付民眾提領需求,現鈔發行量只占總體貨幣供給很小比率。」陳添枝還認為,「就算台灣地區農曆年前新台幣現鈔發行量減少,也不能以此主張減少的四四五億元發行量(相當於消費券預算的一半),就是消費券在過年期間替代了現金;畢竟一般民眾可以用信用卡、現金、消費券等多種支付工具消費。因此,消費券效果應該從民間實際消費金額去分析。」[2]

我覺得這兩位學者說的都有道理,但是他們所討論的是兩件不同的事。陳博志教授的分析是依據著名的經濟學者蔣碩傑所提出的「支出之前要先擁有貨幣」的理論,也就是消費者進行消費的前提是手上要有錢,消費者手上的現金多寡決定消費的程度,因此我們可以從民間貨幣或現金流通的變化去評估整體消費的變化。在他所研究的這五天期間中,雖然消費券發出了四百多億,可是央行發出的現金也減少了四百多億,等於民間的整體現金總額並沒有明顯改變,當所有民眾手頭上的現金總額沒有改變時,整體消費額度也就不會有大幅改變。這也就是說雖然消費券發了,可是整體消費量並沒有明顯改變,當然對GDP的成長便沒有貢獻。

陳添枝教授為政策辯護所提出的論點是說評估消費券的效果不能光從民眾手上持有多少現金來看,而是要直接去看消費券發放前後市場整體實際消費金額是否有變化,畢竟民眾在消費時除了可以使用現金之外,也可以使用信用卡等非現金的方式。因此,在評估消費券的效果時,陳博志所使用的是間接的指標(消費者所持有的現金總額的改變),陳添枝主張使用直接的指標(市場消費總額的變化)。

此外,評估期間也是一個關鍵所在。陳博志教授明確指出他所使用的比較期間是1月19-23日這五天,這五天裡民眾因為剛取得消費券(也是另一種形式的現金),而減少現金的持有是很正常的現象;重點應該在後續的發展。如果民眾只是拿消費券來進行原本就要做的消費,當消費券用完之後,就回歸平常的消費情況,那消費券就沒有產生額外的效果。不過如果當消費券使用後,民眾擴大消費習慣或增加消費的欲望,或者將這五天沒有使用的現金一併拿出來做消費,則消費券便有達到刺激消費的作用。因此,陳博志教授應該也要比較春節過後央行所發行現金總額是否與去年同期有明顯變化,才能做出更完整的推論。

陳添枝主委並沒有明確指出其比較的期間,只說是觀察消費券發放後,或過年期間,賣場熱絡的情況或某些行業營收較去年同期增加。姑且不論他的觀察是否準確,消費券發放後所帶來的立即消費熱潮是可以預見的,因為民眾等於取得了一些一定要要用來消費(不能存起來)的現金,但這並非消費券真正效果的所在。問題在於,這種由消費券所引起的立即消費現象能夠持續多久?熱潮一過之後民眾是否會將自己的3600元再拿出來進行消費?或者乾脆將3600元長期存進銀行。

在評估消費券的效果(對GDP成長的貢獻)上面,比較期間不同可能會導致很不一樣的結論。除了比較期間的長短之外,比較期間基準的選擇也會有很大的影響。如果我們要以一季的GDP做為比較期間,那我們應該是拿今年第一季去與去年同期(2008年第一季)做比較,還是與今年第一季的前一季(去年第四季)做比較?由於消費起伏通常有季節性,因此較理想的情況是與去年同期作比較。不過由於去年同期的景氣尚未受到美國金融風暴的影響,而消費券的發放主要是希望刺激國內經濟走出金融風暴所帶來的不景氣,兩者的環境因素並不相同,直接進行比較會有問題。這時或許將今年第一季(消費券發放當季)與同樣不景氣的去年第四季相比應該也是一種可行方式,不過必須考慮每一季的GDP起伏變化的因素,並予以校正。

另外一個評估角度,也是某些馬政府財經官員所持的觀點,是去問消費券發放與否對GDP有何改變?這些官員說就算消費券有很大比例只是替代現金,但是有發放有刺激,若沒有發放消費券的話可能GDP負成長更大,即使消費券沒有產生增加GDP的作用,若能減緩GDP的負成長,那也是一種正面的貢獻。問題在於,沒有人確實知道今年第一季若沒有消費券政策的話,景氣情況或整體的GDP會是怎樣。所以這種假設性的評估並不實用。

我對景氣變化評估完全是門外漢,不過若從研究方法的角度來看,理想的方案評估方式,如果能夠採用下面的這種研究實驗設計是最好的:

(R)---OE1-------X-------OE2
(R)---OC1----------------OC2

在此暫稱為「消費券效果實驗」中,我們從台灣18歲以上的成人(母群體)中隨機抽出1000人組成研究樣本,再將這1000人隨機分配到實驗組(experimental group,用E代表)與對照組(control group,用C代表)各500人。(R)就是指實驗組與對照組的組成是藉由隨機分配所形成的,以確保這兩組樣本在基本特徵上有相似性。

這份實驗的介入措施是消費卷的發放(用X代表),只有實驗組的人得到消費券,對照組的人沒有拿到消費券。然後我們要比較這兩組人在消費量的變化上面有沒有明顯的不同。OE1是實驗組的人在發放消費券前(第一階段)的總消費金額,OE2是實驗組的人在發放消費券後(第二階段)的總消費金額;OC1是對照組的人在第一階段的總消費金額;OC2是實驗組的人在第二階段的總消費金額。由於我們所要關切的是消費券所創造的消費(加乘)效果,因此OE2應該是實驗組的人在第二階段的總消費金額扣掉所得到的消費券總價值,這樣才能公平地比較這兩組消費者在消費券之外的消費總額的改變是否有所不同。如果研究者認為消費券有效果的話,這份研究的假設應該是(OE2 - OE1) > ( OC2 - OC1)

這樣的實驗設計很簡單,應該可以做為消費券政策實施前的效果測試評估,做為是否全面實施的根據。不過由於這樣的實驗規模很小,而且有很多實驗中人為因素的干擾,或者因為參與實驗所造成的心理作用,因此與真正的情況(全面發放消費券所產生的效果)之間可能還是會有落差。最佳的評估還是要從實際狀況中去進行。

要在實際的狀況中去評估消費券所創造的消費效果所使用的研究設計與前述的實驗設計很相似,以下面圖形表示:

OE1-------X-------OE2

OC1----------------OC2


這個研究設計與前述的實驗設計唯一不同的地方在於沒有透過隨機分配的過程去形成實驗組與對照組,因為實際上政策的實施對象不可能是隨機決定的,而是具有某種條件的人,或者全民。如果這次消費券只發放給中低收入民眾,那我們便可以比較中低收入民眾(實驗組)與非中低收入民眾(對照組)在政策實施前後消費金額的改變有沒有不同。問題是,這次消費券是發放給全民,因此缺乏對照組。如果有部分民眾未領取及使用消費券,那這些人可以成為對照組的樣本,但是如果這些人與其他有領取消費券的民眾在背景特徵上有很明顯的差異的話(比如這些人非常富裕或其生活與世隔絕,或者這些人有很大的比例是主張簡樸生活,反對過度消費),那這樣的比較也會造成很大的誤差,無法讓我們看清消費券的確實效果。

另外一種比較方式,是拿去年同期做為對照組,由於去年同期並沒有發放消費券,如果今年第一季(消費券發放後)與去年第四季(消費券發放前)的消費總額的差別明顯大於去年第一季與前年第四季消費總額的差別,那其中的變化也許是消費券所造成的。但是這個方式必須是這兩段期間中除了消費券的發放之外,並沒有其他會影響消費的不同重要事件。

還有一個比較方式,是拿其他財經狀況相似,但未實施消費券政策的國家來做為對照組。不過要找到一個比較基準很相近的國家並不容易。

另一篇採訪報導[3]中提到:「陳博志與一起合作研究的劉錦添,打聽到經建會委託進行消費券研究的是吳中書,甚至向吳『旁敲側擊』。陳博志推測吳的分析方法不外乎是計量模型和回歸分析,『一定是擺一個虛擬變數,那都是間接的方法』,和醫學界進行『吃肉是否造成高血壓』的研究一樣,做出的報告什麼結果都有,取決於要擺哪些變數,『那樣的研究是不可靠,可以操弄的。』陳博志相信,他採取的研究理論不用技巧,直接看替代效果,因為過年期間的錢大部分都是要花掉的,為什麼用替代效果做?因為替代效果是檢視的第一步,如消費券取代現金,就沒有後面的乘數效果,一旦產生替代效果,後面廠商再拿去進貨,還是無效。」

我對經建會所委託的消費券評估研究採用的計量方法也很感興趣,但不清楚經濟學者會使用怎樣的計量模式。不過我想陳博志教授在這裡所提到的應該是指參數分析(parametric analysis)與非參數分析(non-parametric analysis)的差別。他強調自己所使用的是非參數分析比較的方式。

非參數分析技術,顧名思義,就是我們在進行資料分析以前,不須先假設或構思計量分析的參數模式,而完全由手上所掌握的資料去進行估算,因此分析的結果不會受到研究人員所設定的參數的影響,而是直接藉由資料的比較、分析與運算來告訴我們結果。

相對來看,古典迴歸分析是典型的參數分析方法,當研究分析人員使用迴歸分析時,必須先建構參數關係模式(描述變數之間關係的數學公式,比如y=β0+β1x1+β2x2+β3x3,此處x1~x3就是參數或變數),再去進行資料分析。古典迴歸分析的結果則會受到我們所使用的關係模式的影響,當我們使用不同的關係模式時,即使是同樣的資料,也可能得到不一樣的結果。

此外,由於非參數分析技術不必像參數分析方法要去假設變數的分布狀況,也少了很多相關的分析前提與假設,因此受限程度也比較低。比如一般的迴歸分析多半必須假設應變數的分布是呈常態分布。非參數分析較不需要這些假設,而是忠實地照我們所給的資料去做分析。

不過,我認為不能因為參數分析可能會受到人為因素左右就加以全盤否定,應該是去看所使用的參數模式有沒有道理。無論是參數或非參數分析方法,都必須有理論做為基礎。參數模型中所使用的參數(變數)不能憑空臆測或增減,而是要有理論或文獻根據。同樣地,非參數分析若要得到正確的結果,也不能隨便拿資料來比較,而是要用理論來引導分析比較的進行。

要進行一份客觀正確的方案評估研究並不容易,首先要決定能夠正確衡量結果的指標(這要對方案本身與其實施背景有很深入的瞭解),然後要規劃妥當的研究設計,包括實驗組、對照組(客觀的比較基準),選擇有理論根據、合理的分析比較方法或模式,才能得到可靠的結果。

[1] 請參考http://tw.news.yahoo.com/article/url/d/a/090530/4/1kcwh.html
[2] 請參考http://tw.news.yahoo.com/article/url/d/a/090530/4/1kcwj.html
[3] 請參考http://tw.news.yahoo.com/article/url/d/a/090530/4/1kcwk.html

1 則留言:

就愛健 提到...

版主您好
我覺得你文章寫的真是很有內容
也不會讓人覺得太難懂
我以後會常來拜訪