Those Unpredictable: 2016美國總統大選(2)：民調調查的權重問題

在昨天(Oct. 25, 2016)，歐亞集團總裁Ian Bremmer在他的Facebook專頁上分享了這張照片。

"如果只有______投票，美國選舉人圖會長這樣。"

這張圖非常有趣，不過也恰巧顯示出，現實不會如同這些圖呈現的樣態：整個社會中，有色人種，不同性別，教育背景混雜的居住再一起。同時，這些圖也顯示出民調統計時，抽樣(Sampling)的重要。

伊利諾州的一位19歲黑人男孩的故事：
我們先問自己這個問題：美國的民意調查如何進行？

在民意調查進行之前，選舉調查機構通常會設定一些抽樣規則。這樣的規則有可能是分州，分區域，或者是透過特定的人口特徵劃分。然後再從這些分層內去隨機抽樣。不論如何，，最後回覆的樣本，調查執行者都希望與全國人口組成樣態越接近越好。

有些民調，透過特定樣態調整權重，來"修正"調查結果的資料。例如：整體母體男女比是48：52，這次抽樣的結果是50：50。那麼就在做一點調整，讓樣本男女比與母體相符。

有了這樣的概念後，我們來看這則報導：

紐約時報(Oct. 12, 2016) 一位伊利諾州19歲男性，如何扭曲全國民調

在這則報導中，記者Nate Cohn報導一項有趣的現象：U.S.C. Dornsife/Los Angeles Times Daybreak的民調，跟別人的民調不太一樣。在選舉的過程中，多數媒體民調多半呈現希拉蕊領先的狀態，但U.S.C/LAT的民調，川普領先的狀況卻占多數。

在這裡我們先注意到，在我這篇討論美國大選預測的文章中，Nate Silver提到他設計的預測結果提高了川普當選的機率。然而，領先方並沒有改變。但U.S.C/LAT民調會被特別注意，是因為他的領先方跟別人都不同。一般來說：統計方法假設的改變，並不會造成這麼大的差距。

這到底是怎麼回事？這位記者與民調單位聯繫，了解民調資料內容。他認為：這項調查這裡出現了兩項問題：特定表態被過度加權，以及使用過去總統大選投票設定抽樣權重。此外，他們使用了所謂的Panel名單，也就是每次民調會訪問同樣的人，而非重新抽樣。

1.) *特定表態被過度放大：

過度加權的問題，來自於這項民調的年齡區分相對狹窄。一般而言，美國的民調最年輕的族群，為18-29歲區間。不過，U.S.C/LAT的抽樣，把這個年齡區縮成18-21歲。而18-21歲男性，大概佔全體投票權公民3.3%。

想要做狹窄的年齡區間抽樣，並沒有甚麼問題。但是在考量回應狀態後，這樣的調查結果就會出現問題。

簡單來說：在做調查後，落在這個分類組的只有15人。為了要讓這些人在整體樣本中符合整體人口的3.3%，就得安排一個權重在他們的意見上。報導中指出，平均增加的權重為5.7，也就是將這15人，當作86人來看。

進一步來說：如果年齡加上性別，就產生這麼大的誤差，那麼年齡加性別加族裔，誤差可能就會更大。換句話說：這位19歲黑人年輕人的意見，被過度放大。他支持川普，民調用他的意見類推全國其他跟他相似特徵：年輕，黑人，男性，進而拉高這群體的川普支持度。

2.) 抽樣權重依據受訪人自我呈報：前次總統大選權重
U.S.C/LAT的民調，還根據前次總統大選權重，來選擇納入民調統計的受訪者。他們的假設為：依照過去支持度，再追問是否轉換投票立場，在考量新納入的投票人，能夠推得較有代表性的民調結果。

當然，我們不希望樣本裡面，民主黨跟共和黨的比率與全國母體不符：太多傾向民主黨，或是太多傾向共和黨人，都會讓樣本推論造成問題。

問題是：誰還記得上次投給誰？甚至，受訪者願意承認上次投給誰嗎？

紐約時報的記者認為，這項加權法應該要被去除。而哥倫比亞大學統計系教授Andrew Gelman建議：透過Mister P：Multi-Level Regression Model(MRP)，可以解決這個問題。

最後，Panel名單。所謂的Panel 名單，就是民調會在不同的時間，重新接觸同一群人。他們不會就每次民調重新抽樣。因此，同樣的偏誤，就會在時間軸上不斷出現。

過度抽樣是好事：找到小群體中的差異性，並降低誤差。
在抽樣時，我們希望抽樣結果能夠貼近整體人口族群的分配狀況。然而，按照這樣的抽樣，人數可能太少。

人數太少會出現甚麼樣的問題？統計公式上，我們可以看到：人數太少，會這群人意見"不準"的問題。

左圖是簡單的標準差的公式。我們可以看到，標準差的大小，會隨著樣本數量改變。我們以1,000人的問卷調查來看：如果要抽樣吻合美國非裔族群人口，約佔13.6%，也就是抽136人。然而，如果我們進行"過度抽樣"，將人數放大到500人，那麼樣本的標準差就會被折半。

√136 =11.66，√500 =22.36 ，分母大概被放大了兩倍，也就是標準差被折半。

然而，這群人被過度抽樣了，那要怎麼樣回到整體樣本中？在做整體樣本的推論時，研究者可以再將每個不同族群的意見重新調整權重，讓每個族群的意見回歸到應有的比率。

皮尤研究中心(Pew Research Center)：過度抽樣可以讓特定族群意見更準，而不是使整體調查出現偏誤。

不過，這裡要注意的是：通常這樣的作法是針對"特定"族群的行為，有較佳的詮釋效果。皮尤中心的這項研究舉的例子，就是一項針對西語裔的民調執行的方法。

從這些方法中的比較，我們可以看出，民調從抽樣，事後加權，再到最後詮釋，都還容有一些不同的"調整"技巧。而這些技巧的應用，以及應用後是否符合現實狀態，都需要更多進一步的解讀。

*在這個議題上，我是依照紐約時報記者撰寫的內容，再加上哥大教授Andrew Gelman提到調整的作法中的描述，撰寫這段內容。歡迎更熟悉抽樣方法的朋友提出意見。

Those Unpredictable

Search This Blog

Wednesday, October 26, 2016

2016美國總統大選(2)：民調調查的權重問題

No comments:

Post a Comment

假想情境：Omicron已在歐洲 (?)