"如果只有______投票,美國選舉人圖會長這樣。"
這張圖非常有趣,不過也恰巧顯示出,現實不會如同這些圖呈現的樣態:整個社會中,有色人種,不同性別,教育背景混雜的居住再一起。同時,這些圖也顯示出民調統計時,抽樣(Sampling)的重要。
我們先問自己這個問題:美國的民意調查如何進行?
在民意調查進行之前,選舉調查機構通常會設定一些抽樣規則。這樣的規則有可能是分州,分區域,或者是透過特定的人口特徵劃分。然後再從這些分層內去隨機抽樣。不論如何,,最後回覆的樣本,調查執行者都希望與全國人口組成樣態越接近越好。
有些民調,透過特定樣態調整權重,來"修正"調查結果的資料。例如:整體母體男女比是48:52,這次抽樣的結果是50:50。那麼就在做一點調整,讓樣本男女比與母體相符。
有了這樣的概念後,我們來看這則報導:
紐約時報(Oct. 12, 2016) 一位伊利諾州19歲男性,如何扭曲全國民調在這則報導中,記者Nate Cohn報導一項有趣的現象:U.S.C. Dornsife/Los Angeles Times Daybreak的民調,跟別人的民調不太一樣。在選舉的過程中,多數媒體民調多半呈現希拉蕊領先的狀態,但U.S.C/LAT的民調,川普領先的狀況卻占多數。
在這裡我們先注意到,在我這篇討論美國大選預測的文章中,Nate Silver提到他設計的預測結果提高了川普當選的機率。然而,領先方並沒有改變。但U.S.C/LAT民調會被特別注意,是因為他的領先方跟別人都不同。一般來說:統計方法假設的改變,並不會造成這麼大的差距。這到底是怎麼回事?這位記者與民調單位聯繫,了解民調資料內容。他認為:這項調查這裡出現了兩項問題:特定表態被過度加權,以及使用過去總統大選投票設定抽樣權重。此外,他們使用了所謂的Panel名單,也就是每次民調會訪問同樣的人,而非重新抽樣。
1.) *特定表態被過度放大:
過度加權的問題,來自於這項民調的年齡區分相對狹窄。一般而言,美國的民調最年輕的族群,為18-29歲區間。不過,U.S.C/LAT的抽樣,把這個年齡區縮成18-21歲。而18-21歲男性,大概佔全體投票權公民3.3%。
想要做狹窄的年齡區間抽樣,並沒有甚麼問題。但是在考量回應狀態後,這樣的調查結果就會出現問題。
簡單來說:在做調查後,落在這個分類組的只有15人。為了要讓這些人在整體樣本中符合整體人口的3.3%,就得安排一個權重在他們的意見上。報導中指出,平均增加的權重為5.7,也就是將這15人,當作86人來看。
進一步來說:如果年齡加上性別,就產生這麼大的誤差,那麼年齡加性別加族裔,誤差可能就會更大。換句話說:這位19歲黑人年輕人的意見,被過度放大。他支持川普,民調用他的意見類推全國其他跟他相似特徵:年輕,黑人,男性,進而拉高這群體的川普支持度。
2.) 抽樣權重依據受訪人自我呈報:前次總統大選權重
U.S.C/LAT的民調,還根據前次總統大選權重,來選擇納入民調統計的受訪者。他們的假設為:依照過去支持度,再追問是否轉換投票立場,在考量新納入的投票人,能夠推得較有代表性的民調結果。
當然,我們不希望樣本裡面,民主黨跟共和黨的比率與全國母體不符:太多傾向民主黨,或是太多傾向共和黨人,都會讓樣本推論造成問題。
問題是:誰還記得上次投給誰?甚至,受訪者願意承認上次投給誰嗎?
紐約時報的記者認為,這項加權法應該要被去除。而哥倫比亞大學統計系教授Andrew Gelman建議:透過Mister P:Multi-Level Regression Model(MRP),可以解決這個問題。
最後,Panel名單。所謂的Panel 名單,就是民調會在不同的時間,重新接觸同一群人。他們不會就每次民調重新抽樣。因此,同樣的偏誤,就會在時間軸上不斷出現。
過度抽樣是好事:找到小群體中的差異性,並降低誤差。
在抽樣時,我們希望抽樣結果能夠貼近整體人口族群的分配狀況。然而,按照這樣的抽樣,人數可能太少。
人數太少會出現甚麼樣的問題?統計公式上,我們可以看到:人數太少,會這群人意見"不準"的問題。
左圖是簡單的標準差的公式。我們可以看到,標準差的大小,會隨著樣本數量改變。我們以1,000人的問卷調查來看:如果要抽樣吻合美國非裔族群人口,約佔13.6%,也就是抽136人。然而,如果我們進行"過度抽樣",將人數放大到500人,那麼樣本的標準差就會被折半。
從這些方法中的比較,我們可以看出,民調從抽樣,事後加權,再到最後詮釋,都還容有一些不同的"調整"技巧。而這些技巧的應用,以及應用後是否符合現實狀態,都需要更多進一步的解讀。
*在這個議題上,我是依照紐約時報記者撰寫的內容,再加上哥大教授Andrew Gelman提到調整的作法中的描述,撰寫這段內容。歡迎更熟悉抽樣方法的朋友提出意見。
想要做狹窄的年齡區間抽樣,並沒有甚麼問題。但是在考量回應狀態後,這樣的調查結果就會出現問題。
簡單來說:在做調查後,落在這個分類組的只有15人。為了要讓這些人在整體樣本中符合整體人口的3.3%,就得安排一個權重在他們的意見上。報導中指出,平均增加的權重為5.7,也就是將這15人,當作86人來看。
進一步來說:如果年齡加上性別,就產生這麼大的誤差,那麼年齡加性別加族裔,誤差可能就會更大。換句話說:這位19歲黑人年輕人的意見,被過度放大。他支持川普,民調用他的意見類推全國其他跟他相似特徵:年輕,黑人,男性,進而拉高這群體的川普支持度。
2.) 抽樣權重依據受訪人自我呈報:前次總統大選權重
U.S.C/LAT的民調,還根據前次總統大選權重,來選擇納入民調統計的受訪者。他們的假設為:依照過去支持度,再追問是否轉換投票立場,在考量新納入的投票人,能夠推得較有代表性的民調結果。
當然,我們不希望樣本裡面,民主黨跟共和黨的比率與全國母體不符:太多傾向民主黨,或是太多傾向共和黨人,都會讓樣本推論造成問題。
問題是:誰還記得上次投給誰?甚至,受訪者願意承認上次投給誰嗎?
紐約時報的記者認為,這項加權法應該要被去除。而哥倫比亞大學統計系教授Andrew Gelman建議:透過Mister P:Multi-Level Regression Model(MRP),可以解決這個問題。
最後,Panel名單。所謂的Panel 名單,就是民調會在不同的時間,重新接觸同一群人。他們不會就每次民調重新抽樣。因此,同樣的偏誤,就會在時間軸上不斷出現。
過度抽樣是好事:找到小群體中的差異性,並降低誤差。
在抽樣時,我們希望抽樣結果能夠貼近整體人口族群的分配狀況。然而,按照這樣的抽樣,人數可能太少。
人數太少會出現甚麼樣的問題?統計公式上,我們可以看到:人數太少,會這群人意見"不準"的問題。
左圖是簡單的標準差的公式。我們可以看到,標準差的大小,會隨著樣本數量改變。我們以1,000人的問卷調查來看:如果要抽樣吻合美國非裔族群人口,約佔13.6%,也就是抽136人。然而,如果我們進行"過度抽樣",將人數放大到500人,那麼樣本的標準差就會被折半。
√136 =11.66,√500 =22.36 ,分母大概被放大了兩倍,也就是標準差被折半。然而,這群人被過度抽樣了,那要怎麼樣回到整體樣本中?在做整體樣本的推論時,研究者可以再將每個不同族群的意見重新調整權重,讓每個族群的意見回歸到應有的比率。
皮尤研究中心(Pew Research Center):過度抽樣可以讓特定族群意見更準,而不是使整體調查出現偏誤。不過,這裡要注意的是:通常這樣的作法是針對"特定"族群的行為,有較佳的詮釋效果。皮尤中心的這項研究舉的例子,就是一項針對西語裔的民調執行的方法。
從這些方法中的比較,我們可以看出,民調從抽樣,事後加權,再到最後詮釋,都還容有一些不同的"調整"技巧。而這些技巧的應用,以及應用後是否符合現實狀態,都需要更多進一步的解讀。
*在這個議題上,我是依照紐約時報記者撰寫的內容,再加上哥大教授Andrew Gelman提到調整的作法中的描述,撰寫這段內容。歡迎更熟悉抽樣方法的朋友提出意見。
No comments:
Post a Comment