吴世昌/趋势民意调查公司总经理

今年的总统大选,民意调查受到了候选人相当大的质疑。本人从事民调工作20余年,必须很负责任地说,直至此时此刻民调仍具有相当大的准确性,在选举预测上甚至有「越来越准」的趋势。

不过,传统的市话调查由于近年来受到「涵盖率」日渐减少,使得准确度受到影响、备受挑战;再加上今年在民进党、国民党两党初选中,首度引入「行动电话调查」,并用50%市话、50%手机方式加总计分,成为调查的热门话题。

除此之外,「大数据分析」也成显学,越来越多的「网路舆情分析」成为媒体、候选人的重要参考指标,甚至作为预测略选举的工具。但「大数据」到底准不准?在选举中的应用为何?也是本文探讨的标的。

调查要「准确」须符合机率抽样原则

从学理来看,调查要准确、能推估全台民众的意象,首重要的就是能符合「机率抽样」原则。所以唯有电话调查、行动电话调查,才能符合学理,网路调查等其他方式无法做到机率抽样,这也就是选举民调仍以电话调查唯主要的调查方式。

至于传统电话调查到底还有准确性吗?抑或是要用行动电话调查来补强?趋势民调公司为了验证调查方法的准确性,特以选前一天民调,比照三种资料处理方式,并与选举结果相印证,进行实证性研究。

趋势民调比对传统市话、纯手机调查与市话并唯手机调查 市话并唯手机调查样本结构与母体最为一致

首先,我强调个人较不认同目前业界有在用的50%家户电话与50%行动电话结合方式,此种方式较无学理依据。目前国内外在进行机率抽样调查时,仍以「纯市话样本」、「纯手机样本」或「市话结合唯手机族」三个方式进行,本文将进行此三种研究方法得比较

先从调查原始样本结构来看,传统市话被外界诟病的就是年轻样本较低、老年样本偏高,需要用较高的权值调整回来,从图1可以发现,纯市话20至29岁比例偏低、60岁以上比例偏高。

至于纯手机则刚好颠倒过来,20至29岁远高过于母体,但70岁以上者则远低于母体;至于市话并唯手机族,则是在样本与母体结构上最为近似符合。

图1:三种调查方式样本与母体结构比较—以年龄分

以教育程度来看,市话样本结构在小学或以下教育程度者比例最高,大学研究所以上学历者相对较低;纯手机则刚好相反,在大学学历者比例最高,小学及以下学历者比例最低;至于市话并唯手机则在各教育程度上,与母体的比例最为接近。

图2:三种调查方式样本与母体结构比较—以教育程度分

三种调查方式加权过后结果差异不大

不过虽然三种调查方式在样本结构上有相当大的差异,但从调查结果来看,三种调查方式在加权过后,呈现的结果都相当一致。以本次选举为例,基本上方向、差距都不大,若硬要说差距,就是纯手机因接触到更多年轻人,导致纯手机调查在民进党的总统候选人支持率及政党支持率上略高一些。

图3:三种调查方式大选调查结果比较

图4:三种调查方式政党票调查结果比较

对比选举结果 三种调查方式皆相当准确

若比对选举结果,扣除未表态率重算后,可以发现三种调查都与选举结果完全一致。从下图可以发现,市话加唯手机族的资料里,扣除宋楚瑜被弃保的6%并加入韩国瑜支持率,韩国于刚好是38.7%,与选举结果完全一致;纯手机调查的结果中,韩国瑜加入宋被弃保的7.6%为38.5%;纯市话韩国瑜加上宋被弃保的4.9%则为38.9%;至于蔡英文总统三个调查支持率都为57%左右。民调与选举结果差距都在小数点1%以内,而政党票的得票结果也与民调完全一致。

图5:三种调查方式与选举结果比较

市话并唯手机调查为目前最佳的调查方式 但与传统市话调查差距不大

因此与本次选举结果印证并从最严格的实证研究来看,市话并唯手机的调查方式在原始调查样本结构上与母体最为接近,调查结果也最接近实际结果,为目前最佳的电话调查方式。

不过传统的市话或纯手机调查与之相比,虽在加权前样本结构上与母体有较大的落差,但透过统计的加权方法计算后,与实际结果差距也极微。这也显示传统的电话调查在选举应用上面,到目前为止仍没有任何问题。

网路舆情大数据「非调查」 总声量高低非关键 关键在于「正负评」

至于网路大数据,严格来讲大数据并非「调查」,而是「网民网路动作反应的汇整」,也非机率抽样,不应算在「调查研究」范畴内。但由于不少大数据分析公司,都以「新式民调」为宣传口号,再加上舆情分析却有它的参考方面,因此本文特地将网路大数据进行说明。

以图6来看,从趋势民调的网路大数据搜寻引擎,以及与汇流新闻网合作的大数据长期趋势可以发现,韩国瑜的网路声量长期居高不下,为所有候选人之冠。但若单从网路总声量解读,韩国瑜「人气最旺」肯定当选,但为何结果完全相反?

图6:总统候选人网路声量长期趋势比较

再从下图7即可知道韩国瑜为何会输,网路总声量韩国瑜虽高居第一,但负面声量也长期居高不下,从CNEWS汇流新闻网封关前公布的网路声量调查,即可发现韩国瑜负面声量破五成,因此即使总声量高,但要当选总统几乎可以说是不可能的任务。

图7:总统候选人网路声量正负评比较

【汇流民调】民调封关前最后一次声量调查 韩国瑜负面讨论度飙破5成

再从图8可以发现,若单比较网路声量,时代力量的总网路声量是高于台湾民众党的,但最终开出来的选票,民众党支持率是高于时代力量,这也说明了网路声量与实际结果仍是会有一定差距,解读上需更小心。

图8:主要政党网路声量与正负评比较

结论:传统市话仍最推荐 网路声量作为辅助

整体来说,本文以选前民调与选举结果的验证,证明了传统以市话为主的调查方式仍然相当准确。再加上其抽样架构更为完整,费用相对手机调查低廉,资料处理技术也比市话加唯手机不复杂,仍是最为推荐的调查方式。

至于网路舆情大数据分析,在选战中也将扮演越来越重要的脚色,但解读上仍须注意,若要推估选举结果,传统调查方式仍是最为准确且不可取代。

未来在选战工具应用上,网路舆情大数据应与与电话调查为互补关系,透过快速的舆情搜集调整选战策略,而不会产生谁取代谁的问题。

照片来源:韩国瑜脸书、资料照片

《更多汇流新闻网报导》

【2020选举民调总检讨4-1】民调「盖牌」害了谁 民调专家吴世昌:盖牌是台湾选举史上最烂的选策

【2020选举民调总检讨4-2】选举民调到底准不准 民调专家吴世昌:奇准无比

【汇流笔阵】

CNEWS欢迎各界投书,来稿请寄至[email protected],并请附上真实姓名、联络方式与职业身份简介。

CNEWS汇流新闻网:https://cnews.com.tw

【文章转载请注明出处】

相关文章