2018年我国台湾地区地方选举(台北市、新北市和桃园市)基于计算机模拟的选举结果预测和实际结果的比较

2018年11月22日(北京时间),唐世平教授主持的“复旦大学复杂决策分析中心”的选举预测团队提前公布了其对于2018年11月24日将举行的我国台湾地区地方选举的预测结果,本次预测基于计算机模拟,预测了台北、新北和桃园三个市的市长选举结果。

唐世平教授的团队在公布预测结果时,特别强调,他们对我国台湾地区地方选举的预测是一种纯粹的科学尝试,他们从主观上并不想以任何方式影响现实中的台湾地区选举。

2018年11月24日(北京时间),台湾地区地方选举结束,最终结果产生。以下是我们对我们的预测结果与实际选举结果的比较以及评估。

首先,唐世平教授的团队正确预测了两个市的最终当选者——新北市的候友谊(蓝营)和桃园市的郑文灿(非蓝营)获胜;此外,该团队没有预测台北市的当选者,但是准确预测了非蓝营的得票率要超过蓝营的得票率(台北市最终选举结果尚存在争议)。

其次,唐世平教授的团队较为精确地预测了新北市的得票率分布。

再次,唐世平教授的团队发现对台北和桃园的得票率分布的预测与最终的选举结果有一定差距,尤其是普遍低估了蓝营的支持率,下文将展开预测驱动的选举研究反思。

最后,需要强调的是,基准模型的预测结果在9月份已经产生,通过对比同一时期的台湾各家选举民调数据,发现我们的预测结果更加接近最后真实结果。【我们的预测结果和同一时期的民调的比较将在我们的学术文章中呈现。】“超前性”是选举预测评估的重要指标,将为政策决策提供宝贵的时间窗口。

由此,可以认为,唐世平教授从2015年初开始探索和发展的、完全抛开民意调查而只基于计算机模拟的选举预测方法取得了重要进展。而理解预测偏误背后的原因本身对今后的选举预测研究意义重大。唐世平教授的团队开发的新方法可能会给全球选举预测和选举研究领域带来巨大的转变。

受限于数据和经费,本次预测关注台北、新北、和桃园三个市。此外,我们目前的预测模型只预测蓝营和非蓝营(含绿营)两大阵营之间的得票率分布。

一、台北市

根据我们基准模型的平均预测结果,蓝营(候选人丁守中)将获得34.80% [34.75%,34.84%]的得票率,而其他非蓝营(主要候选人柯文哲+姚文智) 将获得65.20% [65.16%,65.25%]的得票率,我们的基准模型的平均预测误差为1.94%,不同预测模型的误差分布区间为[0.24%; 3.66%]。

在台北市的实际选举中,蓝营(候选人丁守中)获得了的40.82%的得票率,其他所有非蓝营(主要候选人柯文哲+姚文智)获得了59.18%的得票率。

比较台北市的预测和实际结果,“基准模型”对于蓝营的得票率的平均预测结果(34.80%)距离实际结果(40.82%)差别较大,而且差别落在误差区间之外。

二、新北市

根据我们的基准模型的平均预测结果,蓝营(候选人侯友宜)将获得54.19%的选票[53.63%,54.50%],绿营(候选人苏贞昌)将获得45.81%的选票[45.50%,46.37%]。我们的基准模型的平均预测误差为2.93%,不同预测模型的误差分布区间为[0.65%, 4.68%]。

在新北市的实际选举中,蓝营(候选人侯友宜)获得了的57.15%的得票率,绿营(候选人苏贞昌)获得了42.85%的得票率。

比较新北市的预测和实际结果,两个阵营的实际得票率(57.15% 比 42.85%)与我们基准模型的平均预测结果(54.19% 比45.81%)非常接近,差别    落在基准模型的误差区间的之内,非常准确。

三、桃园市

根据我们基准模型的平均预测结果,蓝营(候选人陈学圣、杨丽环)共将获得32.54%[30.71%,34.37%]的选票,而其它所有非蓝营候选人总共将获得67.46%[65.63%,69.29%]的选票。我们的基准模型的平均预测误差为3.14%,不同预测模型的误差分布区间为[0.45%; 4.79%]。

在桃园市的实际选举中,蓝营(候选人陈学圣、杨丽环)共获得了的44.41%
的得票率(相对得票率为45.38%),绿营(郑文灿为唯一候选人)总共获得了53.46%的得票率【相对得票率为54.62%】。

比较桃园市的预测和实际结果,基准模型对于蓝营的得票率的平均预测结果(32.54%)距离实际结果(44.41%)差别较大,而且差别落在误差区间之外。

综上对比,我们的预测结果在台北和桃园都低估了蓝营的支持率。我们总结产生此类现象和结果的主要原因如下:

1. 我们的基准模型预设了各县市之间是相互独立的,但实际上本次各县市选情相互影响,存在显著的溢出效应(特别是高雄市韩国瑜的选情对国民党各县市选情的拉抬效用),加之民进党各县市间选举资源的调配失衡。

2. 由于选民基数相对较小,地方选举对某些因素更为敏感,因而导致的波动性要远高于全台湾地区的选举,因此预测难度更大。而我们的数据中,地方层面选举数据的丰富程度、可及性、精细程度和数据质量相比整体台湾地区层面较差,同时受制于转型后选举届数和累积数据量的限制,对预测结果产生了一定影响。

3. 蔡英文团队的执政绩效对地方选举可能有比较强的“执政者劣势”的辐射效应,这部分没有被基准模型充分捕捉到。

4. 本次选举中各地候选人在动员策略上存在“超越蓝绿”的趋势,开始淡化阵营色彩,增加了原本浅蓝和浅绿选民的跨党派投票。如果这种趋势继续,将对以后台湾地区的选举产生比较重要的影响。

5. 我们的基础数据不包含选举年各县市个殊的重大政策议题。这些议题可能应该当作类似“突发政策事件”的变量纳入预测模型

本次关于台湾地区的地方选举是唐世平教授的团队首次预测“地方选区”,是对现有仅仅聚焦国家和地区的选举预测研究之外的重要尝试。同时,通过预测结果与真实结果的比对,检验变量选区、数据收集和模型建构的科学性,在偏误中不断反思原因、积累经验、增进我们对特定选举的深度理解,既为今后选举预测的改进和优化提供了可能性,同时将预测性研究与因果推断相结合,实践预测驱动的社会科学探索和知识积累。

特别致谢:本次选举预测的数据收集工作,得到了厦门大学台湾研究院及其相关负责老师和参与同学的大力支持。感谢关注本项研究并提供支持和批评建议的学界同仁。

附一

提前公布台湾地区地方选举预测结果(中文版本),2018-11-22
http://www.ccda.fudan.edu.cn/index.php?c=article&id=83
http://blog.sina.com.cn/s/blog_744a73490102yc2s.html

提前公布台湾地区地方选举预测结果(英文版本),Nov. 22th release
http://www.ccda.fudan.edu.cn/index.php?c=article&id=84
https://www.linkedin.com/pulse/taiwan-local-elections-taipei-new-taoyuan-forecasting-tang-dr/

复旦大学国际关系与公共事务学院新闻链接:
http://www.sirpa.fudan.edu.cn/?p=12584

附二:2018我国台湾地区地方选举预测结果与实际结果的对比图

附二 2018我国台湾地区地方选举预测结果与实际结果的对比图
附二 2018我国台湾地区地方选举预测结果与实际结果的对比图