剑客
关注科技互联网

未来的民意调查是重现和开放源码

未来的民意调查是重现和开放源码

的国家会为克林顿或特朗普,每有最新和最好的民意调查聚合可能性。

Rawgit

在镇内是重新有民意调查聚合器。它是一个怪物,今天治理三个最有力的思想在科学︰ 贝叶斯推理、 开放源码软件和重复性研究。

在过去的几个选举周期中,它是成为一般理解单调查可以嘈杂,而民调的平均值能在公众舆论中让较强的趋势。但你怎么做你的意思吗?我们目前的选举预测和民意调查聚合器落在了两个阵营︰ 要么透明和简单 (例如,移动平均线的喀斯特) 或复杂与专有”酱”(例如,Nate 银目前做)。*

广告

但我在这里谈论的模型是最好的两个世界。它包括状态和全国性的民意调查数据,模型的国家,选举前预测、 国家级和选举团的预测和漂亮的图形之间的相关性 — — 但所有中的开放源码框架,所以任何人都可以检查数据或模型的任何部分。这包含了”酱”类型的影响,如时间序列模型和民意测验专家效果。所有这方面的模型,也可以对账︰ 任何技术头脑的局外人可以看到不只是哪个民意测验专家预计偏向一方或另一种,但也可以拆开模型,并了解哪些数据导致这些估计数,它们是什么。有很多的媒体偏见从四面八方,关注和开放源码是地址怀疑特别评估的最佳途径。

未来的民意调查是重现和开放源码

Rawgit

该模型结合状态和全国性的民意调查数据与选前预测基于过去选举的资料。它被称为”动态”的因为它将更新为新的民调数据进来。 它来自皮埃尔-安托万 · Kremp,法国的社会学家适应政治科学家德鲁林茨动态预测模型。Kremp 调整林茨的模型来允许民意测验专家的影响,在开源编程语言,编程并且把它放在一个简洁的描述、 图形清晰,与所有的源代码的链接的网页。

该模型运行在 R 和斯坦 — — R 是一般程序,统计数据操纵和图形;斯坦是一个专门的程序,执行贝叶斯推理,是一种基于概率理论,合并来自多个源的信息的方法。(披露︰ 我是斯坦的开发商之一。)

有几个美丽的东西,关于这个预测网站的开放源码性质。首先,分析是完全重现︰ 任何人都可以运行 Kremp 的脚本,抓住相同的数据,使用了 Kremp,然后再运行 R 和斯坦分析产生的估计和网页上的图形。

广告

第二,结果本身是本质上协作。而不是任何人的个人的模型,它是皮埃尔-安托万 · Kremp 执行的德鲁林茨模型本身基于许多早期工作中统计和政治科学文献。如果有人想要批判分析,改变模式,或者添加或删除数据,他或她可以直接这样做。有它的问题的人可以开放模型、 复制到自己的电脑上,使她想要的任何改变,然后张贴自己版本的模型、 她自己的预测和她自己的图。还有没有看门人︰ 你可以把你的数据和假设,然后任何人都可以从那里进行判断。不同的人可能会喜欢不同的模型,也没关系。例如,分析师做出不同的选择,关于调整为政党认同的调查受访者;在程度上此信息是可用,它可以被纳入模型。由任何人。

德鲁林茨写道,在这一点在选举中,所有明智的聚集算法将给几乎相同的结果。什么特别关于 Kremp 的预测,程序不具体的这么多预测,但其过程相当。这就是为什么我认为 Kremp 的网站,或者类似的最终将业务的所有其他民意调查聚合。透明度的 Kremp 的代码允许容易纳入了民意调查房子影响等国家级相关因素并使纯香草平均努力不相关的讨论。从另一个方向,分析变得越来越复杂,读者和新闻机构将把放正确的更多的信任不在秘密的酱汁,但在开放源码程序,所有数据都输入以明确的方式。在科学中,重复性研究 wins。

未来的民意调查是重现和开放源码

Rawgit

这并不是贬低 Nate 银和经营自己的聚合器和预测的开创性工作。他们已经采取定量选举预测出政治科学贫民区,概率思维一般谈话的一部分。开放源预测是只是自然的下一步,给我们对选举的理解带来重复性研究的原则。

* 校正,2016 年 11 月 1 日︰ 这篇文章的早期版本引用 Pollster.com 为例,简单聚合。Pollster.com 使用贝叶斯模型,它的股票的要求。(返回)。

[剑客-翻译]

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址