对佛罗里达及其县1980-2010年 人口预测误差的评价外文翻译资料
2022-09-09 16:11:40
英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料
对佛罗里达及其县1980-2010年
人口预测误差的评价
Stanley K. Smith and Stefan Rayer
引言
公共部门和私营部门的许多决定都是基于预期的未来人口变化。预计人口增长或下降强烈影响规划学校、医院、购物中心、住房发展,电厂,和许多其他项目。政府分配基金和各类许可证和许可证的发放也会受到影响。人口预测的影响是如此之多,这么多人对其感兴趣,这并不奇怪。
一个人口预测可以被定义为一个特定的关于未来人口趋势的假设的数值结果。在非判断的意义上,它是没有预测的,这些假设将被证明是真实的可能性。人口预测,另一方面,是最有可能提供一个准确预测未来人口变化的预测。这是明确的判断。鉴于这种区别,所有的预测都是预测,但并非所有的预测都是预测。然而,在大多数情况下,预测被解释为预测,无论那些是谁的意图。因此,评估以前做出的的人口预测的准确性是必要的,特别是那些用于官方用途的人口预测。
经济和商业研究局在佛罗里达大学已自20世纪70年代初在佛罗里达州和上一年度的基础上做其县人口预测。自1977以来,除了首选介质系列,经济与商业研究局预测包括低和高的系列考虑到预测的不确定性。这些预测是用于政府机构、企业、全国其他数据用户规划和预算的目的。在这项研究中,我们调查的几个国家和县人口预测的准确性发表在1980-2005之间。我们分析人口的影响中一系列预测精度的大小、增长速度和长度,并探讨了测量方法的不同的不确定性,一个基于一系列的预测和其他基于经验预测区间。
大量的研究已经分析了地方人口预测的准确性,但很少有人评估定期使用一致的方法几十年做出预测。经济和商业研究局的预测在这方面提供了一个独特的机会。我们相信这里提出的结果将给数据用户大量的信息,对国家的预测精度和当地的人口预测,这些信息将帮助他们更好地判断何时使用预测作决策用途。
方法论
经济和商业研究局使用了两种不同的方法在人口预测的建设。在国家一级,预测是基于一个队列组件的方法,其中出生,死亡和迁移的预测分别为每个年龄性别队列的人口。三种不同的迁移和生育的假设,提供三个系列的预测(低,中,高)。培养基系列被认为最有可能提供准确的预测未来种群的方法。
经济和商业研究局县预测是基于各种统计技术历史人口趋势外推到未来。在大多数年中,对县的中等预测计算为几个单独的预测和控制,以增加国家的预测平均。低和高的预测是基于从先前的预测的误差分布。再次,中等系列被认为是最有可能提供准确的预测未来的人口。
当前投预测方法的详细说明可以在Smith and Rayer (2012)找到。虽然有小的变化,在技术和多年来的假设,所有的预测都是基于cohortcomponent方法和所有县的预测都是基于外推技术。多种群预测方法的描述与评价可以在Booth (2006); Siegel (2002); Smith et al. (2001); and Wilson and Rees (2005)发现。
下面的术语用来描述人口预测:
1。基准年:最早观察人口规模的年份预测
2。发射年份:最新观察人口规模的一年,用来制造一个预测
3。目标年:预测人口规模的年
4。基准期:基准年与发射年之间的间隔
5。预测范围:发射年份和目标年之间的间隔
2评估佛罗里达州和各县人口预测误差
例如,如果从1990和2000的数据被用于2010人口项目,然后1990将是基地的一年,2000将是发射一年,2010将成为目标的一年,1990-2000将是基础期,2000-2010将是预测范围。
在这项研究中,我们评估预测精度的人口规模,增长速度和长度的预测范围,国家和县预测推出1980,,1990,1995,2000,1985,和2005。使用中系列,我们比较预测人口普查计数或十年中期为每个目标年估计,并计算所得的差异。我们指预测的差异错误,但它们可能是由于枚举或估计错误导致的或者在预测本身的错误。
预测精度
国家预测
对于中等国家级预测结果见表2.1。有预测误差与预测范围长度的不完全单调关系,但错误通常增加(忽略方向的错误)为预测范围变得更长。平均在所有发射年,五年内误差约为3%,10年约为4%,15年约为6%,20年约为9%,25年约为11%,30年约为16%。
如何将这些错误在其他研究中所发现的比较?若一些研究已经评估预测的准确性,利用各种时间和预测技术(Kale et al. 1981; Smith and Sincich 1988, 1992; White 1954).。这些研究报告在10年内的平均误差(忽略错误的方向)在5%-8%之间,20年内在10%-15%。在1967和1997之间的美国人口普查局陈述队列组件预测几套评价显示,五年内的平均误差在2%和5%之间,15年内的平均误差在6%和10% 之间(见表2.6机2008)。相比于大多数的,在佛罗里达州的预测的错误比以前的研究报告已经有点小,。
虽然在国家级的预测错误增加了预测范围的长度,每发射一年,错误的变化很大,从一个发射到另一个。对于5年的范围,预测为发射年1995有minus;3.6%错误而推出2005年度预测有错误6%。对于10年的范围,发射年1995年的预测有错误minus;6.5%而推出的2000年仅仅有0.1%预测误差。发射1985年20年的预测有minus;11.4%错误而预测发射到1990年有3.7%错误。这些差异说明在一个单一的地方,如一个特定的结果,往往发现的变异国家或县。正如在下一节中所示,当结果的基础上覆盖着大量的地方,就有更大的可变性。
表2.1中显示的大部分错误都有负面的迹象,表明该预测低于人口数或估计为目标年。这是否意味着队列组件的方法有一个固有的向下偏置,根据这一方法的当前和未来的预测,也往往是低?不,它没有。我们注意到,2005年推出的5年的预测结果是太高了。此外,一些队列组件的研究美国人口普查局所产生的预测发现该预测主要是一些时间段和预测范围高,其他的都比较低(Rayer 2008; Smith and Sincich 1992)。在预测的研究中使用其他方法发现了类似的结果,(Smith and Sincich 1988)。正面和负面的错误倾向于在时间和地点之间相互抵消,这表明队列组件方法和大多数其他的人口预测方法没有内在的向上或向下的偏差。我们相信现在和未来的预测很可能是太低了。
县预测
我们用几个指标来评估经济和商业研究局中的预测精度县预测。平均绝对百分误差(MAPE)是在忽略错误的方向的平均误差。第六十七的百分误差(67pe)是错误的,超过三分之二的所有县的错误(忽略方向错误)。这些都是精密测量的,或是如何接近的预测是后续的人口普查计数或中期估计,不管他们是太高或太低。
平均代数百分误差(MALPE)当误差方向是占平均误差;即,正负误差可以相互抵消。这是一个测量偏倚:正平均代数百分误差反映趋势预测太高和负平均代数百分误差反映趋势的预测太低。我们使用的是正误差百分比(% POS)作为另一个测量偏差,因为几大错误可以不成比例的影响平均代数百分误差的符号和大小。
表2.5 - 2.2总结了1980,1985,1995,2000,1990,2005年县预测的精度和偏差。如表2.2所示,平均绝对百分误差5年平均约5%,10年8%,15年11%,20年15%。虽然有一些从一个发射到另一个的变化,将县为一个整体比国家作为一个整体随着时间的推移平均误差更为稳定。发生这种稳定性尽管个别县的错误有很大的差异。以绝对的术语为例,在县的误差在10年的范围内从0%-21.5%变化不等,在20年内范围从0.1%-59.9%变化不等(不显示)。
每推出一年,随着预测的预测范围长度平均绝对百分误差近似呈线性增加。在以前的许多研究已经报道了类似的结果(Rayer 2008; Smith 1987; Smith and Sincich 1992; Tayman 1996; White 1954)。有一些迹象表明,随着时间的推移,至少对于发射年1980至2000错误已经变得越来越小。这可能是由于县的规模和增长速度的特点,我们在本章稍后返回这个可能性。
发射了2005年,然而,平均绝对百分误差5年的范围比以往任何一年都大。
表2.3显示了第六十七个百分误差的结果。再次,错误与预测范围的长度以近似线性的方式增加了。从一个发射到另一个下降到另一个下降的错误的差异作为预测范围变得更长。例如,5年的范围中最大的错误是71%大于最小的误差,相比10年的范围45%较大,比15年范围23%较大,比20年的范围10%大。
表2.4显示了平均代数百分误差的结果。所有的错误,通过发射2000年有负面的迹象,一般成为更大的预测范围变得更长。该计划推出2005年,然而,有一种强烈的向上偏移。这些结果说明了缺乏可预测性的可能性,一组给定的预测往往是太高或过低。个别县市在10年范围的错误变化从-42.5%到21.5%,20年范围的错误变化从-59.9到36.3%(未显示)。
表2.5显示了正误差百分比的结果。10年的预测,推出2000年有轻微的积极的错误和5年的预测,推出2005年有一个很大的积极的错误。所有其他组的预测表明,预测的趋势是太低了(即E,小于50%的正误差)。表2.4和2.5中所示的结果是一致的与那些在表2.1中所示的国家作为一个整体。这并不奇怪,当然,因为县的预测调整,以增加国家的预测。
县的错误报告如何在这里与其他研究中发现的比较?在美国一个县的研究发现10年范围内平均绝对百分误差在12%-15%之间,20年范围内平均绝对百分误差在25%-30%(Smith 1987)。一个类似的研究涵盖了不同的时间10年的范围平均绝对百分误差约为10%,20年的范围平均绝对百分误差约为20%。在伊利诺斯乡的一项研究发现,10年范围在平均绝对百分误差大约为12%。在威斯康星州的未成年人民事法庭的一项研究发现,10年预测的平均绝对百分误差在10%–11%之间。关于精度,然后,佛罗里达州的县的预测错误比的报道的亚州地区的其他研究的错误小。
偏移如何?一些研究已经解决了这个问题,一些研究已经解决了这个问题,但那些已经做到这一问题,在大多数人口的预测技术,没有发现任何可预测的偏见。对于大多数技术,一些预测有向上的偏差和其他人有一个向下的偏差,但有没有办法提前知道这一趋势将描述任何给定的预测集。我们相信,通过经济和商业研究局介质出版县预测有过高或过低的概率相等,如果类似的话,同样也会是真的技术应用于其他地理区域。
人口规模和增长速度的差异对预测准确率有何影响?要回答这个问题,我们汇总了所有发射年的错误,给出的结果为六套5年的预测,五套10年的预测,四套15年的预测集,和三套20年的预测。对于每一个县,人口规模在发射年测出,增长率在在立即在发射前10年测量。
如表2.6所示,精度一般随着人口规模的增加而增加。相似的结果也在许多其他研究报告中得出(Isserman 1977;Rayer 2008; Smith 1987; Tayman 1996; White 1954)。此外,人口规模的差异对平均绝对百分误差和第六十七百分位误差的影响似乎与预测范围的长度增加。5年的范围,例如,为最小的县的误差为35–40%大于最大县的错误,但对于20年的范围他们几乎大一倍。
测量偏差显示人口规模无明显关系。正面错误的百分比有时会随着人口规模的增加而增加,有时也会下降。虽然随着人口规模的增加平均代数百分误差普遍下降,这是由于人口规模和错误的规模之间的关系,独立的方向之间的关系。我们认为,当增长率的差异,人口规模的差异没有系统的影响预测的趋势是太高或太低。一些其他的研究得出类似的结论(Murdock et al. 1984; Rayer 2008; Smith and Sincich 1988)。
表十显示了2.7年后的人口增长率的结果,即在发射前一年。精密度的测量显示错误和增长率之间呈U型关系。对于平均绝对百分误差和第六十七百分位的误差,误差最小的县以10–25%增长率增长,增长率在任一方向上以这种温和的增长水平偏离变大。类似的结果已经在以前的一些研究报告(Isserman 1977; Rayer 2008;Smith 1987; Tayman 1996)。
偏差的衡量指标与增长率差异无明显关系。当增长率提高时,正误差的百分比有时会增加有时下降。这一结果不同于几项研究报告,发现了一种趋势,缓慢增长或下降的人口超过基准期预计的地方,迅速增长的人口将超过预计(Rayer 2008; Smith 1987; Smith and Sincich 1988;Tayman 1996)。我们不知道为什么在本研究中发现的结果不同从以前报道。这可能是由于相对较小的样本大小,缺乏多样性的增长率(几个佛罗里达州的县已经失去了人口和许多增长迅速),或聚集的结果在几个不同发射年。
经济和商业研究局的县的预测都基于简单的技术,从历史推断未来趋势。可以通过使用更为复杂的技术,提高人口增长(出生,死亡,和迁移)或改变经济条件等因素的变化,提高预测的准确性,密度限制,或分区限制?强烈的证据表明,更复杂的技术比使用简单的外推法不能产生更准确的总人口预测。(Chi 2009; Chiand Voss 2011; Murdock et al. 1984; Rayer 2008; Smith
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[146147],资料为PDF文档或Word文档,PDF文档可免费转换为Word