一些回归和回归类型策略的实证比较外文翻译资料
2022-12-11 20:09:31
英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
一些回归和回归类型策略的实证比较
J. Sahoo, L. N. Sahoo, S. Mohanty
收到:1993年11月26日; 修订版:1995年8月24日
回归估计的主要优点是可以用于正相关和负相关变量的情况,其精度通常高于简单扩展(直接),比率和乘积估计。 在多篇论文中已经对许多类型的比率估计的性质进行了广泛的实证研究,例如Rao (1969), Rao and Rao (1971 ), Hutchinson (1971 ), Royall and Cumberland (1981 ), Wu and Deng (1983)。 然而,对回归型估计量的类似方法的使用没有太多的关注。 在本文中,已经尝试比较一些有偏和无偏的回归型策略在各种自然种群的帮助下的相对表现。
关键词:几乎无偏; 不对称;辅助变量; 置信区间; 效率; 有限人口;jack-knife法; 峰度; 回归估计; 相对偏差 简单随机抽样; 偏度 战略。
AMS 1980主题分类:62 D 05
1、介绍
令y和x表示研究变量,辅助变量取值和(t lt;_i〜N分别为n和X的有限群体的第i个单位。 假设从这个人口中抽取n个单位的样本,没有简单的随机抽样替换(SRSWOR),以便在X被准确地知道时估计y。 古典的线性回归估计量具有形式
这里和是样本均值 是B的熟悉的最小二乘法估计量,y的回归系数x。
经典回归估计量当然是有偏见的。 无偏回归型估计量由Mickey (1959) and Williams (1963)开发,但尚未开发广泛尝试。 Rao (1969)发现Mickey的无偏估计通常低于标准比例和回归估计量在各种各样的自然人口。Williams (1963) 无偏回归型估计量是基于样本随机分解为g相等的团体 对于g = 2的情况,该估计量减少到
其中和分别为第j次计算的样本均值和回归系数组(j = 1,2)。
根据Quenouille (1956)提出的杰克刀技术,Cochran (1977)推荐使用几乎无偏差的回归估计量,这也是基于将样品随机分为g组。 特别地,当g = 2时,它减少到
其中和是从第一和第二计算出的标准回归估计量一半的样品。 这个估计量的设计动机的属性还没有研究。
Singh and Srivastava (1980) 提出了一个新的抽样方案(SS1)估计量呈现无偏差。 该方案包括以SRSWOR样本中的概率与和剩余(n-2)个单位成比例的两个单位,i和j表示。Singh and Srivastava (1980)也提出了另一个抽样方案(SS2),其中第一个单位,,以与和剩余(n-1)个单位成比例的概率来选择SRSWOR(我这样认为)。使用SS2,他们得到了他们提出的回归型估计
完全无偏。 作者还研究了所提出的方法的效率与标准比例估计量比较,从11个大小的样本取4个样本20,从双变量正常人群中产生。 事实证明SS1下的估计标签在所有其他情况下,是最好的,最好的。
代替b使用其jack-knife形式,即
这当然是B的几乎无偏估计,我们可能建议使用额外的回归型估计量]
一些作者 [cf. Cassel et al. (1977), Sukhatme et al. (1984)]也推荐了
使用作为B的估计。因此,我们也可以具有以下回归类型估计:
上述评论清楚地表明在我们决定使用其中任何一个之前,需要基于他们设计动机的属性对这些估计量进行比较研究。然而,难以对几乎所有这些估计的行为分析进行调查,因为所得到的表达式的大部分内容只是渐近的形式。但是,渐近理论无法期望在不更换的情况下进行非常小的样品时,特别是中小型人口。 在这个项目中,我们进行了比较实验:在他们的一些基础上研究了八种不同的回归和回归型策略通过使用代表各种各样的几组实时数据,设计优化的性质的人口。
2、研究中的战略及其绩效指标
包括在我们的实证调查中的八个策略是To =(SRSWOR,t,G),T 1 =(SS1,tRG),T2 =(SRSWOR,try1),T3 =(SRSWOR,tRG2),“1”4 =(SRSWOR,tRG3),T 5 =(SS2,tRG3)T6 =(SRSWOR,tRG4)和TT =(SRSWOR,tRG)。 研究这些的相对表现竞争策略考虑了以下绩效指标:
在这个评估中,我们将放弃策略和,因为他们完全不偏不倚。
- 效率:
有偏见或几乎无偏见的策略的效率是根据它们来衡量的均方误差(MSE)和无偏差策略的差异。
- 基于近似100(1-a)%置信区间的覆盖率(CR)
其中常数以概率超过单位正态变量。 是策略T的方差估计量,t是相应的估计量。用于建立置信区间的以及和的无偏差方差估计值的近似方差估计如下:
这个绩效指标给了我们一个关于这样构造的百分比的想法置信区间涵盖了由给定的重复抽样抽取的y的真实值设计。
(d)接近正常(不对称):
将偏度和峰度系数(即和系数)作为策略的采样分布的对称性的测量的指标。这里可以注意到,对于标准对称(正态)分布,,。
3、实践研究的描述
对于经验比较,使用20个大小lt;17的自然种群。这些人群的来源,大小(N),y和x的性质,x(Cx)的变异系数以及y和x(p)之间的相关系数已经在表3.1中进行了总结。我们看到范围从0.02到1.16,p从-0.97到0.99,所以我们收集了各种种群。我们包括了具有正和负相关性的人群,因为正在考虑的策略可以应用于这两种情况。我们考虑n = 3,4和6的所有个可能的样本。但是,我们不认为边界线情况n = 2,这实际上没有什么意义。由于策略和涉及将样本分解成两半,我们不认为它们为n = 3。从考虑所有个可能样本的种群计算的相关数值结果如表3.2-3.5所示。为了节省空间,没有给出RB的数值,效率和CR为n = 4,数值为n = 3,4和6的偏度和峰度系数。但是,关于这些价值的主要结论在第3.1-3.5小节中提出。
3.1基于相对偏差的结果
关于表3,2所示的RB的数值显示,表现优于其竞争对手,因为其大多数情况下RB最小。对于n = 3,4,以及n = 6的8个群体,是4个群体中最小的偏倚。这意味着适度扩大
表3.1人口描述
人口 |
来源 |
大小 |
y |
x |
||
编号 |
||||||
1 |
Cochran(1997)p.203 |
10 |
桃的实际重量 |
眼睛估计桃子的重量 |
0.17 |
0.97 |
2 |
Cochran(1997)p.325 |
10 |
街区的人数 |
街区的房间 |
0.14 |
0.65 |
3 |
Konijin(1973)p.49 |
16 |
食物开支 |
总费用 |
0.08 |
0.95 |
4 |
Singh and Chaudhary(1986)p.143 |
15 |
腰果树的数量 |
腰果区域 |
1016 |
0.99 |
5 |
Singh and Chaudhary(1986)p.155 |
17 |
在调查中乳畜(1977- 1978年) |
乳动物普查(1976年) |
0.02 |
0.72 |
6 |
Singh and Chaudhary(1986)p.166 |
16 |
小麦面积1979-80 |
小麦面积1978-79 |
0.71 |
0.98 |
7 |
Singh and Chaudhary(1986)p.166 |
16 |
小麦面积1979-80 |
总耕地面积1978-79 |
0.74 |
0.96 |
8 |
Singh and Chaudhary(1986)p.176 |
13 |
番石榴树数量 |
番石榴果园面积 |
0.19 |
0.93 |
9 |
Singh and Chaudhary(1986)p.194 |
10 |
水果的实际重量 |
眼睛估计水果的重量 |
0.65 |
0.90 |
10 |
Singh and Chaudhary(1986)p.286 |
16 |
干重的稻田 |
水稻鲜重 |
0.39 |
0.99 |
11 |
Singh and Chaudhary(1986)p.287 |
12 |
第二年牛群 |
第一年的牛群 |
0.67 |
0.95 |
12 |
Singh and Chaudhary(1986)p.306 |
10 |
1981-82的居民人数 |
1980-81居民人数 |
0.60 |
0.88 |
13 |
Gujacati (1978) p.79 |
13 |
美国制造业退出率(1960 - 72) |
失业率(%) |
0.29 |
-0.81 |
14 |
Maddala (1997) p.96 |
16 |
人均消费牛肉 |
每磅牛肉价格(美分) |
0.13 |
-0.84 |
15 |
Maddala(1997) p.96 |
16 |
人均消费羊肉 |
每磅羊肉价格(美分) |
0.10 |
-0.75 |
16 |
Maddala(1997) p.96 |
16 |
人均消费小牛肉 |
每磅小牛肉价格(美分) |
0.98 |
-0.68 |
17 |
Maddala(1997) p.96 |
16 |
人均消费鸡肉 |
每磅鸡肉价格(美分) |
0.24 |
-0.97 剩余内容已隐藏,支付完成后下载完整资料 资料编号:[27416],资料为PDF文档或Word文档,PDF文档可免费转换为Word |