基于熵函数的分位数外文翻译资料
2022-11-25 14:59:00
英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
基于熵函数的分位数
S.M. Sunoj lowast; , P.G. Sankaran
Department of Statistics, Cochin University of Science and Technology, Cochin 682 022, Kerala, India
摘要
在统计数据的建模和分析中,分位数函数是分布函数的有效替代(见Gilchrist, 2000; Nair 和Sankaran,2009)。受此启发,在本文中,我们介绍了基于熵函数的分位数。我们还引入熵函数残差的分位数设置并研究其性能。与Ebrahimi(1996)中熵函数的残差不一样,分位数熵函数的残差可以通过简单的关系唯一确定分位数密度函数,这个方法可以用来定义两个非参数分布类。
关键词 香农熵; 生存时间残差; 分位数函数; 可靠性措施; 特征。
1引言
近年来,人们对测量概率分布的不确定性表现出极大的兴趣,为一个非负绝对连续的随机变量,它代表具有累积分布函数和生存函数的一个组件的生存时间。分布函数和生存函数分别为和,1998年Shannon定义的不确定度为:
, (1)
其中为的概率密度函数,等式(1)给出了中包含预期不确定度的的结果的可预测性,即熵测度。在许多领域,如可靠性分析,生存分析,经济学,商业等,研究期间的时间长度一直是我们感兴趣的一个主要变量。在这种情况下,信息测度是时间的函数,因此它们是动态的,在这种想法的基础上,Ebrahimi (1996)中定义了在时间点,变量的熵的残差:
(2)
其中,为关联的剩余时间,通过的失效率函数
,等式(2)可以被等价的写成:
(3)
在 2002年Di 的文章中,同样可以获得在休眠时间内有相似的函数,文献中还有函数的扩展和多元形式,关于这些方法的其他附加信息,我们引用了Belzunce等(2004),Ebrahimi (1996),Ebrahimi和Kirmani (1996),Ebrahimi和Pellerey (1995),Nanda和Paul (2006) 和 Sunoj等 (2009).
所有这些理论成果和应用证明都在分布函数的基础上进行,可以指定一个概率分布的分布函数即分位数函数。近来,很多作者证明分位数函数
(4)
在统计数据的分析和建模中能够等价有效的替代分布函数(见Gilchrist, 2000; Nair和Sankaran, 2009),在许多情况下,分位数函数更方便,因为他们不受极端值影响,从而可以利用有限的信息进行简单的分析。在最近关于的更详细的研究中,在 Lai and Xie (2006), Nair和Sankaran (2009), Nair等(2011), Sankaran和 Nair (2009), Sankaran等 (2010) 和其他的参考文献中,都说明了它在模型识别中的性能和作用。
虽然对于不确定性的的度量已经有各种各样的研究,但是利用进行的研究还没有出现。而且,许多关于的应用方面如分布(Ramberg 和Schmeiser, 1974; Freimer 等, 1998; Gilchrist, 2000; van Staden 和 Loots, 2009),power-Pareto 分布(Gilchrist, 2000; Hankin和 Lee, 2006),Govindarajulu 分布(Nair 等, 2011)等,并没有令人满意的分布函数。这让通过(1)式对这些分布的及其性能的统计研究变得很困难,所以我们在分位数函数的基础上提出了熵函数的定义和性质。这样的讨论有几个优点,在统计数据建模过程中,这种方法中获得的熵函数的分析特性,可以用来作为一种替代工具,从容易处理的角度看,有时候以分位数为基础的方法更好。对于新的模式和特征,在分布函数无法解决的情况下,可以用分位数的方法帮助解决。更进一步的,分位数熵函数和分位数密度函数之间的明确的关系可根据剩余时间得出。
本文的结构如下:在第2节中,我们将讨论一些分位数函数有用的可靠性措施。我们介绍了熵函数和残差熵函数并研究其性能。第3节提出了基于残差分位数熵函数的某些寿命分位数模型的特征结果。
2熵基础上的分位数
当是连续的,根据(4)式,,其中表示复合函数,定义分位数函数的密度函数(见Parzen,1979),和密度函数的分位数为
,其中素数表示微分,有:
(5)
分位数函数的危险率函数为:
(6)
根据(Nair和 Sankaran(2009))中,给出了条件失效概率在未来小间隔时间内存活到的点分布,像唯一确定累计分布函数或生存函数一样,同样也通过式子唯一的确定,从(5)式可知,在(1)式中定义的熵可以以的形式写出:
(7)
明显的,在已知的情况下,的表达式可以很容易的写出,(2)中残差熵关于的等价定义为:
(8)
从(3)式中,我们可以将(8)式等价写作:
(9)
预测的不确定性包含在直到的条件概率的分布结果中。进一步的,关于对(8)式进一步的差分,得到:
等价的:
所以
(10)
- 式决定分位数残差熵的密度函数,不像(10)式中残差熵,(10)式中的关系是唯一的特征,在和之间没有像这样明确的关系,表一提供了分位数函数和类似的。
在残差分位熵()的基础上,我们定义如下生存分布的非参数类。
表一:生存分布的分位数函数和分位数残差熵函数。
分布 |
分位数函数 |
|
指数分布 |
|
|
ParetoII |
|
|
Rescaled beta |
|
|
Halflogistic |
|
|
Power function |
|
|
ParetoI |
|
|
Generalized Pareto |
|
|
Log logistic |
|
|
指数几何 |
|
|
线性危险率 |
|
|
Davies |
|
|
定义1:若是递增(递减)的,那么的残差分位熵也是递增(递减)的(记作(),其中。
在(8)式中,很容易看出如下结论:如果是(),那么有
;从(9)式中看出:如果X是(),那么
。对于指数分布和,所以
且,所以指数分布是和类的边界。
定理1:
- 如果是,是非负递增凸函数,那么也是;
- 如果是,是非负递增凹函数,那么也是。
证明:
如果是的概率分布函数,那么,有
(11)
其中为和的残差分位熵,如果是,是非负递增凸函数,那么也是的,同理也可证。
例1:
令为服从失败率为的指数分布,且,那么服从威布尔分布,且有,对于非负递增函数,如果有
,那么函数为凸(凹)函数,所以通过定理1,如果,那么威布尔分布是()。
在统计数据的建模中,如果一般的标准分布办法并不适合,我们则考虑加权分布的概念,近年来,这个概念被运用到统计学的多个领域中,如家庭规模的分析,人类遗传,野生动物种群研究,更新理论,生物医学,统计生态学,可靠性建模等。
根据随机变量的概率分布函数,参考Bartoszewicz(2009),Navarro(2006)和Navarro(2011),我们可以定义加权随机变量的密度函数,其中为权函数,且,当时,被称作长度偏差随机变量。最近加权分布的研究表明,利用,相应的分位数密度函数为,其中,同样的分位数密度形式,所以的残差分位熵用的形式来表示:
即可以得出如下定理:
定理2:
- 如果是,且为非负递增凹函数,那么也是;
- 如果是,且为非负递增凸函数,那么也是。
证明同定理1。
定义2:的分位熵小于的分位熵,如果对于所有的,那么。
特别的,如果和分别是失败率为的指数分布,相应的,如果,那么。
定理3:如果那么。
定理4:
如果,且是非负递增凸函数,那么。
证明:
令,,,表示X,的分位数密度函数,通过等式(11),对于所有的有:
利用定理3,当,有,又因为是非负递增凸函数,可以得到。
注1:
利用密度函数可以得到平衡分布,(残差分位熵)如下给出:
3特征
根据(10)式,由分位数密度函数唯一确定,对于不同的分布,的特征在表1中可以容易的看出。例如Generalized Pareto的关系式为,为常数,当时,它为指数分布,当时,它为Pareto II(Rescaled beta)分布,
其他分布特征可以以同样的方法分别构建。在表一中给出的不同分位数函数中, Hankin和Lee (2006)提出的Davies分布是重要的一个,这种方法灵活的对右偏态非负数据进行近似指数,伽玛,对数正态分布和威布尔分布,且在的情况下,它变成了对数logistics分布。表一提供了分位数函数的具有封闭形式的表达,但是在一些情况下,只有有封闭形式的表达,因此,对于一系列用表示的分布,我们利用证明一个特征定理。
定理5:一个随机变量,对所有的,当且仅当
成立时,具有分位数密度函数
(12)
其中为实常数。
注2:
在(12)式的分布中,一些有非单调风险分位数函数特征,一些有单调风险分位数函数特征,进一步说,它包含一些典型的分布如指数分布(),Pareto()分布,Rescaled beta()分布,对数logistics分布和Govindarajulu
(1997)提出的生存分布,为,通过(12)式,可以化为,这种形式属于Jones(2007)中定义的密度函数和分布函数之间的关系的分布类(更多细节见Nair(2011))。
参考文献
Bartoszewicz, J., 2009. On a representation of weighted distributions. Statist. Probab. Lett. 79, 1690–1694.
Belzunce, F., Navarro, J., Ruiz, J.M., del Aguila, Y., 2004. Some results on residual entropy function. Metrika 59, 47–161.
Di Crescenzo, A., Longobardi, M., 2002. Entropy-based measure of uncertainty in past lifetime distributions. J. Appl. Probab. 39, 434–440.
Ebrahimi, N., 1996. How to measure uncertainty in the residual lifetime distribution. Sankhya A 58,
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[26324],资料为PDF文档或Word文档,PDF文档可免费转换为Word