EM算法的ε加速在有限混合分布模型中的应用开题报告
2020-04-13 11:08:20
1. 研究目的与意义(文献综述)
em算法是处理非完整数据未知参数的一种迭代方法,由dempster, laird和rubin[1]于1977年提出,可以用来估计非完整数据条件下(包括隐数据和缺失数据等)的模型参数值,广泛应用于截尾数据、删失数据、成群数据等。每一次迭代的具体步骤分成两步:e步(期望步)和m步(极大步)。e步就是用不完整数据的条件期望来填充不完整数据,m步是根据e步得到的数据来计算未知参数的极大似然估计。
基于dempster等人提出了解决不完整数据参数估计的em算法之后,国外有很多研究成果,例如:gelffrey j. mclachlan[2]很好的总结了em算法及其推广算法;wu[3]给出了em算法的一些详细的收敛性质;hartley[4]给出了一般情况下计数数据的处理方式,解释了em算法的基本思想。在markov模型中,baum[5]等人给出了em算法的应用。
在传统em算法基础上,出现了不少改进的em算法。例如meng 和rubin[6]在1993年提出条件期望最大化方法(ecm)来优化m步;liu和rubin[7]在1994年提出了ecm方法的扩展ecme方法;mclachlan和 krishnan[8]在1997年对em算法提出了全面的描述.
2. 研究的基本内容与方案
2.1 研究的基本内容
本文研究em算法的加速及其在有限混合分布模型中的应用。具体工作将有以下几个方面:
1.在em算法求解未知参数估计的迭代过程中,由于对迭代序列本身并非收敛的,首先寻找方法对原始数据进行处理,使之收敛或近似收敛;
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
7-10周:设计算法,功能模块设计
4. 参考文献(12篇以上)
[1] dempster a p. maximum likelihood from imcomplete date viathe em algorithm.[j]. j royal statistical soc, 1977, 39.
[2] mclachlang j, krishnan t. the em algorithm and extensions, second edition[m]. 2007.
[3] wu c f j.on the convergence properties of the em algorithm[j]. annals of statistics,1983, 11(1):95-103.