样本容量与组间效应对参数估计的影响研究开题报告
2020-04-25 20:19:42
1. 研究目的与意义(文献综述)
目的及意义(含国内外的研究现状分析)
在现实生活工作与研究中,常常碰到一些多维度的数据,在一个总体内呈现很多水平,而在每一层次内可由时间、空间等因素划分为不同层次。例如重复测量数据、纵贯数据、面板数据、分层数据和时序数据等。而线性混合效应模型正是为了解决这些数据而被nelder和wedderbum提出的。模型发展至今已经应用于诸多领域,如社会科学,临床医学、生物制药、经济与金融数据分析等其他方面[1].
在混合效应模型应用中,并不是所有的多维度数据都适合此模型,样本容量与组内相关系数很大程度上决定了模型的适用与否。因此有必要对样本容量与组内相关系数对模型本身的影响做深刻的分析,然而现行都是通过数值模拟方法大概估计,能否从理论推导的角度,讨论样本容量与icc对模型参数的影响。分别考察在样本容量平衡时,组内相关系数、样本容量与待估计参数的关系;特别是在不平衡时,样本容量扰动及icc的极端变化对模型参数产生扰动的做一个量化标准。
1.2国内外研究现状
在这一方面,许多专家与学者做出来许多的研究与发现,并对模型的方差及固定效应从简单的数值模拟方面给出了一定的性质[2]。[3]介绍了样本容量不平衡下模型参数的极大似然估计.里面仅仅给出了参数的表达式,并没有讨论在样本容量不平衡下这些参数将会发生哪些变化。另外一篇文章[4]提及”if theindividual densities have their peaks in similar locations (i.e., if there is ahigh intraclass correlation)”及”…large intraclass correlations can havesimilar detrimental effects on the quadrature approximation.” 表明高组间相关系数会严重影响模型参数估计。同时在[1]也提到一种很特别的情况---样本容量平衡下----广义线性混合效应的各个参数说具有的各种性质。
2. 研究的基本内容与方案
研究(设计)的基本内容、目标、拟采用的技术方案及措施
研究的基本内容:
1. 合理的模型假设下,建立线性混合效应模型,进而推导模型参数的表达式;
2. 分析随样本容量与组间相关系数的变化,模型参数的普遍变化规律
3. 分析样本容量与组间相关系数在极端情况下模型及参数的变化规律
3. 研究计划与安排
第1-4周:搜索阅读相关参考文献,对国内外样本容量与组间相关系数对线性混合效应的影响进行总体了解,并同时完成英文文献的翻译;
第5-9周:根据参考文献内容,在建立线性混合效应模型、推导参数的基础上,分析随之样本容量与组间相关系数的变化,模型参数的普遍变化规律;
第10-13周:分析极端情况下模型的及参数的变化规律;
4. 参考文献(12篇以上)
[1] jiang, j. (2007). linear and generalized linearmixed models and their applications. springer science amp; business media.p4-p8.
[2] wolfinger, r. d. (1997). an example of using mixedmodels and proc mixed for longitudinal data. journal of biopharmaceuticalstatistics, 7(4), 481-500.
[3] mcculloch charles, e., amp; searle, s. r. (2001).generalized, linear, and mixed models.