利用统计学的方法识别肺癌的生物标记物开题报告
2020-04-23 19:38:50
1. 研究目的与意义(文献综述)
1.1 国内研究现状
2010年,杨洋等人应用表面增强激光解析电离飞行时间质谱技术检测112例非小细胞肺癌和123例对照血清样本的蛋白质质谱,并结合支持向量机对数据进行分析,从而得到结论:m/z峰值位于6628、9191和11412的蛋白质可以作为非小细胞肺癌潜在的生物学标记物。
2011年,蔡旭伟等人应用比较蛋白质组学方法检测了2组患者放疗前中后各个时间点外周血蛋白质谱表达差异,并通过方差分量模型以及bonferroni校正法来鉴定。方差分量模型用于把某一蛋白在各个时间点的表达情况整合成一个参数,从而在2组间进行比较,该方法用于在小样本条件下提高统计效力。从而得出结论这些差异表达蛋白有可能成为新的预测放射性肺损伤的潜在外周血蛋白标记物。
2. 研究的基本内容与方案
2.1 研究的基本内容及目标
由于肺癌生物标志物的类别很多,从基因层面到蛋白质层面再到表达层面都有着多种类型,由于资源数据获取的有限性,我们可以在网上下载很多关于肺癌基因表达的数据,然后建立相关的统计模型,筛选出能够影响肺癌的相关基因,并对模型进行验证。
本文研究的目标是一方面建立惩罚回归模型筛选基因表达数据,另一方面是建立朴素贝叶斯分类器对分类进行验证。
3. 研究计划与安排
第1-3周:阅读有关生物统计、生物标记物方面的文献资料,明确研究的主要内容,了解研究所需理论知识和方法,学习编程,并温习所学过的统计方法。
第4-5周: 翻译相关的英文文献,确定自己的研究方案,撰写毕业论文开题报告。
第6-9周:学习生物概念,熟悉生物数据,学习r、python等编程语言,对数据进行预处理。
4. 参考文献(12篇以上)
[1] 王冬梅,李为民,李静,陈文彬. 吸烟与肺癌关系的meta分析[j]. 中国呼吸与危重监护杂志,2009,8(03):229-233.
[2] 李典和.血清mirnas作为生物标志物应用于非小细胞肺癌的早期诊断[d].南方医科大学,2017.
[3] 许德兵,宋勇. 分子生物标志物在肺癌早期诊断中的研究进展[j]. 医学研究生学报,2013,26(07):766-770.