利用统计学的方法研究癌症的分型开题报告
2020-04-23 19:39:15
1. 研究目的与意义(文献综述)
目的及意义:
基因表达数据的不断扩大、生物统计和数据科学的飞速发展表明,应用基因表达数据对肺癌进行诊断和分类,可能在基因表达水平上精确区分肺癌的分子亚型,以更好地预测肺癌疗效。因此,该研究的开展标志着肿瘤分型已进入分子时代。通过对肺癌基因表达数据的聚类,可发现不同亚型差异表达的基因,从而找到肺癌治疗的分子靶标,亦对肺癌的发生发展机理探讨、肺癌的早期诊断和分型等方面均有重要意义。
2. 研究的基本内容与方案
研究的基本内容、目标:首先,基于肺癌细胞的基因表达数据,利用聚类分析找到肺癌的亚型,为肺癌治疗提供新的药物靶点;然后,基于对应的临床数据做生存分析,绘制生存曲线,以检验聚类分析的效果。
拟采用的技术方案及措施:
①采用k-medoids聚类方法对正常细胞的基因表达数据、肺癌细胞的基因表达数据分别聚类(基于基因),根据不同类别的趋势特征,找出正常细胞与肺癌细胞差异表达的基因,结合肺癌的临床特征,在差异表达的基因中找到新的药物靶点。
3. 研究计划与安排
第1-3周: 阅读各类文献、着重阅读与翻译一篇主要参考的英文文献;
第4周: 与老师讨论,提出自己的想法,并将开题报告的初稿写好,递与老师审阅,修改开题报告,最终确定;
第5—6周: 实验所采用的方法,进行仿真分析、编程、记录。对于结果进行确认、修正。对于出现的问题请教老师;
4. 参考文献(12篇以上)
[1] leihong wu et al. netbags: a network-based clustering approachwith gene signatures for cancer subtyping analysis [j]. biomark. med. 9(11),1053–1065(2015).
[2] lee st, feng m, weiy et al. protein tyrosine phosphataseubash3b is overexpressed in triple-negative breast cancer and promotes invasionand metastasis [j]. proc. natl acad. sci. usa 110(27), 11121–11126 (2013).
[3] komatsu m, yoshimarut, matsuo t et al. molecular featuresof triple negative breast cancer cells by genomewide gene expression profilinganalysis [j]. int. j. oncol. 42(2), 478–506 (2013).