基于多元线性回归的施肥方式与茶品质的相关性研究开题报告
2022-01-14 21:55:04
全文总字数:4708字
1. 研究目的与意义及国内外研究现状
中国是茶的故乡,中国茶文化源远流长,国人饮茶至少有4700多年的历史。茶是我国的传统饮品,世人还有以茶代礼的风俗,饮茶与人们的生活密切相关。中国对茶叶发展的贡献,不仅在于最早发现并利用茶这种植物,更在于将其不断地向外传播,并由此形成了影响整个世界的茶文化。
千百年来,人们经过长期的饮茶实践充分证明,茶饮饮用得当,不仅能够增进营养,而且能够怡情悦志,陶冶情操,提高智商和情商,增进身心健康,预防和治疗疾病。例如,茶水有预防癌症、防辐射、抗衰老、改善记忆力、预防蛀牙、预防心脑血管疾病、减肥瘦身、杀菌消炎等功效。所以,经常饮茶对人们的身体有很多好处。
茶叶是健康饮品,品质优劣不但关系着口感风味的好坏,而且与人体健康密切相关,正因如此,找到提高茶叶品质的方法显得尤为重要。施肥是调控茶叶产量和品质的最重要的栽培措施之一,掌握了正确有效的施肥方法才能使茶叶的产量和品质有显著的提升。对于不同的施肥方式、修剪方式对茶叶的品质与产量数据的分析有利于提高茶叶的质量,通过对已有的数据进行科学合理的分析找出影响茶叶产量和品质的因素。
2. 研究的基本内容
数据分析在处理实际性的农业科技领域的大量数据时有着很广泛的应用。本设计将对江苏省农科院所提供的专业农业数据进行分析,以此从中找出一些相关数据的隐含规律。根据数学分析理论中的相关性分析理论即线性回归理论,对茶叶数据进行处理。
首先,对已有的数据进行预处理。分成3个步骤:数据的加载、分析数据缺失情况、删除相关文字介绍列。数据加载就是使用 read_excel()函数简单的读取 excel 表中的茶叶数据。分析数据的缺失情况,使用isnull()函数对已经加载的数据进行空值排查。删除相关文字介绍列,将茶叶的前面文字介绍部分删除。
其次,进行相关性分析。相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。最常用的是利用pearson相关性系数来计算各品质与各种因素之间的相关性。pearson相关性系数,是用于度量两个变量x和y之间的相关性的指标,其值介于-1与1之间,一般用r来表示。r0 代表两变量正相关,r0代表两变量负相关。|r|大于等于0.8时,可以认为两变量间高度相关;|r|大于等于0.5小于0.8时,可以认为两变量中度相关;|r|大于等于0.3小于0.5时,可以认为两变量低度相关。小于0.3说明相关程度弱,基本不相关。
3. 实施方案、进度安排及预期效果
实施方案、进度安排:
2018.12.25-2019.1.15:查阅数据分析相关书籍、论坛、参考文献,学习数据分析的实验步骤。
4. 参考文献
[1]高强,张凤荔,王瑞锦,周帆.轨迹大数据:数据处理关键技术研究综述[j].软件学报,2017,28(04):959-992.
[2]池云仙,赵书良,罗燕,高琳,赵骏鹏,李超.基于词频统计规律的文本数据预处理方法[j].计算机科学,2017,44(10):276-282 288.
[3]贺敏,王蔚韬,何光辉.数据预处理在数据仓库体系结构中的应用[j].计算机科学,2005(05):98-100.