基于回归分析的蓝莓品质与影响因素的相关性分析开题报告
2022-01-12 22:42:58
全文总字数:4417字
1. 研究目的与意义及国内外研究现状
蓝莓是一种营养价值非常高的水果,果肉富含丰富的维生素、蛋白质和矿物质等营养元素。蓝莓果实色泽美丽、悦目,风味独特,酸甜适度,又具有香爽宜人的香气,其中常规营养成分含量十分丰富,矿物质和微量元素含量也相当可观,具有防止脑神经老化、保护视力、强心、抗癌、软化血管、增强人机体免疫等功能,因而国际粮农组织将其列为人类五大健康食品之一,近些年来蓝莓逐渐获得人们的青睐。
相较于其他的蓝莓强国而言,我国在蓝莓种植品质上存在着较大的差异,这一现状表明了现阶段我国存在着许多阻碍蓝莓健康发展的因素。本选题是很有意义的,蓝莓的品质直接影响了蓝莓的口感,所以找到影响蓝莓品质的因素是很关键的。本选题将从地域因素、土壤因素、叶子因素、根际因素、果实因素这5个因素对蓝莓品质的影响进行分析。不同的地区有着不同的土壤环境,不同的土壤环境导致蓝莓根部微量元素、叶片的微量元素、果实中的微量元素等元素的含量是不同的。本选题的意义在于结合现有的数据、使用数据分析方式,掌握这些不确定因素对蓝莓品质的影响,从而提高蓝莓的品质。
综上所述,本选题的目标就是根据现有全国蓝莓数据的数据(蓝莓的品质随着地区因素、土壤因素等因素变化而变化的数据),结合机器学习中数据分析的算法,挖掘出蓝莓品质和这些因素之间的相关性,找到最佳模型,并且将这一模型运用到生产实际,为蓝莓品种的优选提供科学的参考依据。
2. 研究的基本内容
随着大数据的不断发展,数据分析在各行各业中得以运用,在农业方面尤为显著。本研究是为了通过对全国蓝莓数据进行处理与分析,挖掘出与蓝莓品质因素相关的地区因素、土壤因素、叶片因素、根部因素等因素对果实的品质的影响,从而提高蓝莓的产量。
为了探讨地域因素、土壤微量元素、根部微量元素、叶片微量元素、果实微量元素对蓝莓品质的影响,可以借助python强大的科学计算函数。python中的person模块中的corr函数,能够挖掘出自变量和因变量之间的相关性。
对于多元变量(土壤微量元素、叶片微量元素、根部微量元素)进行数据分析首先要排除多重因子共同作用的影响,利用seaborn模块中的pairplot函数,可以得到能够直观体现自变量和因变量之间关联的散点图和预测曲线。为了更具有说服力,使用seaborn模块中的linearregression库,利用梯度下降算法,求出回归方程,回归方程的系数就是各元素所占权重的直接体现,结合相关系数结果可以得到提高蓝莓品质的方案。
3. 实施方案、进度安排及预期效果
2018年12月-2019年1月15日:
进行大数据和数据分析基础知识的学习,安装环境python3.6 可视化工具pycharm,在pycharm中下载所需要的函数库,同时熟知环境的操作流程;
2019年1月16日-2019年2月15日:
4. 参考文献
[1]王颖,李金,王磊,徐成振,才忠喜.基于机器学习的microrna预测方法研究进展[j].计算机科学,2015,42(02):7-13.
[2]张福旺,苑会娟.基于多元线性回归的空腹血糖影响因素分析方法[j].计算机科学,2018,45(s2):545-547.
[3]朝乐门,邢春晓,王雨晴.数据科学与大数据技术专业特色课程研究[j].计算机科学,2018,45(03):3-10.