关键词:
机器学习
WebGIS
耕地质量
农业
预测系统
摘要:
我国是世界上最大的农业生产国,广阔的耕地资源与历史悠久的农耕文化,使得我国在农业实力上居于世界前列。目前我国的耕地资源总体呈现数量多、质量差的局面,各地方农业部门积极开展的耕地质量等级评价,明确了耕地质量提升与保护工作的下一步重点。本文以安徽省庐江县为研究区域,通过机器学习算法中的决策树(DT)模型与随机森林(RF)模型,构建安徽省耕地质量等级预测模型,将两种模型准确度进行对比,确定一种精度更高的预测模型;设计并开发了安徽省耕地质量等级查询与预测系统,并通过与Web GIS技术结合将模型内嵌,以GIS矢量图的形式,直观地展示安徽省耕地质量等级分布情况,实现区域定位与图斑查看、耕地质量相关信息查询与分析、耕地质量等级的预测等功能,以期为农业部门提供决策参考。主要工作与研究成果如下:(一)针对安徽省耕地质量影响因子选取问题,以耕地质量等级国家标准为基础,深度考虑耕地质量影响程度及重要性,利用特征选择方法进行特征影响因子选择。选取了耕地利用现状、土壤类型、耕层质地、质地构型、地形部位、灌溉能力、排水能力、土壤常规养分(有机质含量、有效磷含量、速效钾含量)含量及土壤酸碱度(p H值)等共计11个指标作为本研究的影响因子。(二)耕地质量特征影响因子指标数据多维度、多类型、多量纲,采用主成分分分析法(PCA)、数据量化处理(Quantization)、数据标准化处理(Normalization)等一系列方法进行处理后,数据集对机器学习算法模型具有较强适用性。(三)建立基于决策树(DT)与随机森林(RF)的耕地质量等级预测模型,采用拟合优度(R2)和均方根误差(RMSE)等评价指标评价模型精度。评价结果显示,基于决策树(DT)、随机森林算法(RF)的耕地质量等级预测模型,均具有较稳定的预测性能。其中RF表现性能最佳,对耕地质量等级预测的拟合优度R2达到98.81%,RMSE为0.27,模型稳定性较高。(四)设计、开发了安徽省耕地质量等级查询与预测系统,对系统进行回检测试。系统包含耕地质量等级、土壤养分、土壤类型查询与可视化,耕地质量等级预测模拟等功能,回检测试结果表明,模型对庐江县2020-2021年抽取的部分耕地质量等级评价数据具有较强适应性,测试结果与真实结果对比差值在0.1以内,模拟结果具有参考意义。