关键词:
人口空间化
堆叠集成模型
POI数据
夜间灯光数据
青藏高原
摘要:
人口空间化是将基于行政单元的人口更准确的展布于地域空间中,能更充分的展示人口空间分布信息,对施行人口精细化管理,协调人口与资源、环境、发展之间的矛盾具有重要意义。青藏高原是世界屋脊,掌握青藏高原人口分布信息有助于完善全球人口分布特征,如人类居住生活的最高海拔。其次,青藏高原与缅甸、印度、不丹、尼泊尔等多个国家接壤,其地理位置具有重要的战略意义,习近平总书记也曾多次强调“治国必治边,治边先稳藏”,稳藏的第一要务便是掌握人口分布信息。因此,掌握青藏高原人口分布对于稳藏、援藏等国家措施具有重要战略意义。本文以青藏高原为研究区,从自然条件和社会经济两个方面选择海拔、坡度、地形起伏度、归一化植被指数、河流、道路等廊道、夜间灯光数据、POI数据和建成区数据等作为表征人口分布的影响因素。基于2010年第六次全国人口普查乡镇尺度数据,结合青藏高原行政区划,分别用单模型(随机森林模型、XGBooost模型和Cubist模型)和集成模型(加权平均集成模型和堆叠集成模型)将青藏高原人口统计数据空间化为30×30m的栅格数据,并对各模型拟合精度进行验证,讨论了各模型出现差异的原因。同时将拟合结果与World Pop人口数据集和Google Earth影像进行横向比对,进一步验证结果精度。此外,本文基于最优拟合结果,利用空间分析方法,研究了青藏高原人口分布特征、人口空间分异特征和空间自相关性,以及与各指标因子之间的耦合关系。最后,讨论了各指标因子对青藏高原人口分布的影响程度,同时讨论了单模型与集成模型的优势与适应性范围。主要研究结论如下:(1)所有模型拟合精度均优于World Pop数据集(RMSE=1143.81,R2=0.814),且Cubist模型采用分段线性回归方法,在单模型中获得了最优的拟合精度(RMSE=865.77,R2=0.893);堆叠集成模型通过二次机器学习的方法,获得了本文最好的空间化结果(RMSE=799.79,R2=0.908),其拟合精度较World Pop数据集提升了30.08%。整体看来,基于集成模型的人口空间化方法更适宜用在地形复杂,人口分布差异大的地区。(2)青藏高原2010年人口总数在1173.6~1204.8万人,平均人口密度为4.56~4.68人/km2。人口分布呈现出东南密集,西北稀疏的水平地带性和三级阶梯式的垂直分布特点。河湟谷地、雅鲁藏布江流域中游谷地、一江两河等河谷农业发达地区是青藏高原人口集中分布的核心区。通过在栅格尺度的异质性计算,发现青藏高原人口分布异质性总体较高,而异质性较低的地区主要分布在城市内部。通过空间自相关分析,得到全局莫兰指数为0.8241,人口分布存在显著的正向空间自相关关系,且以低-低聚类分布为主,高-高聚集分布现象主要发生在青藏高原东部,以西宁、拉萨、格尔木市、日喀则市为代表。结合空间自相关分析和异质性结果,发现人口分布异质性较低的地区分布在人口高-高聚集区,而人口异质性较高的地区分布在人口低-低聚集区。(3)青藏高原人口分布的海拔上限为5800m。此外,青藏高原约2/3的人口主要分布在坡度为小于25°、地形起伏度小于300m,距河流距离小于8km的范围内。说明青藏高原人口主要分布在海拔较低、坡度较小、地形较平坦、水源充足的区域。在社会经济方面,人口主要分布在基础设施较完善、经济较发达、交通便捷的地区。在影响人口分布的因素中,海拔、距建成区距离、人居指数是影响人口分布的三大主要因素,总体而言,地理要素决定了某一地区是否存在人口分布,而社会经济要素决定了这一地区人口分布的数量。