关键词:
泄漏区域识别
二分迭代法
k-means
随机森林分类器
特征选择
平均准确率减少
摘要:
当采用模式识别方法识别供水管网的泄漏时,如果将每一个节点作为分类器的一个标签,由于供水管网节点泄漏特征的相似性,模型训练的准确率会比较低,因此可以通过聚类泄漏特征相似的节点形成区域,以每个区域作为分类器的标签从而提高模型训练的准确率。提出了一种基于随机森林分类器的二分迭代法识别泄漏区域,根据上一级分类器识别的泄漏区域的节点泄漏变化矩阵,采用k-means聚类将上一级迭代识别的泄漏区域聚类为两类(包含泄漏节点的区域和不包含泄漏节点的区域),从而识别包含泄漏节点的区域。随着候选泄漏区域的缩小,对识别泄漏区域有帮助的测点数量也逐渐减少,因此采用平均准确率减少(MDA)进行分类器特征(所需测点)的选择,在保证识别准确率不变的情况下减少分类器训练时所需的特征。与直接进行区域分块的识别方法相比,二分迭代法降低了选择区域分块数目时的盲目性,对于泄漏区域的识别更有目的性,提高了泄漏区域识别的准确率和效率。