关键词:
机器学习方法
硅酸盐水泥熟料
强度预测
混合优化算法
TransXRD模型
摘要:
科学研究第四范式的提出标志着数据密集型科学研究方法时代的到来。机器学习和人工智能技术的发展为日趋复杂的材料设计提供了全新途径。机器学习方法建立材料影响因素与目标量间的映射关系:一方面实现材料成分、结构、组织、性能的精准预测;另一方面从不同尺度、不同维度深入认识材料的机理特征,理解材料问题的科学本质,揭示设计过程与材料宏观性能的关系,实现实验过程优化,改善依靠直觉和大量“尝试法”的材料研发思路,形成数据驱动的研究方法,从而加速材料设计与研发。
本论文基于大数据与ML方法,针对硅酸盐水泥熟料的结构和性能,开展了相关性分析、特征选择、数据建模等,实现了熟料强度有效预测及逆向配方优化。通过分析实验表征数据和生产物检数据的特征,探究水泥熟料组成-结构-性能的定性定量关系,分析挖掘数据中隐藏的客观规律。针对单一的神经网络模型的局限性和数据样本集不均衡等问题,收集不同企业的有效数据,在集成算法的基础上,提出了一种新型的混合优化算法,有效提高模型预测精度和泛化能力。针对熟料性能预测模型泛化能力有限,对异变工艺或新工况不能识别响应、误差增大甚至不适用的问题,通过XRD(X-ray Diffraction)表征熟料矿物组成,从熟料的本征属性出发,实现高精度强度预测。具体内容如下:
(1)针对现有水泥熟料强度预测模型数据集样本较小且优化算法单一,模型泛化能力低这一问题,将XGBoost模型与贝叶斯算法,遗传算法相结合,提出一种混合优化算法的强度预测模型。基于来源于不同企业的1400多组有效数据,输入筛选后的特征参数,预测结果与试验结果整体拟合效果较好,其测试集R2达到0.84;与其它模型相比,该混合优化算法模型的预测精度最高,RMSE、MSE、MAE分别为1.42、2.04、1.10。结合SHAP值对模型特征进行可解释分析,结果表明:Ca O含量、终凝时间、Mg O含量是影响熟料抗压强度的关键特征变量。这一结果说明模型内在的预测逻辑与表现出的预测效果一致,具有较高的合理性与可靠度。
(2)基于混合模型的输出结果设定优化目标范围,选择BOA优化算法反复迭代地优化熟料配比。结果表明,其实际测量强度在[59.2 MPa,63.2 MPa]范围内,与设定的目标值范围[58MPa,60MPa]偏差在3.2MPa内。实验结果与目标强度值较为吻合,证明了该混合模型的可靠性与适用性。
(3)针对传统ML模型泛化能力差,对异变工艺或新工况不能识别响应、误差大甚至不适用的问题,通过输入XRD衍射数据来预测抗压强度,构建了一种名为TransXRD的深度学习模型。该模型通过将Transformer架构和CNN有效结合,用于处理XRD数据长序列的二维数组。其独特的注意力机制能够灵活处理各种输入扫描角度和采样间隔,减少信号损失,增强对各种输入格式的适应性。这一方法显著提高了预测准确性。在训练集中,MAE为0.93,MSE为1.33,RMSE为1.15,MAPE为1.76,100%的数据预测误差在2 MPa以内,而在测试集中,MAE为0.93,MSE为1.33,RMSE为1.15,MAPE为1.76,90%的预测误差在2 MPa以内。