关键词:
桥梁管养
智能体
强化学习
路网级桥梁
全寿命期
维养优化
摘要:
为制定低碳可持续的路网级桥梁全寿命期维养策略,提升环境、经济与安全综合效益,本研究提出一种基于深度确定性策略梯度(DDPG)强化学习的优化方法。该方法结合桥梁结构特征、网络拓扑、交通数据以及风险态度,构建强化学习智能体,系统性优化桥梁维养决策。环境、经济和安全指标的评估综合考虑资源消耗、潜在结构失效引发的后果及车辆绕行的影响等,量化了桥梁维养对可持续性能的贡献。构建强化学习的奖励函数时,将可持续性指标转化为单调递减的效用值,以反映优化过程中的偏好与约束;基于强化学习框架,设计了包含深度神经网络的DDPG智能体,利用路网级桥梁的结构退化特征和交通数据进行试错学习,从而逐步优化维养决策策略。经过验证结果表明,本研究构建的强化学习方法在环境、经济和安全指标之间取得了更优的平衡,智能体通过试错学习捕捉了桥梁性能变化特征,有效优化了维养优先级和资源分配策略,为提升基础设施管理的智能化与可持续性提供了科学依据。