【学术前沿】基于贝叶斯网络的机器学习在桩基设计中的应用

深度学习入门笔记

共 4539字,需浏览 10分钟

 ·

2021-03-04 17:18

点击上方“公众号”可订阅哦!


声明:本文只是针对个人学习记录,侵权可删。本人自觉遵守《中华人民共和国著作权法》和《伯尔尼公约》等法律,其他个人或组织等转载请保留此声明,并自负法律责任。论文版权与著作权等全归原作者所有。






01

文章摘要


桩基承载力的不确定性通常表现为模型偏差因子的不确定性,对桩基的可靠性设计具有重要意义。由于跨位点可变性的存在,模型偏差因子的统计数据可能会从一个位点到另一个位点有所不同。同时,由于现场特定负荷试验数据的数量往往非常有限,很难获得现场特定模型偏差系数的统计。本文旨在建立一种基于贝叶斯网络的机器学习方法,利用区域和场地荷载试验数据的信息,对模型偏差系数进行现场统计,从而标定设计桩基的阻力系数。本文所提出的方法已在上海的一个综合荷载试验数据库中得到验证。研究发现,少量的现场桩荷载试验数据可以显著降低模型偏差系数的不确定性,从而提高桩设计的成本效益。本文提出的方法为桩基现场可靠度设计奠定了基础,也为桩基现场荷载试验设计规划提供了有益的借鉴。



02

文章导读


桩基础被广泛用于支撑大型上部结构。然而,由于土体性质的空间变异性、施工误差的随机性以及模型的简化等因素,桩基的承载力不能确定地预测。因此,计算出的承载力可能与实际情况不符。为了明确考虑与桩基础承载力相关的不确定性,越来越多的桩基设计采用可靠度法。应用基于可靠性的设计方法,关键是如何表征与桩基础承载力相关的不确定性。在岩土工程中,通常使用模型偏差因子(有时也称为模型因子)m来测量实测承载力与计算承载力的差异,如下所示:

一般情况下,m的值在不同的桩之间可能不同,因此m可以作为一个随机变量来建模。在桩基可靠度设计中,与桩基承载力相关的不确定性往往以m。


m有两种类型的不确定性。第一,在同一个施工现场,m的值可能因桩而异。这种不确定性通常被称为位点内可变性或位点内可变性。第二,在同一区域内,不同站点m的统计结果往往不同。模型偏差因子在不同位点间的变异常被称为位点间变异或位点间变异。因此,与m相关的不确定性在一个场址小于在一个区域。原则上,桩基可靠性设计应采用模型偏差因子的现场统计,以排除跨场地变异性的影响。然而,一个站点上可用的负荷测试数据数量往往太少,无法对模型偏差因子进行可靠的统计估计。例如,在中国上海的一项调查表明,一个站点的负载测试次数通常不大于5个。Tang and Phoon[10]和Phoon and Tang对世界上现有的桩荷载试验数据进行了全面的调查,也发现了类似的现象。在实际应用中,通常基于区域负荷试验数据库估计m的统计量,而不单独考虑站点间和站点间的变量。当使用这种方法时,与m相关的估计不确定度同时包含场地内可变性和跨场地可变性,这可能会使设计不具成本效益。


尽管特定于站点的负载测试数据不足以表征仅在站点处的模型偏差因子的不确定性,但是尝试利用此类数据来减少基于区域数据库校准的模型偏差因子的跨站点变异性 。最近,Ching和Phoon提出了一种贝叶斯方法来计算相似指数,以结合场地特定数据和粘土土壤参数的一般数据。然而,由于现场桩荷载试验次数很少,其结合桩荷载试验数据的有效性并没有得到充分利用。为了减少模型偏差因子的跨位点变异性,与模型偏差因子相关的跨位点变异性可以明确地建模和表征是至关重要的。如前所述,跨站点的可变性是指模型偏差因子在不同站点的可变性,通过对区域数据库中不同站点的模型偏差因子的可变性进行系统比较,可以得到最好的估计。然而,由于每个站点的负载测试量往往很小,区域数据库中每个站点的模型偏差因子的可变性很大程度上是未知的。因此,跨站点变化的校准是非常困难的,这使得开发特定站点的模型偏差因子统计具有挑战性。


近年来,机器学习技术在许多领域得到了广泛的发展。贝叶斯网络是一种强大的机器学习工具,用于对涉及高复杂性和大不确定性的问题进行信息提取和推理。贝叶斯网络在土木工程中的应用已被许多研究者所尝试。Yazdani等建立了用于结构可靠性评估的分层贝叶斯网络。Gehl和D'Ayala将贝叶斯网络应用于桥梁系统的多灾易损性评估。Yang和Frangopol指出,限制贝叶斯网络的马尔可夫毯可以提高计算效率,这为贝叶斯网络的构造带来了有益的见解。Mendoza-Lugo等人采用了非参数贝叶斯网络来评估钢筋混凝土桥柱破坏的条件概率。Hu和Mahadevan为数据驱动设计的工程应用开发了一个处理贝叶斯网络中的连续变量的框架。此外,贝叶斯网络还被用于基础设施恢复力分析、洪水风险评估和滑坡易感性评估。模型偏差因子的不确定性表征与区域数据库和站点特定负载测试数据站点需要从多源数据学习。贝叶斯网络似乎是描述模型偏差因子的不确定性的理想工具,包括跨站点的可变性和模型偏差因子的特定站点统计。

本文的目的是提出一种基于贝叶斯网络的机器学习方法来学习跨场地的变异性和模型偏差因子的场地特定统计数据,以便实现具有成本效益的桩基设计。本文组织如下。首先,介绍了本文方法背后的基本思想,然后描述了为学习跨站点变异和模型偏差因子的特定站点统计而提出的贝叶斯网络。然后,介绍了如何基于贝叶斯网络的结果进行桩基可靠性设计。在此基础上,利用上海的负载测试数据库对该方法进行了验证。最后,分析了现场荷载试验数据对桩基设计的影响。本文所提出的方法为实现桩基的现场可靠度设计提供了有用的工具。



03

方法


图1为本文提出的基于贝叶斯网络机器学习的桩基设计方法流程图。建议的方法包括两个步骤。首先,明确考虑跨站点变异性的贝叶斯网络被用来学习模型偏差因子的特定站点统计数据。贝叶斯网络的学习依赖于可用的数据。如图1所示,当新的试验点没有特定试验点的可用数据时,试验点的跨试验点变异性和模型偏差因子的统计数据是从区域数据库中学习的。当新址的特定负荷试验数据可用时,考虑到区域数据库和特定负荷试验数据,可以了解跨址变异性和模型偏差因子的统计。其次,在模型偏倚系数的统计量得到后,可以用模型偏倚系数的统计量来确定设计方程中的阻力系数,因为在常规设计中,桩基的评价是根据阻力系数而不是模型偏倚系数的统计量。下面将详细介绍上述方法的组成部分。




04

贝叶斯网络学习无负载测试数据的新站点


贝叶斯网络的结构


图2为本文在桩基设计新场地无荷载试验的情况下,建立模型偏差因子与区域内不同场地实测数据之间关系的贝叶斯网络。稍后将介绍在桩基设计新场地可进行荷载试验的情况下的贝叶斯网络。如图2所示,贝叶斯网络由表示变量的圆、表示观测数据的框和表示两个变量之间因果关系的链接组成。在贝叶斯网络中,变量被建模为随机变量,因果关系通过条件概率分布来建模。通过这种关系,可以利用从一个变量观察到的信息来更新其他变量的信息。


根节点的先验分布


在图2所示的贝叶斯网络中,根节点的先验分布应该反映一个区域内模型偏差因子的位点内和跨位点变异性的先验知识。目前,关于站点内和跨站点变异的先验分布的相关信息非常有限。事实上,如何确定最佳先验分布被认为是贝叶斯方法在岩土工程中的应用中最具挑战性的问题之一,需要进一步研究。在未来的研究中,应该进行更多的研究来确定最佳的先验分布。在缺乏足够的关于位点内和跨位点变异的先验知识的情况下,机器学习的过程从很少的信息开始。为了简化计算,本文采用了非信息共轭先验分布。
贝叶斯网络模型也可以解释为用于meta分析的贝叶斯模型,文献中通常称之为贝叶斯层次模型或多层次贝叶斯模型。在这些术语中,贝叶斯网络似乎在岩土工程中更为人所知。此外,贝叶斯网络中随机变量之间的关系的图形化表示使经验不足的用户更容易理解。此外,本研究后面将会看到,贝叶斯网络的马尔可夫覆盖特性为推导从后验分布中抽取样本的算法提供了一种方便的方法。综上所述,本研究采用贝叶斯网络项。


贝叶斯网络学习与负载测试数据的新网站


在上述分析中,假设需要进行桩基设计的场地没有荷载试验数据,桩基设计基于区域数据库。当现场特定负荷试验数据可用时,也可以学习这些数据,减少现场模型偏差因子的不确定性。这种情况下的贝叶斯网络如图3所示。


需要注意的是,图2中的贝叶斯网络是用于无现场荷载试验数据的桩基设计。在这种情况下,根据λmNand ξm2的分布绘制出mnxn的样本,并在区域数据库中学习。从本研究的举例说明中可以看出,单纯基于区域数据库进行桩基设计是可行的,但涉及的不确定性是很大的,设计可能不具有成本效益。另一方面,当特定站点负载测试数据是可用的,样品的mNxcan从图3所示的贝叶斯网络,通过相关的不确定性模型可以减少偏见的因素考虑到特定站点负载测试数据,和桩在这种情况下可以设计在一个更具成本效益的方式。



05

对建议方法的验证


为了验证建议的机器学习方法的适用性,我们收集了中国上海的一个数据库。上海位于中国长江三角洲冲积平原。上海底土较为均匀,主要由粘土、粉砂、砂土等沉积物组成。上海市典型土层如表1所示。基岩的深度可达300-400米。


在对模型偏差系数进行校正时,校正数据库中的桩必须是同一类型、位于相似的土体剖面上,并采用相同的判据对桩的承载力进行解释。在模型偏差因子校正后,从校正数据库中所学到的知识也应应用到类似土壤剖面中同类型桩的设计中。在上海,混凝土方封闭端打入桩应用广泛。表2显示了基于15个场地87桩静载试验数据的设计表法模型偏差系数测量区域数据库。这些桩的空间分布如图4所示。由表2可以看出,这些桩的长度都在20-30 m范围内。由于上海地区地层较为均匀,这些桩所处的土体剖面相似。端部承载土层为第V层或第VII层,是打入桩可到达的较浅深度的强土层。所有桩均为摩阻桩兼端承桩。在上海,承载力定义为桩长不为> 40 m时,沉降达到40mm时的荷载。标定库中的桩承载力是根据上述准则确定的。




06

结论


本文开发了一种方法来开发模型偏差因子的现场统计,从而可以以一种经济有效的方式设计桩基础。本文的主要发现如下。

(1)建立模型偏差因子的特定统计量,必须明确考虑模型偏差因子的跨站点变异性,该因子衡量不同站点模型偏差因子统计量的差异。在建议的贝叶斯网络中,跨站点的变异性被明确建模。利用吉布斯采样器可以有效地训练贝叶斯网络。(2)本文提出的贝叶斯网络可以用来学习站点特定的基于统计模型的偏差因素区域数据库,它也可以用来学习站点特定的统计模型的偏差系数利用信息从数据库区域和特定站点负载测试数据。得到模型偏差系数的统计量后,可用于实际桩基设计中对阻力系数的标定。(3)少量的现场荷载试验数据可以有效降低新场地下模型偏差系数的不确定性,从而在保持相同可靠度水平的情况下实现桩基的高性价比设计。模型偏倚系数的现场偏倚系数取决于实测模型偏倚系数的统计量和桩荷载试验次数,通过该方法可以定量评价这些因素的影响。



 END

深度学习入门笔记

微信号:sdxx_rmbj

日常更新学习笔记、论文简述

浏览 81
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报