GENERAL FRAMEWORK FOR OPTIMAL PREDICTIVE ADAPTIVE SURROGATE MODEL BASED ON SIPESC
-
摘要:
针对航天结构设计中代理模型构建过程中变量筛选、模型选择和精度提高的问题,基于面向插件服务式的开放式软件平台SiPESC,利用已有的代理模型设计架构和功能,研发了最优预测自适应代理模型通用构架。采用变量过滤服务,筛选关键变量参与代理模型构建。设计构建试探方法,自动选择适配的代理模型算法。拓展代理模型的自适应取样服务,提高代理模型精度。利用该架构对主流的变量过滤准则、高效的自适应加点准则进行扩展,研发了可用于工程问题的最优代理模型快速自动化设计软件。研究工作表明:设计的架构利用可充分利用已有代理模型算法,实现变量筛选和代理模型算法自动选择,提高了航天结构设计中代理模型构造过程的效率。
Abstract:To address the issues of variable selection, of model selection and, of accuracy improvement during the construction of surrogate models in space structure design, a general framework for an optimal predictive adaptive agent model is proposed. This framework is developed on the SiPESC platform, an open and plugin-oriented service software system, by employing established surrogate modeling design architectures and functionalities. In this framework, variable filtering services are deployed to identify variables that are strongly correlated and critically significant for the construction of surrogate models. Accuracy evaluation filtering services are then applied to determine the most suitable surrogate model algorithms. Moreover, adaptive sampling services are refined to augment the accuracy of the surrogate modal post-construction. Additionally, established mainstream variable filtering criteria and efficient adaptive refinement criteria are integrated into the framework, then an automated rapid design software is developed for optimal surrogate modeling in engineering problems. This study demonstrates that: the designed architecture effectively leverages existing surrogate modal algorithms, facilitating automated variable selection and surrogate modal algorithm determination, thereby significantly enhancing the efficiency of the surrogate modal construction process for space structure design.
-
Keywords:
- space structure /
- optimal prediction /
- adaptive /
- surrogate model /
- parameter filter
-
代理模型[1]构建目标是建立起变量和响应值之间的数学关系,通常应用在航天结构设计和优化过程中,替代计算复杂或耗时的仿真过程,或建立试验样本中参数关联关系。高精度的代理模型可以有效地提高工程模拟、可靠性分析[2]、优化设计[3]、数字孪生[1]、快速显示[4]等工作的效率。WANG等[5]将代理模型用于变角束丝绕筒壳可靠性优化设计过程。LUIZ LEBENSZTAJN等[6]将克里金模型和径向基神经网络进行结合,应用于电磁器件优化过程。LI等[7]将代理模型用于地质统计学土壤成分研究。董青等[8]使用Kriging代理模型进行桥梁结构疲劳寿命预测。GUTIÉRREZ-PRIETO等[9]代理模型用于生物医学领域中冲击波压力剖面重要参数确定。杨思宇等[10]使用并行EGO和代理模型辅助的多参数方法进行化工领域流程模拟优化。ALLAIRE等[11]用代理模型估计航空工业中各种模型的不确定性传播。多种类型的软件工具提供了代理模型构建功能,如SAS、Minitab、Isight、Design-Expert、 SiPESC,并实现构建流程的自动化。在面对航天结构设计中变量多需要进行未知问题探索时,通常需要使用以上软件进行多次操作和构建,进行灵敏度分析和近似方法的尝试以实现更高精度代理模型的构建。如何提高代理模型构建过程的效率具有重要的意义。
代理模型的构造过程中,参数变量选择、近似方法选择、变量空间中的取样等多个环节都会影响代理模型精度。对于参数变量,存在所谓的“维度诅咒”,变量过多会造成数据稀疏、样本覆盖不足,同时高维空间特征会造成模型受噪声影响出现过拟合现象,TIAN等[12]探讨了高维问题对传统代理模型构建带来的挑战,并提出了一种基于变量代理模型的粒子群优化方法来应对这一挑战,杨鸽等[13]提出基于响应空间子域概率配点的代理模型用于高维重力坝代理模型和可靠性分析问题。现实工业问题中,需要选择对响应贡献较大的变量,提高精度,LEE等[14]通过仅使用所选变量代理模型的质量来评估变量的重要性提出一种变量更少同时保持模型精度的高斯过程回归模型,MAI等[15]根据变量提高目标和约束的代理精度,识别盲克里金函数的高阶效应。代理模型算法中,多种类型的算法在不同样本各有优势,常用的方法包括响应面、径向基函数、Kriging、正交多项式等。张人会等[16]使用动态RBF代理模型构建了离心泵叶轮优化问题;刘峰等[17]使用响应面模型建立了载人潜水器艇型与推进、结构等学科的学科分析模型,并进行优化设计。在代理模型取样过程中,通常会使用试验设计方法让样本在空间分布更加合理,JIN等[18]使用增强的随机进化算法对LHS的样本分布进行判定准则优化,使其具有更好的空间填充特性,郭文华等[19]使用正交试验设计对大直径盾构下穿高铁桥梁的加固措施进行优化设计,李宁等[20]结合距离信息和概率分布信息在重点区域进行采样,提高了采样效率。
代理模型构建过程中,通常也会使用自适应的方法改进代理模型精度用于在未知区域搜索新样本点,常用的几种加点准则有最小化模型预测准则[21](min surrogate prediction, MSP)、均方根误差准则[22] (mean square error, MSE)、置信下界准则[23](lower confidence bound, LCB)、改进概率准则[24] (probability of improvement,PI)、期望改进准则[25] (expected improvement,EI)等。这些加点方法或适用于局部搜索,或适用于全局搜索,或二者兼顾。动态加点准则能够在相同取样数量的情况下有效提高代理模型精度。一次性采样加序列采样是目前计算机试验设计的主流。
代理模型的构建过程形成了众多的技术和方法,这些技术和方法的选择和实施依赖人工操作才能完成。实际航天构造设计中,代理模型的过程中需要更多的软件支持以提高效率。因此,在已有多种代理模型算法基础上,开发综合参变量筛选、算法自动选择和自适应取样的通用构架具有重要意义。
本文基于开放式软件平台SiPESC的面向服务构架(面向服务是一种编程范式,通过将软件分解为可重用的服务,支持系统间互操作性,增强应用的灵活性和可维护性。以此可更容易地构建、扩展和维护大型和复杂的系统,同时促进了模块化和代码复用。)及其已有代理模型功能,增加了变量相关性过滤和重要性过滤功能,拓展了代理模型的自适应功能,采用面向服务插件(插件是扩展或增强现有软件系统功能的独立模块,便于自定义和灵活使用)式的软件设计模式,研发了最优预测自适应代理模型通用构架。架构中对最优预测中变量筛选、代理模型种类自动选择、自适应代理模型样本增加三项技术的软件实现进行提炼,设计了独立于代理模型任务流程的两层变量过滤服务,筛选相关性高和重要度高变量参与代理模型构建,设计了通用的自适应加点法则、停止取样法则,提高代理模型精度,从而实现变量筛选、模型选择、模型精度提高的通用算法架构,提高了航天结构设计代理模型构建效率。本文重点阐述两层过滤和自适应过程的原理,给出了架构的通用性。利用该架构对主流的变量过滤准则、自适应加点准则进行扩展。最后给出了数值和工程算例验证。
1 代理模型参数变量选择方法
代理模型构建中,为了避免变量过多带来的不利影响,需要对参数变量进行选择,常用的方法有相关系数法和重要系数法,其中相关系数法的优势在于依赖于特征的统计特征,不涉及任何学习算法,易于实现,计算效率高,同样该算法不依赖于代理模型,因此其选择的特征对不同的模型都是有效的,其劣势在于仅考虑单个特征与结果的关系,会忽略特征间相互作用的影响。重要系数法的优势在于通过训练模型来评估特征子集的效果,能够捕捉到特征之间的相互作用,通过不断迭代搜索,能够适应不同的问题和模型,劣势在于特征数量大的时候,耗时且计算成本高,对代理模型要求也比较高。
所以本文采用的变量筛选的过程分为两步,首先通过相关性过滤筛除与响应相关度低的变量,然后通过重要度过滤筛除对代理模型精度影响小的变量。
1.1 相关性过滤器
对于响应变量 {\boldsymbol{y}} = \{ {{y_1}, \cdots ,{y_l}, \cdots ,{y_p}} \} 和输入变量{\boldsymbol{x}} = \{ {{x_1}, \cdots ,{x_k}, \cdots ,{x_q}} \},相关性过滤是基于样本{\boldsymbol{S}},计算{\boldsymbol{x}}和 {\boldsymbol{y}} 之间的相关系数,选出{\boldsymbol{x}}中显著相关的分量参与代理模型的构建,常用的相关系数计算方法有:
(1) 皮尔逊积矩相关系数
r = \frac{1}{{N - 1}}\sum\limits_{i = 1}^N {\frac{{({{\boldsymbol{x}}_{\rm i}} - \overline {\boldsymbol{x}})({{\boldsymbol{y}}_{\rm i}} - \overline {\boldsymbol{y}})}}{{{\sigma _{\rm x}}{\sigma _{\rm y}}}}} (1) 式中:{\sigma _x}、 {\sigma _y} 为变量与响应的样本标准差;\overline {\boldsymbol{x}}、\overline {\boldsymbol{y}}为变量与响应的样本平均值。皮尔逊相关系数的取值范围在[ - 1,1]之间,+1表示完全正相关,-1表示完全负相关,0表示没有线性关系。
(2) 斯皮尔曼等级相关系数
\rho = \frac{{\displaystyle\sum\limits_{ \rm i = 1}^N {( {R({{\boldsymbol{x}}_{\rm i}}) - \overline R({\boldsymbol{x}})} )} ( {R({{\boldsymbol{y}}_{\rm i}}) - \overline R({\boldsymbol{y}})} )}}{{\sqrt {\left( {\displaystyle\sum\limits_{\rm i = 1}^N {{{( {R({{\boldsymbol{x}}_{\rm i}}) - \overline R({\boldsymbol{x}})} )}^2}} } \right)\left( {\displaystyle\sum\limits_{\rm i = 1}^N {{{( {R({{\boldsymbol{y}}_{\rm i}}) - \overline R({\boldsymbol{y}})} )}^2}} } \right)} }} (2) 式中:R({\boldsymbol{x}})、R({\boldsymbol{y}})分别为{\boldsymbol{x}}和{\boldsymbol{y}}在样本中的位次; \overline R({\boldsymbol{x}}) 和 \overline R({\boldsymbol{y}}) 分别为平均位次。
相关系数计算方法的共同特点是对一个样本集{\boldsymbol{S}}进行分析,过滤后筛除样本中相关度低的变量,形成新的样本集合{\boldsymbol{S'}}。该过程的实施与已有的代理模型构建过程无关,可以设计独立的过滤器功能,形成面向服务的相关度过滤功能插件(将参数过滤器功能设计成服务,通过插件实现),对代理模型构建之前的样本进行处理。
1.2 重要度过滤器
重要度过滤方法是针对输入参数{\boldsymbol{x}}中的每一个分量 {x_{\rm k}} ,采用样本训练集{\boldsymbol{\tilde S}}构建代理模型,通过测试集 {\boldsymbol{\hat S}} 检验代理模型的精度,对比分量 {x_{\rm k}} 存在前后代理模型的精度。
定义 CoD 为重要度评价系数,对于分量 {x_{\rm k}} ,其存在前后对响应的影响程度重要度系数 CoI_{\rm k} 计算如下:
\begin{split} CoI_{\rm k} =& CoD({x_1}, \cdots ,{x_ {\rm p}}) -\\& CoD({x_1}, \cdots ,{x_{{\rm k} - 1}},{x_{{\rm k} + 1}}, \cdots ,{x_{\rm n}}) \end{split} (3) 重要度过滤过程中,设定一个重要系数最小值阈值 Co{I^{\min }} ,选择 CoI_{\rm k} {\geqslant} Co{I^{\min }} 的分量参与代理模型构建。
常用的精度评价标准都可以作为重要度评价的工具,包括:
(1) 决定系数评价
决定系数描述了响应 {\boldsymbol{y}} 被输入参数{\boldsymbol{x}}的影响程度。决定系数使用 {\overline R^2} 来评估代理模型的质量,计算过程如下:
{R^2} = 1 - \frac{{\displaystyle\sum\limits_{\rm i = 1}^N {[{\boldsymbol{y}}({{\boldsymbol{x}}_{\rm i}}) - {\boldsymbol{\hat y}}({{\boldsymbol{x}}_{\rm i}})} {]^2}}}{{\displaystyle\sum\limits_{ \rm i = 1}^N {[{\boldsymbol{y}}({{\boldsymbol{x}}_{\rm i}}) - \overline {\boldsymbol{y}}({{\boldsymbol{x}}_{\rm i}})} {]^2}}} (4) {\overline R^2} = 1 - \frac{{N - 1}}{{N - p}}(1 - {R^2}) (5) 式中: {\boldsymbol{\hat y}}({{\boldsymbol{x}}_{\rm i}}) 为测试点的预测值; \overline {\boldsymbol{y}}({{\boldsymbol{x}}_{\rm i}}) 为测试点的真实值的均值; {\boldsymbol{y}}({{\boldsymbol{x}}_{\rm i}}) 为测试点的真实值;p为模型中变量的总数。
评价系数 CoD 计算如下:
CoD = {\overline R^2} (6) (2) 均方误差评价
均方误差是常用的评价观测值与真实值偏差的方法。RMSE指标的计算公式如下:
RMSE = \sqrt {\left(\sum\limits_{\rm i = 1}^N {[{\boldsymbol{y}}({{\boldsymbol{x}}_{\rm i}}) - {\boldsymbol{\hat y}}({{\boldsymbol{x}}_{\rm i}})} ]^2\right)\Bigg/N} (7) 评价系数 CoD 计算如下:
CoD = - 1 * RMSE (8) (3) 平均绝对误差评价
平均绝对误差与均方误差一样是常用的评价观测值与真实值偏差的方法。MAE指标的计算公式如下:
MAE = \frac{1}{N}\sum\limits_{\rm i = 1}^N {\left| {{\boldsymbol{y}}({{\boldsymbol{x}}_{\rm i}}) - {\boldsymbol{\hat y}}({{\boldsymbol{x}}_{\rm i}})} \right|} (9) 评价系数 CoD 计算如下:
CoD = - 1 * MAE (10) 可以看到,重要度过滤的共同特点是输入训练集{\boldsymbol{\tilde S}}和测试集 {\boldsymbol{\hat S}} ,过滤后筛除样本中重要度低的变量,形成新的样本集合{\boldsymbol{\tilde S'}}。该过程可以使用任意的代理模型进行精度评价,代理模型算法的选择不会造成定性的影响。该过程的实施对最终代理模型构建过程选取的近似方法无关。因此,也可以设计独立的过滤器功能,形成面向服务的功能重要度过滤插件,对代理模型构建之前的样本进行处理。
2 代理模型变量空间取样方法
针对代理模构建过程中变量空间取样问题,可以通过自适应采样,提高代理模型精度,探究性能更佳的加点策略已成为现阶段研究热点。常用的自适应加点准则有:
(1) 最小化代理模型预测准则(MSP)
最小化代理模型预测准则通过优化算法选取代理模型上的最小值点作为新样本点:
\begin{split} & {\min } \;\;\; {{\boldsymbol{\hat y}}({\boldsymbol{x}})} \\ & {s.t.} \;\;\; {{\boldsymbol{x}} \in [x_{\rm L}, x_{\rm U}]} \end{split} (11) 式中:\hat y(x)为目标函数的代理模型;x_{\rm L}, x_{\rm U}为自变量x的上下界向量,优化问题所得的最优值点x_{\rm new}即为新样本点。最小化代理模型预测准则对凸问题寻优效率较高,通常配合其它方法使用。
(2) 均方差准则(MSE)
均方差准则选取全局搜索模型预测误差最大的点作为新样本点:
\begin{split} & {\max } \;\;\; {s({\boldsymbol{x}})}\\ & {s.t.} \;\;\;{{\boldsymbol{x}} \in [x_{\rm L}, x_{\rm U}]} \end{split} (12) 式中,s(x)为样本预测值的标准差,该准则适用于能够计算出预测误差的模型。
(3) 改善期望准则(EI)
改善期望准则选取对代理模型期望值改进最大的点作为新样本点:
\begin{split} & {\max } \;\;\; {{\text{EI}}({\boldsymbol{x}})} \\ & {s.t.} \;\;\;{\boldsymbol{x} \in {\text{[}}x_{\rm L}, x_{\rm U}]} \end{split} (13) 式中,期望 {EI} 的计算如下:
\begin{split} {EI} ({\boldsymbol{x}}) =& (\min ({\boldsymbol{y}}) - {\boldsymbol{\hat y}}({\boldsymbol{x}}))\varPhi \left(\frac{{\min ({\boldsymbol{y}}) - {\boldsymbol{\hat y}}({\boldsymbol{x}})}}{{s({\boldsymbol{x}})}}\right) +\\& s({\boldsymbol{x}})\phi \left(\frac{{\min ({\boldsymbol{y}}) - {\boldsymbol{\hat y}}({\boldsymbol{x}})}}{{s({\boldsymbol{x}})}}\right) \end{split} (14) 式中: \min ({\boldsymbol{y}}) 为样本点中的最小值,假设模型预测服从均值为 {\boldsymbol{\hat y}}({\boldsymbol{x}}) 标准差为 s({\boldsymbol{x}}) 的正态分布;\varPhi 和\phi 分别为标准正态分布累积分布函数和标准正态分布概率密度函数。
(4) 泰森图解法(Voronoi)准则
泰森图解法[26]对设计空间进行区域划分,然后对每个区域进行误差验证,选择误差最大的区域中距离心最远的点作为新样本点,其中泰森多边形区域可以定义为:
\begin{split} & {dom( {{{\boldsymbol{x}}_{\rm i}},{{\boldsymbol{x}}_{\rm j}}} ) = \{ {{\boldsymbol{x}} \in {{\boldsymbol{R}}^q}| {\| {{\boldsymbol{x}} - {{\boldsymbol{x}}_{ \rm i}}} \| {\leqslant} \| {{\boldsymbol{x}} - {{\boldsymbol{x}}_{\rm j}}} \|} } \}} \\ & {{C_{\rm i}} = \cap dom( {{{\boldsymbol{x}}_{\rm i}},{{\boldsymbol{x}}_{\rm j}}} )} \end{split} (15) 误差验证使用:
e_{{\mathrm{LOO}}}^i = | {{\boldsymbol{y}}( {{{\boldsymbol{x}}^i}} ) - {\boldsymbol{\hat y}}( {{{\boldsymbol{x}}^i}} )} | (16) 新样本点选取规则为:
{\boldsymbol{x}}_{{\mathrm{new}}}^i = \max ( {\| {{\boldsymbol{x}}_{{\mathrm{rand}}}^i - {{\boldsymbol{x}}_{\rm i}}} \|} ) (17) 从自适应方法中可以看到,自适过程的共同特点是利用已有代理模型进行计算,通过准则判断生成下一个样本点 {{\boldsymbol{x}}_{\rm new}} ,重新构建代理模型,直到代理模型精度达到要求。该过程不会拆分已有代理模型构造过程,可以充分使用任意的代理模型功能。因此,自适应过程也可以设计独立的服务功能,形成面向服务的功能插件,与现有的多种代理模型算法相结合。
3 最优预测自适应代理模型架构
SiPESC面向插件服务式的开放式软件平台中,使用“模型”+“算法”+“参数”的设计模式已经集成了多种代理模型,包括响应面、径向基函数、Kriging、正交多项式等[27]。本文利用已有的代理模型,将参数变量过滤和自适应取样方法提炼为服务,设计了最优预测自适应代理模型算法架构,并设计实现相关扩展的插件。这样,工程师可以通过简单快速的方式实现最优预测自适应代理模型的构建。
其中,最优预测过程包含变量筛选、代理模型种类自动选择、自适应代理模型样本增加三项技术,工程软件的设计过程需要对三项任务封装,简化调用流程,降低工程师使用难度。本文中通过对三项功能接口进行抽象,设计相关的功能服务,实现一体化自动化的调用流程。
最优预测的三项技术中,为了添加更多的变量筛选方法,利用未来添加的代理模型、实现更多的自适应代理模型样本添加方式。本文使用软件工程中的全局管理设计模式和工厂设计模式实现软件的通用架构,满足对扩展的需求。
3.1 代理模型的构建
SiPESC已有的代理模型功能任务流程如图1所示,使用Python脚本调用的流程如所示。流程中调用表示问题事件的“计算盒子”,自动完成拉丁方取样,生成Kriging代理模型。
已有代理模型通过Python调用的流程如图2所示,流程中第1行~第4行创建全局的管理器;第6行~第17行进行“问题事件”的表示,此处使用Python实现了一个函数的计算过程作为“问题事件”,该过程可以替换为任意的工程仿真计算过程,如调用Nastran进行结构CAE模拟、调用CFX进行流体模拟、调用CODE-V进行光学模拟等;第19行~第37行为试验设计取样过程,此处选用了最优拉丁方进行试验设计取样;第39行~第49行为生成代理模型的过程,此处选用了Kriging生成代理模型,输出的结果为Python脚本显式表示的Kriging代理模型对应的数学函数关系。
以上代理模型架构中,已经将试验设计和代理模型进行封装,使用过程中创建近似模型和代理模型的管理器,选择相关的算法参数即可实现代理模型构建任务。实现最优预测自适应代理模型任务可以充分利用以上架构,需要设计独立的变量过滤服务功能,设计独立的自适应加点更新代理模型的服务,设计完成任务流程的设计器。
3.2 最优预测自适应代理模型任务流程
本文使用第1节变量过滤方法和第2节中自适应取样方法的最优预测自适代理模型任务流程如图3所示。该流程中将任务分为以下步骤:
Step.1 表示问题事件,定义计算过程或者其它有输入输出“黑箱子”进行表示。
Step.2 相关性变量过滤,使用第1节中相关性过滤原理进行过滤,首先采用最优拉丁方进行一定量的取样,计算样本数据中变量的相关性。删除输入变量中相关性低的变量。此过程中会反复调用问题事件计算过程。
Step.3 重要度变量过滤,使用第1节中重要度过滤原理进行过滤,首先使用上一步过滤后的变量,然后构建Kriging代理模型,最后使用构建的Kriging模型结合重要度评价系数删除重要度低的变量。此过程中会反复调用问题事件计算过程。
Step.4 代理模型算法选择,该过程使用上一步过滤后的变量,再次最优拉丁方进行采样,使用SiPESC已有的算法分别构建代理模型,对所构建的代理模型使用第2节中的精度评价标准进行评价,选择精度高的代理模型算法所构建的代理模型进入下一步工作。
Step.5 自适应加点提高精度,该过程使用上步构建好的代理项目,逐步增加取样直到满足精度要求或者加点的数量上限,其中基点的策略使用第2节中提供的加点准则。
3.3 算法架构的搭建及功能扩展
明确最优预测自适应代理模型任务流程后,设计通用架构的工作的关键是:依据面向服务原则,将算法流程中的各部分解耦,合理地抽象服务接口。
本文中,已经任务流程,设计相关性变量过滤服务,由CorrelationFilter类提供,设计重要度变量过滤服务,由SignificanceFilter类提供,设计代理算法选择服务,由ApproximateDesignSelector类实现,设计自适应取样服务,由AdaptiveMethod提供,设计调用以上服务实现整个流程的设计器,由AMOPDesinger类实现。以上各项服务通过定义的服务接口访问,具体的过滤方法、自适应加点准则通过集成服务接口的扩展实现,底层使用C++智能指针和多态实现。
抽象服务的接口的基础上,具体的过滤方法、自适应加点准则功能服务都通过全局管理器注册管理,管理器的方法包含查询、注册和注销。以CorrelationFilter相关性过滤服务为例,设计相应的管理器CorrelationFilterManager进行管理。
接口中:registerCorrelationFilter负责注册工作;createCorrelationFilter负责依据过滤器类型创建实现具体功能的SignificanceFilter过滤服务;getCorrelationFilterTypeList提供类型查询。扩展过程中,以皮尔逊积矩相关系数过滤服务为例,实现相关功能扩展PearsonProductCorrelationFilter继承SignificanceFilter过滤服务,注册到全局管理者CorrelationFilterManager的对象中。
此外,本文中架构中设计实现了重要度过滤的管理者SignificanceFilterManger,设计实现了自适应取样的管理者AdaptiveMethodManager。
3.4 算法任务的实现
在设计的两个过滤方法服务扩展、代理模型选择服务扩展和自适应取样服务扩展的基础上,需要对算法的任务流程进行封装,以实现任务流程的简化。本文设计最优预测自适应代理模型设计器AMOPDesinger对整个任务流程进行封装,设计器的方法如下:
通过以上接口可实现整个任务流程的调用,setCorrelationFilterType用于设置相关性过滤器类型,setSignificanceFilterType用于设置重要度过滤器类型,setSamplingCalculationBox用于设置问题事件的计算过程,setFilterSamplingCount用于设置相关性过滤和重要度过滤过程中调用问题事件取样的样本数,getExpressions用于获取最后代理模型生成数学函数关系对应的Python脚本表达式,getCalculationBox用于获取结果中直接计算的计算器,setMaxAdaptiveFillingCount用于设置自适应取样过程中的取样个数上限。
整个最优预测自适应代理模型构建过程会被封装在getExpressions和getCalculationBox之前,当二者之一被调用时,会通过预先完成整个任务流程,整个任务流程精简后版本的C++封装过程如图5所示。封装代码主要分为8个部分,配有简要说明,逻辑过程与图3中的各项任务流程相对应。 封装后可极大简化使用工作量。
3.5 算法架构的使用
最优预测自适应代理模型通用架构的各项服务实现并通过C++封装后,可以通过Python脚本调用。使用Python脚本调用试流程如图6所示,该过程中第1行~第4行创建全局管理对象,第6行~第17行对问题事件进行表示,图中表示的为数值算例,使用Python计算器的形式,若构建工程算例,则可使用如ANSYS、Abaqus的仿真软件的集成组件来进行构建;第19行~第36行设置最优预测自适应代理模型的相关参数,分别设置相关性过滤器、重要度过滤器的具体方法和筛选方式,并设置自适应取样方法以及迭代停止条件,并调用获取最后生成的代理模型。
可以看到,封装后的流程充分发挥了Python脚本作任务处理的优势,极大的简化了使用者的工作量实现整个流程的工作量。使用者仅需要创建设计器,将选择的算法、参数传递给设计器,架构中调用图5所封装的流程,完成整个任务。使用此工具实现的数值算例在第4节中给出。
4 数值算例
4.1 基于Rosenbrock function测试函数
\begin{split} f({\boldsymbol{x}}) = &100*( {{x_2} - x_1^2} ) + {( {1 - {x_1}} )^2} +\\& \sum\limits_{k = 3}^{50} {0.001*{x_{\rm k}}} ,\;\;\;{x_{\rm k = 1\sim 50}} \in [0,1] \end{split} (18) 该测试函数由Rosenbrock function增加小量获得,变量维度为50。初始样本为100,使用最优拉丁方采样,使用皮尔逊积矩相关系数进行相关性过滤;然后将样本分为两组,每组50个样本点,取第一组样本作为训练集,第二组样本点为测试集,使用决定系数评价进行重要度过滤。
相关性过滤器取阈值0.2,共筛选出[{x_1},{x_2},{x_3},{x_{21}},{x_{24}}]五个变量,其相关系数分别为[0.63,0.60,0.21,0.27,0.20]。重要度过滤器取阈值为0.09,筛选出[{x_1},{x_2}]两个变量,其重要系数为[1.39,0.99]。经两重过滤器过滤,成功筛选出目标变量。
变量筛选完成后,通过训练集分别拟合Kriging代理模型和RBF代理模型,使用测试集对代理模型进行测试,评价指标选择均方误差,指标值分别为229.5与7.2,说明Kriging代理模型对此类问题拟合精度低于RBF代理模型,因此选择RBF作为代理模型算法。
构建代理模型过程中,使用最优拉丁方采样,设置初始取样个数为20,自适应加点方法采用泰森图解法,设置自适应加点上限设置为50。
构建的代理模型最终使用10000个样本进行评价,其均方误差值为0.16,代理模型获得较好的精度。
4.2 基于Booth Function测试函数
\begin{split} f({\boldsymbol{x}}) = &{\left( {{x_1} + 2{x_2} - 7} \right)^2} + {\left( {2{x_1} + {x_2} - 5} \right)^2} + \\& \sum\limits_{k = 3}^{100} {0.001*{x_{\rm k}}} ,\;\;{x_{\rm k = 1\sim 100}} \in [ - 10,10] \end{split} (19) 该测试函数由Booth Function增加小量获得,变量维度为100。使用最优拉丁方采样取400初始样本。使用斯皮尔曼等级相关系数进行相关性过滤,然后将样本分为两组,每组200个样本点,取第一组样本点为训练集,第二组样本点为测试集,使用决定系数评价进行重要度过滤
相关性过滤器取阈值为0.1,共筛选出[{x_1},{x_2},{x_6},{x_{18}},{x_{58}},{x_{66}},{x_{79}},{x_{83}},{x_{84}},{x_{93}}]十个变量,其相关系数分别为[0.45, 0.49, 0.14, 0.14, 0.13, 0.12, 0.14, 0.15, 0.10]。重要度过滤器取阈值为0.09,筛选出[{x_1},{x_2}]两个变量,其重要系数为[0.947,0.923]。经两重过滤器过滤,成功筛选出目标变量。
变量筛选完成后,通过训练集分别拟合Kriging代理模型和RBF代理模型,使用测试集对代理模型进行测试,评价指标选择决定系数,其指标值分别为0.16与0.99,说明Kriging代理模型对此类问题拟合精度太差,故选择RBF代理模型作为后续流程所使用模型。
构建代理模型过程中,使用最优拉丁方采样,设置初始取样个数为50,自适应加点方法采用泰森图解法,设置自适应加点上限设置为50。
构建的代理模型最终使用10000个样本进行评价,其决定系数为0.999,代理模型获得较好的精度。
4.3 Easom函数
\begin{split} y = &- \cos ({x_1})\cos ({x_2})\exp ( - ({({x_1} - \pi )^2} +\\& {({x_2} - \pi )^2})),{\text{ }}{x_1},{x_2} \in [0,7] \end{split} (20) 该函数为单谷函数,取初始样本为10,使用第2节介绍的四种自适应采样方法进行加点,达到总样本数为40。
图7为代理模型精度收敛曲线,初始时有取采样较少导致代理模型误差较大,随着采样点的增多,精度逐渐提高,其中MSP方法由于方法特殊,会出现加点重合的现象,导致在第十一个点往后拟合精度出现波动及下降;MSE方法倾向于全局边缘加点,所以虽然最终收敛但收敛于较高位置;EI方法在第12个、18个、21个点训练中,模型拟合效果不佳,有较大精度误差,但随着迭代进行,精度还是逐渐收敛,说明该算法鲁棒性较好;Voronoi方法在第七个点出现波动,但随着迭代进行,精度稳步收敛,未再出现较大波动,说明该算法鲁棒性较好。
4.4 航天薄壁柱壳结构
航天薄壁柱壳结构因其轻质、高强度、高可靠性和易加工性等优势被广泛应用于航天装备中。其基本原理是采用环形或者其它形状的薄壁柱体,获取较好的体积重量比和刚度比。航天薄壁柱壳结构的可靠性优化设计需要考虑许多不同的设计变量,如材料属性、壳体壁厚、支撑条件等。随着结构规模和复杂度的增加,设计变量的数量也会增加,这会使整个优化过程的计算量急剧增加,增加了优化设计的难度。因此,针对航天薄壁柱壳结构构建高精度的代理模型具有重要的意义。
本算例中,依据典型加筋壳结构原型设计航天薄壁柱壳结构如图7所示,结构由圆柱形外壳、横向及纵向加筋等结构组成,模型设计参数为66个,包括航天薄壁柱壳结构中尺寸、厚度、长度、位置、加筋截面参数、材料属性、集中点质量等。
模型首先对66个参数进行参数化建模,采用python语言编写脚本在ABAQUS中实现动特性计算,分析前二十阶模态结果并在SiPESC软件中进行最优预测自适应代理模型流程运行。
本文选择四阶模态结果作为响应。该工程问题复杂性强,初始变量较多。相关性过滤选择皮尔逊积矩相关系数,重要度过滤选择决定系数,训练样本数量为1000,测试样本数量为1000,过滤后获得的变量为:外壳直径D、外壳厚度T。构建代理模型过程中,程序通过决定系数选择了RBF代理模型算法。设置泰森图解法作为加点准则,由于筛选得到的变量较少,设置初始采样点10个,自适应取样加点上限为30。
对最终获得的代理模型进行精度评价,选取50组样本作为测试集。其RMSE指标为0.01,满足工程精度需求。
5 结论
本文通过对代理模型构建过程变量筛选技术和自适取样技术的分析,实现了一种最优预测自适应代理模型搭建一体化和自动化的工程设计软件构架,提高了工程问题中代理模型搭建过程变量筛选、算法选择、样本选择的效率。在此基础上,实现了基于皮尔逊积矩、斯皮尔曼等级的变量相关性过滤,基于决定系数、均方误差的重要度过滤,以及最小化代理模型预测准则、均方差准则、改善期望准则、泰森图解法准则的自适取样功能。数值示例验证了本文架构基础上所研发软件的实用性。将本文实现的软件功能应用到代理模型构建过程中,可以有效提高变量选择和算法选择效率,同时扩展已有代理模型和其它变量筛选和自适应取样方法,为工程模拟、可靠性分析、设计优化、数字孪生、快速显示等工作提供了非常实用的工具。
-
-
[1] 吕利叶, 鲁玉军, 王硕, 等. 代理模型技术及其应用: 现状与展望[J]. 机械工程学报, 2024, 60(3): 254 − 281. LV Liye, LU Yujun, WANG Shuo, et al. Survey and prospect of surrogate model technique and application [J]. Journal of Mechanical Engineering, 2024, 60(3): 254 − 281. (in Chinese)
[2] 杜尊峰, 樊涛, 赵亚琦, 等. 基于多核SVR集成模型与主动学习的结构可靠性分析方法[J/OL]. 工程力学, 2024, DOI: 10.6052/j.issn.1000-4750.2024.01.0060. DU Zunfeng, FAN Tao, ZHAO Yaqi, et al. Structural reliability analysis method based on multi-kernel SVR ensemble model with active learning [J/OL]. Engineering Mechanics, 2024, DOI: 10.6052/j.issn.1000-4750.2024.01.0060. (in Chinese)
[3] 王力东, 付岱林, 卜秀孟, 等. 基于自适应代理模型的桥梁风屏障参数多目标优化方法[J/OL]. 工程力学, DOI: 10.6052/j.issn.1000-4750.2024.02.0108. WANG Lidong, FU Dailin, BU Xiumeng, et al. Multi-objective optimization method for bridge wind barrier parameters based on adaptive surrogate model [J/OL]. Engineering Mechanics, 2024, DOI: 10.6052/j.issn.1000-4750.2024.02.0108. (in Chinese)
[4] 吴苏静, 陈金盛, 张舒宁, 等. RC框架连续倒塌抗力优化的混合设计算法研究[J\OL]. 工程力学, DOI: 10.6052/j.issn.1000-4750.2023.09.0712. WU Sujing, CHEN Jinsheng, ZHANG Shuning, et al. Study on the hybrid design method for optimizing the progressive collapse resistance of RC frame structures [J/OL]. Engineering Mechanics, DOI: 10.6052/j.issn.1000-4750.2023.09.0712. (in Chinese)
[5] WANG Z H, ALMEIDA J H S JR, ST-PIERRE L, et al. Reliability-based buckling optimization with an accelerated Kriging metamodel for filament-wound variable angle tow composite cylinders [J]. Composite Structures, 2020, 254: 112821. doi: 10.1016/j.compstruct.2020.112821
[6] LEBENSZTAJN L, MARRETTO C A R, COSTA M C, et al. Kriging: A useful tool for electromagnetic device optimization [J]. IEEE Transactions on Magnetics, 2004, 40(2): 1196 − 1199. doi: 10.1109/TMAG.2004.824542
[7] LI B G, CAO J, LIU W X, et al. Geostatistical analysis and kriging of Hexachlorocyclohexane residues in topsoil from Tianjin, China [J]. Environmental Pollution, 2006, 142(3): 567 − 575. doi: 10.1016/j.envpol.2005.10.039
[8] 董青, 陈钰浩, 刘永刚, 等. 基于优化加点代理模型的桥架结构疲劳寿命预测方法[J]. 机械强度, 2023, 45(3): 729 − 742. DONG Qing, CHEN Yuhao, LIU Yonggang, et al. Fatigue life prediction method of bridge structure based on optimized additive point agent model [J]. Journal of Mechanical Strength, 2023, 45(3): 729 − 742. (in Chinese)
[9] GUTIÉRREZ-PRIETO Á, DE ICAZA-HERRERA M, LOSKE A M, et al. Kriging model to study the dynamics of a bubble subjected to tandem shock waves as used in biomedical applications [J]. Ultrasonics, 2019, 91: 10 − 18. doi: 10.1016/j.ultras.2018.07.005
[10] 顾学荣, 刘硕士, 杨思宇. 基于并行EGO和代理模型辅助的多参数优化方法研究[J]. 化工学报, 2023, 74(3): 1205 − 1215. doi: 10.11949/0438-1157.20221345 GU Xuerong, LIU Shuoshi, YANG Siyu. Research on multi-parameter optimization method based on parallel EGO and surrogate-assisted model [J]. CIESC Journal, 2023, 74(3): 1205 − 1215. (in Chinese) doi: 10.11949/0438-1157.20221345
[11] ALLAIRE D, WILLCOX K. Surrogate modeling for uncertainty assessment with application to aviation environmental system models [J]. AIAA Journal, 2010, 48(8): 1791 − 1803. doi: 10.2514/1.J050247
[12] TIAN J, HOU M D, BIAN H L, et al. Variable surrogate model-based particle swarm optimization for high-dimensional expensive problems [J]. Complex & Intelligent Systems, 2023, 9(4): 3887 − 3935. doi: 10.1007/s40747-022-00910-7
[13] 杨鸽, 范振东, 张联宇, 等. 基于响应空间子域概率配点的重力坝分析代理模型与系统可靠度分析方法[J/OL]. 工程力学, 2024. DOI: 10.6052/j.issn.1000-4750.2024.01.0101. YANG Ge, FAN Zhendong, ZHANG Lianyu, et al. Collocation point selection within subsets of response probability space for surrogate modeling in gravity dam analysis and system reliability analysis [J/OL]. Engineering Mechanics, 2024. DOI: 10.6052/j.issn.1000-4750.2024.01.0101 (in Chinese)
[14] LEE K, CHO H, LEE I. Variable selection using Gaussian process regression-based metrics for high-dimensional model approximation with limited data [J]. Structural and Multidisciplinary Optimization, 2019, 59(5): 1439 − 1454. doi: 10.1007/s00158-018-2137-6
[15] MAI H T, LEE J, KANG J, et al. An improved blind kriging surrogate model for design optimization problems [J]. Mathematics, 2022, 10(16): 2906. doi: 10.3390/math10162906
[16] 张人会, 刘锋, 陈学炳, 等. 基于动态RBF代理模型与NSGA-Ⅱ算法的离心泵叶轮优化设计[J]. 排灌机械工程学报, 2022, 40(7): 674 − 679. ZHANG Renhui, LIU Feng, CHEN Xuebing, et al. Optimization design of centrifugal pump impeller based on dynamic RBF surrogate model and NSGA-II genetic algorithm [J]. Journal of Drainage and Irrigation Machinery Engineering, 2022, 40(7): 674 − 679. (in Chinese)
[17] 刘峰, 王萌, 田震, 等. 基于响应面并行子空间设计的载人潜水器优化[J]. 哈尔滨工程大学学报, 2023, 44(5): 734 − 742. doi: 10.11990/jheu.202109017 LIU Feng, WANG Meng, TIAN Zhen, et al. Optimization of manned submersibles based on the concurrent subspace design of response surface [J]. Journal of Harbin Engineering University, 2023, 44(5): 734 − 742. (in Chinese) doi: 10.11990/jheu.202109017
[18] JIN R C, CHEN W, SUDJIANTO A. An efficient algorithm for constructing optimal design of computer experiments [J]. Journal of Statistical Planning and Inference, 2005, 134(1): 268 − 287. doi: 10.1016/j.jspi.2004.02.014
[19] 郭文华, 丁宇航, 赵大亮, 等. 基于正交试验的大直径盾构下穿高铁桥梁的加固措施优化设计[J]. 中南大学学报(自然科学版), 2023, 54(11): 4481 − 4492. GUO Wenhua, DING Yuhang, ZHAO Daliang, et al. Optimization design of reinforcement measures for high-speed railway bridges with large diameter shield tunneling based on orthogonal test [J]. Journal of Central South University (Science and Technology), 2023, 54(11): 4481 − 4492. (in Chinese)
[20] 李宁, 张孝航. 基于重点区域采样深度神经网络代理模型的可靠性分析方法[J/OL]. 工程力学, 2024. DOI: 10.6052/j.issn.1000-4750.2023.09.0719. LI Ning, ZHANG Xiaohang. Structural reliability analysis method based on key region-sampling and deep neural network-surrogate model [J/OL]. Engineering Mechanics, 2024. DOI: 10.6052/j.issn.1000-4750.2023.09.0719. (in Chinese)
[21] 李正良, 彭思思, 王涛. 基于混合加点准则的代理模型优化设计方法[J]. 工程力学, 2022, 39(1): 27 − 33. doi: 10.6052/j.issn.1000-4750.2020.12.0925 LI Zhengliang, PENG Sisi, WANG Tao. A surrogate-based optimization design method based on hybrid infill sampling criterion [J]. Engineering Mechanics, 2022, 39(1): 27 − 33. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.12.0925
[22] 林东方, 姚宜斌, 郑敦勇, 等. 利用均方误差相对变化规律确定正则化参数及其在PolInSAR测量反演中的应用[J]. 测绘学报, 2023, 52(9): 1480 − 1491. LIN Dongfang, YAO Yibin, ZHENG Dunyong, et al. Regularization parameter determination method based on MSE relative variation rule and its application in PolInSAR surveying inversion [J]. Acta Geodaetica et Cartographica Sinica, 2023, 52(9): 1480 − 1491. (in Chinese)
[23] 韩忠华. Kriging模型及代理优化算法研究进展[J]. 航空学报, 2016, 37(11): 3197 − 3225. HAN Zhonghua. Kriging surrogate model and its application to design optimization: A review of recent progress [J]. Acta Aeronautica et Astronautica Sinica, 2016, 37(11): 3197 − 3225. (in Chinese)
[24] JONES D R. A taxonomy of global optimization methods based on response surfaces [J]. Journal of Global Optimization, 2001, 21(4): 345 − 383. doi: 10.1023/A:1012771025575
[25] JONES D R, SCHONLAU M, WELCH W J. Efficient global optimization of expensive black-box functions [J]. Journal of Global Optimization, 1998, 13(4): 455 − 492. doi: 10.1023/A:1008306431147
[26] XU S L, LIU H T, WANG X F, et al. A robust error-pursuing sequential sampling approach for global metamodeling based on Voronoi diagram and cross validation [J]. Journal of Mechanical Design, 2014, 136(7): 071009. doi: 10.1115/1.4027161
[27] 李超, 李云鹏, 张盛, 等. 基于SiPESC通用试验设计和代理模型算法构架[J]. 计算力学学报, 2016, 33(5): 779 − 784. doi: 10.7511/jslx201605019 LI Chao, LI Yunpeng, ZHANG Sheng, et al. Algorithmic framework for experimental design and surrogate model based on SiPESC [J]. Chinese Journal of Computational Mechanics, 2016, 33(5): 779 − 784. (in Chinese) doi: 10.7511/jslx201605019