用算法训练一面墙,为我们遮风挡雨
2021-05-22 20:50

用算法训练一面墙,为我们遮风挡雨

本文来自微信公众号:中国工程院院刊(ID:CAE-Engineering),原文标题:《前沿研究丨高层建筑抗风智能幕墙》,本文选自中国工程院院刊《Engineering》2020年第12期,作者:丁菲,  Ahsan Kareem,题图来自视觉中国,迪拜高楼群


城市化导致人口不断向城市中心转移,高层建筑蓬勃发展,由于高层建筑物体型细长,类似于大跨度桥梁,属于风敏感结构,会与其所处风场形成复杂的相互作用,因此,建筑的外部形状对确定最终风荷载强度起着重要作用。为此,在高层建筑的设计中,建筑工程师应从何处着手,在确保建筑安全性、可用性、适居性基础上,寻找最高效、最经济的设计方案?


中国工程院院刊《Engineering》刊发《高层建筑抗风智能幕墙》,指出随着计算设计、人工智能、传感和传动以及网络物理基础设施的飞速发展,现在是探索未来建筑拓扑、利用动态立面主动变换轮廓来应对风环境变化的最好时机。文章以台北101和哈利法塔的外形设计为例,指出了气动外形修正通过修改建筑物的外观设计在减小风荷载和风致建筑物响应方面有很好的应用前景。


文章提出,具有动态立面的建筑是一个能适应城市高楼林立复杂风环境变化的建筑,通过将传感、计算、传动装置和工程信息学融合在一起的信息物理系统实现建筑形状的自主动态变形,最大限度减弱动态风荷载激励,并有望通过利用计算设计的迅速发展,推动高层建筑设计从传统静态立面转变为动态立面。


一、前言


世界范围的城市化导致人口向人口密集的城市中心转移。这也是高层建筑蓬勃发展的原因之一,而高层建筑在恶劣天气下会受到不同程度的影响。尤其是高层建筑物由于体型细长,属于风敏感结构,更容易受到风的影响。


在高层建筑的设计中,建筑工程师面临着寻找最高效、最经济的设计方案的挑战,同时他们还要确保建筑安全性、设计功能的可用性以及整个设计生命周期中使用者的适居性。


为了满足上述需求,人们通过采用气动找形,安装辅助阻尼装置或选择具有带式桁架、支腿桁架或巨型柱的有效建筑系统,在减轻高层建筑的风致运动方面取得了重大研究进展。在所有这些方法中,通过修改建筑物的外型以减弱主导风荷载强度的气动外形修正的方法前景最为广阔,这种方法在台北101和哈利法塔等建筑物的实际设计中已经得到体现。


当前气动外形修正通过对有限的候选建筑形式进行风洞测试来评估其空气动力学性能,然后选择性能最佳的几何轮廓供设计使用。随着计算领域的进步,就建筑设计而言,计算设计已成为一种强大的设计范例。常规设计实践依赖于昂贵且通常耗时的风洞实验,与之相比,开发用于气动外形修正的计算平台有望提供经济且美观的设计,同时也能深入探究气动设计空间。在过去的几年中,关于高层建筑外形优化已经进行了一些基础研究,其中融合了机器学习技术的计算流体动力学(computational fluid dynamics, CFD),能够在建筑初始设计阶段捕捉到几何修改带来的气动性能提高。


城市布局很复杂,除了单独建筑物上作用的荷载外,建筑物通常还会受到城市空气动力学效应影响,其表现为受到周围的高层建筑群风环境干扰产生的不利荷载影响。例如,当飓风艾克在2008年经过休斯顿市中心时,两个相邻建筑物之间由于干扰效应意外形成了局部涡流,损毁了大量建筑外层材料和玻璃。这是城市空气动力学作用的结果,由于风向和建筑物布局在某些特殊组合下增大了风荷载,从而造成了这些不利影响。而在建筑物的设计中无法预料到这些特殊工况。


就这点而言,仅在初步设计阶段考虑上述静态气动外形修正可能不足以面对不可预测的极端风环境挑战。类比于可操控的飞机变形翼,下一代高层建筑可以采用根据其周围流体环境而变化的结构形状。为了建设未来更具适应力的城市,需要高层建筑能够积极响应变化的环境条件。赋予建筑人工智能是人们建设未来智慧城市梦寐以求的目标。


智能建筑可以结合传感、传动和信号处理几个要素从而顺利地改变建筑形式。受到鸟类生物力学的启发,即它们可以通过在飞行中改变其外形来提高在变化环境中的空中飞行能力,未来的高层建筑可以改变其设计外形以符合复杂且不断变化的城市风环境的要求。涉及智能结构系统的早期创新工程实践可以追溯到莱特兄弟(Wright Brothers)进行的变形机翼设计。


后来,该技术已被成功应用于自适应空间或海洋建筑的设计,其在使用寿命期限内可切换功能,同时移动机器人设计也采用该技术,以实现对其机械结构的变形控制。诸如此类,不胜枚举。材料科学、电气系统和计算机科学学科的快速发展正在推动智能土木建筑的前沿设计。作为应用示例,阿布扎比的Al-Bahr塔采用了动态幕墙遮阳系统,该系统能够根据太阳的移动自主做出反应(图 1)


图1 Al-Bahr塔的动态遮阳系统。来自参考文献并获得Creative Commons Attribution License CC BY 4.0, 2015许可


对于能够主动响应动态载荷如风荷载的智能建筑而言,阻碍其设计的一个主要挑战是变形系统附件必须在不影响抗载荷系统稳定性的情况下稳健运行。动态立面设计的复杂性要求人们对建筑和维护成本进行更多的考虑,这将给自动变形结构的设计带来挑战。通过最小化风荷载效应,变形系统有望降低与建筑系统和建筑物围护结构有关的成本。


此外,动态立面带来的美学吸引力将使这些建筑成为现代城市的标志,并在多风天气环境下吸引游客的注意。此外,在传感分析、人工智能(artificial intelligence, AI)和控制理论方面,将建筑的实时信息传达给实时控制系统,从而有效地响应不断变化的外部环境仍存在技术挑战。


尽管土木建筑的自主变形还处于起步阶段,但我们目前的试点研究可以为实现这一概念铺平道路。在这项研究中,我们提出了一种基于信息物理的传感控制和传动系统,用于建筑物外墙的自主变形。


本文的内容如下:在第2节中,我们将首先回顾利用CFD和机器学习技术进行的静态气动外形修正方法;第3节介绍了设计可变形结构的嵌入传感和传动系统以及控制算法的技术问题;在第2节所介绍的气动外形修正的静态计算机辅助设计的基础上,第4节引入了用于自主变形建筑的信息物理设计平台;第5节是结语。


二、气动外形修正


高层建筑和大跨度桥梁会与其所处风场形成复杂的相互作用,其中建筑的外部形状对确定最终风荷载强度起着重要作用。


根据文献,气动外形修正包括建筑物的横截面角部处理、横截面沿高度变化、扭转等修正建筑外形的措施,在减小风荷载强度方面前景广阔。例如,台北101大楼在其最终设计阶段考虑了包括双凹角在内的一系列截面拐角的修改,与使用初始的方形截面设计相比,双凹角设计使风致基底弯矩降低了25%。


尽管当前的设计实践,即通过风洞测试从有限的建筑物外形中进行选择,是提供可行外形设计的有效方法,但其所需的成本和时间仍然很高,这主要是由于使用风洞测试的程序昂贵且费时。此外,在这种方法中,由于风洞实验仅测试了有限的建筑外形,因此仍有很大的外形设计空间未进行探索。这导致传统的外形比新颖的更受青睐。


如今,随着数字革命的迅速发展和计算设计的普遍兴起,人们可以设计新的方法穿行于建筑外形设计空间的迷宫,否则,设计空间将只能受限于风洞实验来探索有限的方案。该计算设计平台能够在概念设计阶段全面评估几何修改的有益影响。它充分结合 CFD、随机学、机器学习等多种方法,可以准确评估建筑上的风荷载,并以可量化的置信度指导外形修正。以下小节概述了最新的气动外形修正方法。


(一)外形优化公式


以建筑物横截面的气动外形修正为例说明利用计算辅助设计的建筑外形优化方案。图2和图3分别概述了问题和原理图。设计目标是寻找最优的空气动力学横截面构造。优化考虑的基础几何形状是带有圆角的正方形横截面。由于明确了4个对称轴,因此可以通过任意两条对称线之间的形状完整描述横截面形状。两条对称线之间由两个独立控制点来定义横截面的几何形状。


据此,将形状优化问题中的设计变量定义为这两个控制点的坐标,约束条件通常用于与建筑学考虑有关的几何要求,包括对称性、最大绝对位移等。在这项研究中,约束函数被定义为两个控制点的最大允许位移。


图2 气动外形优化问题阐述


图3 计算机辅助气动外形优化示意图。DoE(design of experiment):实验设计


大多数建筑物对风呈现出钝体绕流现象,这会形成较大的流动分离区域,并在下游伴随着不稳定的尾流区域,从而产生横风向风振。气动目标函数定义为平均阻力系数和横风向的升力系数的标准偏差。优化目标是最小化这两个空气动力学函数G(q),优化结果为帕累托最优解或帕累托前沿。


为了深入探索气动设计空间,可以通过应用严格的优化算法,如遗传算法来解决优化问题。然而,由于CFD模拟计算量大,且需要在每个优化周期对空气动力学目标进行评估,因此优化过程需要大量的计算机资源,这极大降低了计算机辅助形状设计的可行性。为了解决这个问题,我们引入了代理模型技术作为一种计算成本低廉的模拟器,来模拟计算成本较高的CFD模拟器的响应。


(二)基于代理模型的优化——多保真建模


在涉及计算量大的复杂工程设计问题中,代理模型是一种很有前景的应用工具,它可以为原始问题提供计算上的可取近似。应用代理模型的第一步是实验设计(design of experiment, DoE),实验设计为代理模型的校准生成采样点。常用的代理模型方法包括混沌多项式展开(polynomial chaos expansion, PCE)、高斯过程回归和支持向量回归(support vector regression, SVR)


在这项研究中,通过运行有限的CFD模拟,模拟数据分别用于建立两个空气动力学目标的代理模型,并在优化过程中用于评估空气动力学目标值。


CFD模型可能包含具有不同计算需求的多保真数据源。对于高雷诺数下的钝体周围风的CFD模拟,可以采用低保真模拟,如雷诺平均方程(Reynolds-averaged Navier–Stokes, RANS),也可以采用高保真模拟,如大涡模拟(large eddy simulation, LES)。当前,RANS 是CFD的主力,而随着更多可用的计算资源,LES也越来越具有吸引力。


然而,RANS模型可能会导致显著的建模误差,因为在雷诺平均方法中,湍流的不稳定性被平均化。


因此,有必要融合来自多组CFD数据的信息源,以提高代理模型的预测精度,同时保持计算效率。现代统计学习技术如多保真代理模型是多保真CFD 模拟进行模型校准的强大工具,如图3所示。


在优化阶段,我们使用多保真代理模型来提供设计空间中空气动力学目标的计算估值。优化算法寻找具有最佳空气动力学性能的几何构型,以指导建筑设计。最优解被标注在帕累托前沿,图3中标记蓝色圆圈的一个选定优化解展示了具有倒角的横截面。


由于此项研究提出的数字设计工具是通过使用建筑物的截面模型概念测试开发的,因此它可被进一步扩展到3D高层建筑物,包括各种随着高度而变化的建筑形式,或者在设计目标中引入更精细的指标(如风谱或峰值)。尽管大多数具有对称结构形状和结构系统的细长高层建筑的扭转方向响应都不是重点考虑的关键因素,但考虑到扭转载荷对于不规则及复杂的建筑外形来说可能至关重要,它也将会纳入我们的数字设计框架中。


三、具有动态立面的建筑


由于建筑周围风环境是实时变化的,上述章节介绍的在建筑物概念设计和初步设计阶段使用的气动外形优化策略可能并非在所有情况下都是最优的。为了超越这种静态形状优化,本研究提出了自主动态变形。配备传感器和新型传动装置的高层建筑可以模仿鸟类在飞行过程中做出的变化,调整其外形,以提高在复杂风环境下的空气动力学性能。


要实现这些功能,就需要智能系统对建筑物围护结构的控制。这些智能系统的设计涉及材料科学、计算机科学和机械电子工程的跨学科背景。下面将描述这种智能系统的背景。


(一)变形系统


变形系统就像建筑物的肌肉一样能使其在特定的控制规律下,将轮廓定位到所需的配置中。智能驱动系统可以分为两类:创新型结构材料和响应性机械系统。


智能结构材料可以提供仿生建筑表面,其具有感知环境刺激并根据预设功能而变形。因此,这些材料必须嵌入可编程特性,以允许通过诸如声音、电磁或热学材料等基础物理属性来控制形状的变化。智能材料可以由形状记忆合金(shape memory alloy, SMA)制成, SMA会因其弹性特征而随着温度变化发生变形,压电材料可以在施加电压时重新调整形状,或者磁性材料可以在磁场中发生形状变化。在将这些材料应用于各种工程学科方面已经进行了大量的研究。


例如,为了使飞机机翼变形,压电或SMA可以将电流转换为机械响应,以增强整个飞行条件下的空气动力学性能。图 4显示了一个完全变形的机翼,该机翼是通过将SMA黏合在机翼表面作为传动器而形成的。在周围温度升高时,嵌入分布式形状记忆聚合物传动器的自主太阳能电池板阵列可以实现微膨胀。采用热双金属材料制作的建筑表面能够自遮阳,从而保持室内热舒适性。


建筑设计中自组装可编程材料的三维打印甚至四维打印的进步已经让这些智能材料的制造发生了革命性的变化。


图4 美国国防高级研究计划局(Defense Advanced Research Projects Agency, DARPA)使用SMA驱动的智能机翼。经SAGE Publications, ©2004许可,转载自参考文献


事实上,通过观察动物的功能表面或植物的动态机制,人们受到启发,使用智能材料进行了许多有效的设计。例如,鲨鱼的皮肤在水中游动时具有减阻能力,因为它的真皮细齿或形状像小肋骨的皮肤牙齿与水流在同一条直线时可带来减阻优势。受鲨鱼皮启发的肋状表面的应用包括竞技类泳装、船体和飞机设计。


如图5(a)所示的云杉球果可以作为从植物仿生的一个例子,因为它们可以响应湿度变化。与这一概念类似,图 5(b)中自塑建筑Urbach Tower的设计利用木材的水分变化,通过收缩力产生曲率。如图6(a)所示,韩国主题馆引入了立面系统,可以演变成许多动画图案。建立这种动态立面的灵感来自于植物世界中的移动机制,其满足了建筑师对美学的追求并控制了光线的进入。


图5 仿生设计。(a)不同湿度条件的云杉球果(经Elsevier许可,转载自参考文献,©2017);(b)通过水分变化形成的木塔(摘自参考文献,作者为“ICD/ITKE—University of Stuttgart”)


图6 可变形结构的实际应用。(a)主题馆(经SOMA Architects许可,©2012,转载自参考文献);(b)张拉整体结构体系(转载自参考文献,作者为“Easy K-Kenneth Snelson Robin Capper via Flickr Licence CC BY-NC 2.0”, ©2018);(c)东京巨蛋体育馆(经GNU免费文档许可,转载自参考文献);(d)刚性折纸结构(经作者Dr.Tomohiro Tachi许可,转载自参考文献)


在响应式机械系统中,根据运动学可以进一步区分为两大类:可变形结构(即能够整体变形的分布式无铰结构)和刚性铰接结构(即其中刚性元素通过铰链连接产生相对运动)


可变形结构可以是柔性结构、张拉整体结构和气动结构。柔性结构避免使用铰链且没有齿隙,从而产生了平滑的形状变化,减少了应力集中。由于柔性结构在其挠曲(如其弹性特性)下会发生变形,与刚性链接结构相比,这种类型的结构允许相对较小的变形。张拉整体结构是由受拉或受压的构件组成,以达到荷载平衡。


这些装有传动器的结构可以通过调整其杆件的自应力(增大或减小应力)来改变其形状,如图6(b)所示。


因此,为了响应外部加载条件的变化,新的几何构型可以通过寻找形状的方法来识别,从而有效地重定向负载传输。气动结构可以通过改变气压来调整其形状,不同气压条件可以形成多种形状。它们重量较轻,但变形精度相对较低。图6(c)显示了属于气动结构的东京巨蛋。


另一种刚性链接结构,由于其灵活性而允许大变形或有多种形式的变形,其中包括逐步改变截面的伸缩结构,刚性肋与旋转的节点链接的铰接系统,或折叠面板和旋转杆制造的可折叠结构。人们已经将这些系统用于飞机、航空航天结构和民用结构的变形。


受折纸启发的结构和类剪刀结构已经成为当今可展开结构设计的灵感来源。这个想法来自于古老的折纸艺术形式。可折叠的折纸结构由刚性面板和铰链连接的分段线性表面组成。它们可以由可控的折叠模式在不同的展开程度下,形成各种几何形状,如图7所示的可折叠管设计。


受折纸启发的建筑已经在现实世界中被设计出来,如图6(d)所示,它展示了折纸结构动态的几何形状,以及图1所示的Al-Bahr塔楼的可展开立面。尽管折纸启发的结构尚未在建筑尺度上充分应用,但目前的研究已经为将其用于改变未来民用结构的外部形状打开了一扇门。


图7 折纸管在展开的不同阶段的形状变化


(二)结构控制算法


除了基于材料科学和机械系统的知识设计可靠的变形传动系统所面临的挑战外,自主变形系统在通过控制算法发送信号以进行实时变形方面也面临着挑战。为了成功实现智能结构的设计,关键问题在于作为中枢神经系统的控制策略。


开发控制算法的目的是准确处理来自传感系统的瞬时输入,并向传动系统发送命令。如果采用闭环控制系统,则需收集测量值进行反馈控制。简单地说,控制算法的主要组成部分可以包括模型预测、反馈控制和强化学习。


在模型预测中,可以通过最小化所选取的优化目标相关的成本函数,将遗传算法等优化算法应用于预测最佳的建筑物外形。但是,其计算时间通常太长,从而无法处理涉及高维输入和输出的大规模优化问题。


为了克服此问题,由多个处理层组成的深度学习(deep learning, DL)处理数据对于解决大规模问题更为有效。该技术是机器学习方法的一个分支,由于其能够捕获复杂的数据结构,特别是在高维问题中,所以其在图像处理、目标检测、语音识别和许多其他学科上取得了突破。为了构建多层体系结构,DL涉及正向传播、计算输出分数与期望分数模式之间的测量误差,以及使用梯度信息更新参数的反向传播。


另一种可以用来增强系统预测性能的策略是强化学习(reinforcement learning, RL)。RL代理的出现向设计完全自主的控制系统迈出了重要的一步,这些系统可以与环境交互以学习最优行为。在RL中,系统在给出奖励或惩罚信号中学习如何采取行动。例如,应用于自动驾驶的RL能够规划车辆导航,以避免不利的情况(惩罚),并生成安全的驾驶命令(奖励)


总的来说,这是一个学习范式,学习从状态到行动的最佳映射,以使奖励最大化。深度强化学习结合了DL 和RL代理,包括操作离散动作的深度Q网络(deep Q network, DQN)和在连续操作空间中估计确定性目标策略的深度确定性策略梯度(deep deterministic policy gradient, DDPG)。除了上述自动驾驶技术外,RL还在机器人控制、自然语言处理以及飞机变形的应用中取得了成功。


控制反馈方法也可以与预测模型结合使用,因为它们已被证明可以大大提高系统性能。有一些流行的控制反馈方法,如比例积分微分(proportional-integral-derivative, PID)控制器、模糊控制和模型预测控制(model predictive control, MPC)。例如,PID由积分、比例和微分反馈组成,分别基于对过去、现在和将来的控制误差计算。


这三个组件之间的平衡是通过环路调整实现的。MPC通过最小化量化预测响应和参考响应之间差异的目标函数,利用显式过程模型来预测过程的未来响应。该技术已被用于土木工程应用,如风激高层建筑的加速度反馈控制。可以基于控制系统中它们的性能、调整和易用性等来评估不同的控制器。反馈控制已广泛用于电机驱动、汽车和飞行控制等领域。


四、自主变形结构


如上文所述,变形技术已应用于美学设计或结构的遮阳和通风控制,但尚未应用到针对动态风荷载条件的结构抗风外形设计中。


本节提出了抗风结构自主变形的概念,建筑物的外观能够智能地变形,以抑制城市高层建筑群所产生的动态风荷载激励。将计算与物理过程集成在一起的网络物理系统充分利用在网络化的建筑物轮廓自主变形中。


为了使建筑物可以智能感知周围风环境,建筑物配备了分布式传感器网络来模拟建筑物可感知风场的皮肤。传动装置类似于肌肉,它可以让建筑物将其轮廓定位成目标形状,如扭转变形或转角修改。高性能计算(high-performance computing, HPC)和机器学习技术的进步已被充分利用来设计计算平台,用于智能感应、计算和驱动建筑物变形。


对于自主变形中的技术复杂性和安全问题带来的挑战必须要有充分了解。如今,土木工程、计算科学和许多其他学科的创新将有助于全面实现这一目标。本文提出的信息物理系统分为几个关键部分,将在以下小节中介绍。


(一)传感


传感技术的飞速发展一直在推动其在建筑物动态立面设计中的潜在应用。该技术涉及更广泛的主题,如物联网(Internet of Thing, IoT),其中装配传感器和执行器的对象可以在数字世界中相互连接,用户可以进行通信。IoT已经在许多场景中得到了应用。例如,在运输和物流领域,可以跟踪携带标签和传感器的运输货物,以更新其状态。


IoT平台也可以应用到智慧城市系统的设计中,该系统中可以昼夜监控从分布式无线传感网络收集的城市湿度、温度和光照数据。在结构工程中,无线传感技术和数据采集技术的进步是结构健康监测的关键组成部分。


从传感网络收集与结构的模态参数和物理参数相关的数据,以执行结构状态评估和损伤检测。在哈利法塔的实时结构健康监控中,实施了基于IoT的SmartSync系统,其中传感和数据管理系统通过虚拟电缆连接到系统的主干,并且可以查看和远程管理。在全尺度建筑上, IoT概念将在变形系统中得到应用,因为其管理系统将依赖互联网在传感、计算和执行的本地化模块之间进行连接和通信。


对于变形结构,安装在建筑物中的分布式传感器 [如风速计、应变仪和全球定位系统(global positioning system, GPS)]有助于检测风速、建筑表面风压和建筑物响应,如图8所示。这提供了风环境短期变化的信息。此外,在线获取的气象数据和卫星图像可以作为指导变形的补充知识来源。从网络感测收集的信息用作数据分析的深度神经网络(deep neural network, DNN)的输入知识。因此,通过选择代表周围风环境的关键特征和建筑物信息来融合传感信息是处理变形阶段的关键。


(二)传动


创新的传动系统可以实时地改变建筑到目标外形。例如,可以将铰接机构或智能数字材料(如嵌入有执行器的SMA)连接到建筑立面以进行边角修改。变形结构还可以利用折纸概念,通过使用受控折叠来实现扭曲效果。刚性链接的桁架结构使建筑物可以变形为锥形模式。图8提供了有希望应用于结构变形的候选变形技术示例。


图8 网络物理系统感测控制和传动系统。PC(personal computer):个人计算机


(三)计算


计算算法给结构赋予人工智能,并将传感输入与最终的致动输出连接起来。在本研究中,算法主要包括两个部分:用于预测未来时间步长的最佳建筑形式的预测模型,以及用于闭环控制的控制反馈。为了确定控制策略,根据从分布式传感器网络收集到的数据,采用强化学习代理来预测最佳形状的目标。强化学习中实质上包括两个部分:状态和动作。


如图9所示,代理或者策略在时间步t 观察环境的状态s,并在时间步t+1时生成一个动作与环境交互,并返回瞬时奖励Rt作为反馈。通过观察动作序列,强化学习代理可以根据每个序列对应的累积奖励来优化策略,从而长期学习好的和坏的行为。因此,强化学习代理的目标是最大化长期奖励函数或价值函数(该函数表示的是策略π下未来奖励的预期折现额),以便在每个时间步时得到最优解。


就强化学习在自主变形结构中的应用而言,状态s被定义为外部风环境的感测信息,并且由策略π生成的优化动作代表当前状态s对应的空气动力学上意义良好的建筑形式。例如,如果目标是使阻力系数Cd(t)实时最小化,瞬时奖励方程Rt则可以定义为:



 那么DDPG算法中相应的Q值方程Qπ 可表示为特定策略下未来奖励的预期折现额:



式中,E 表示计算期望的数学运算符,rt =EπRtγ表示时间上的折扣因子,其值通常在0~1范围内。sa分别表示当前状态和动作。我们需要在每个时间步骤通过优化来优化。换句话说,时间t的最优建筑配置会最大化其价值函数。


为了解决这个最大化问题,价值函数可以通过其 Bellman方程写为:



式中,P表示计算概率的数学运算符;s′ 和a′ 分别表示下一个状态和动作。那么,根据式(3),寻找最优Q值函数Qπ的最大化问题可以写成:



最优策略π * 可以由如下公式求得: 




为了训练强化学习代理,本研究选择了3.2节中提到的DDPG作为强化学习代理。使用DDPG的基本原理是它可以将建筑物动态立面的传动输出视为连续的。因此,DDPG可以实现连续空间控制,更适合用于本研究。DDPG算法涉及两个神经网络的训练:演员和评价者。


如图9所示,演员用于从连续动作空间中预测当前时间步的动作。评价者估计当前状态的价值函数。


训练 DDPG时,可以通过蒙特卡洛采样在不断变化的风入口条件下建筑实时变形的流动模拟轨迹来计算评价者价值函数的梯度(图10)。然后,价值函数将能够提供时差(temporal-difference, TD)误差来训练策略。


图9 行动者-评价者结构


图10 训练框架


为了补偿预测值和实际的建筑物响应值之间的误差,在自主变形中引入了控制反馈。在将来的时间步,从感测网络收集的最佳建筑形式上的空气动力等空气动力学指标被用来与预测值做对比,然后计算预测误差,并用预测误差调整最佳建筑形式。


在本研究中,我们使用MPC来实现闭环控制反馈。图8展示了所提出的计算方法的示意图。


(四)计算模型实验


在本节中,我们在计算平台上模拟了所提出的网络物理系统,以证明本研究提出的概念设计。如第3节所介绍,此案例描述了空气动力学形状优化的一个方向,即建筑物横截面形状变化。我们引入了自动变形技术,来实时地重新设计建筑物的横截面,以减少动态风荷载的来源。


我们的目的是:通过主动改变建筑物表面活动幕墙,将建筑物上的阻力最小化。至于用于训练DDPG的数据库,可以从各种保真度的数据源(包括风洞测试、计算模拟、在线数据集以及众包输入)中收集到各种建筑形式的空气动力学信息。


这个共同的、多保真度的数据库将用作训练强化学习的知识库,以实现预测任意建筑外形的空气动力学特性的能力。在本研究中,考虑到数据质量问题,我们仅依赖于高保真CFD模拟(即 LES)来训练策略。


低保真度模拟数据和实验数据的融合将在我们未来的工作中进行研究。在图10中,我们使用了10个epoch,其中每个epoch包含m=10个轨迹,以计算累积奖励或价值函数的期望值。每个轨迹包含100 个采样模拟(T=999),以计算式(1)中的瞬时奖励函数。折扣因子γ设置为0.95。使用Adam优化器来训练演员和评价者,其中学习率为0.001。


值得一提的是,此项研究训练数据数量和epoch数量对强化学习代理进行调参(fine tune)有所不足,因此预测得到的最佳性能的动态建筑形式不够有鲁棒性。为了进一步完善这一概念验证工作,在未来可以利用更多从数值和实验测试中收集的公开数据集来丰富我们的训练数据库,使得DDPG中的神经网络收敛程度更好,并且对传动输出的预测更鲁棒。当前工作的贡献是证明了将强化学习应用于变形建筑物动态外观的可行性。


图11给出了控制算法如何指导变形过程的工作流程示意图。强化学习代理的状态是在接近建筑物的多个点处进行风速测量得到的传感信息。在一个epoch中,在计算域的入口处用数字模拟方法生成了湍流强度为20% 的湍流入口速度的时间序列。


在每个时刻,通过对建筑物表面上的压力数据进行积分来计算与瞬时奖励函数相关的阻力。在本研究中,变形系统是近实时实现的,这是通过选择一个狭窄的移动窗口来平均不断更新的状态和奖励信息来实现的,如图10所示。


窗口大小并非通用的,而是问题特定的。一方面,如果尺寸过小,则噪声会严重影响预测输出。另一方面,较大的尺寸将影响系统实时控制的有效性。另外,应该注意的是,建筑物的感测输入和空气动力学指标可以通过在已有环境中使用风速计、压力传感器和加速度计等进行测量得到。模型的传动输出给出了使阻力系数最小化的最佳建筑物横截面形状的预测。



图11 建筑物横截面变形的控制算法的示意图


基于DDPG,将预测模型由两个经过训练的DNN组成:一个用于预测未来阻力系数如何变化,即评价者中的价值函数;另一个是演员,用于在给定评价者价值函数梯度信息的条件下,优化建筑物的横截面。


传动输出的设计空间代表着控制建筑物横截面外部几何形状的点的容许位移值,如图2所示。神经网络在这个连续的传动设计空间中进行探索并根据训练好的策略的指导寻找最优解。从图11的演员-评价者的输出中可以看出,绿色的轮廓显示了带有倒角的优化几何形状,这是由强化学习代理预测的。另外,为了使横截面变形至预计形状,可以安装SMA驱动器,通过引入温度变化来控制肋板长度。


LES仿真用来验证变形后的建筑物横截面是否为最优解,并且能够直接测量其真实阻力系数。为了进行闭环控制,实验采用了MPC来进一步调整横截面形状,减小测量阻力系数和预测阻力系数之间的差异。


执行 MPC操作后,更新最佳横截面形状,如图11的绿线所示。此形状是所提出的控制系统在本次时间迭代中的最终输出。然后,根据MPC输出,将建筑横截面变形为预估的外形,并与其外部风环境进行交互,以在顺序时间迭代中生成奖励函数。


借助于所提出的计算平台,我们获得了初步结果,可以验证自主变形概念。通过考虑各种类型的传感信息和高维传动输出等方式,该框架可以得到进一步的完善。鉴于实时地传动大型机械系统具有挑战性,并受其他环境问题(如进水)的限制,我们计划对由传感、控制和传动组成的系统子组件进行物理演示,使用连接在比例缩放的机电驱动系统的可变形外墙,其中将考虑驱动大型变形系统的时间响应对算法的影响。


技术上面临的另一个挑战是立面系统的开发,该系统在变形的同时需要保证整个建筑物的围护结构不被水渗透。使用分布式变形技术管理局部或某些类别的建筑外墙的变形可能更有希望保证不漏水,保证提供所需的驱动力,以及确保需要变形的外墙重量较轻。这种局部形状变化还可以通过影响载荷的时空相干性来减小风荷载效应,但其确切作用需要进一步研究。


增加变形系统的复杂性可包括考虑多个空气动力学目标,如除阻力之外的升力和扭力,或者采用更复杂的建筑外形。这一课题的发展目前受到已发布数据的数量和质量的限制。


尽管如此,此案例展示了深度强化学习(DRL)成功分析周围风场并引导建筑物立面自主变形的潜力和能力。本研究为进行这项课题早期探索的研究者提供了帮助,未来会逐步实现把更复杂的建筑设计目标融入到变形系统中。这将为进一步探索传感、计算与传动的融合以及使其成为实际的建筑设计和施工实践提供途径。


可以预见,随着未来大量高质量的数据集的获得,强化学习将成为未来建筑设计实践中从静态到动态立面变革的强大工具。我们还致力于将来以开源形式共享数据和计算工作流,从而使强化学习工具充分被土木工程实践所应用。


五、结语


由于风致效应和灾害的增加,城市地区风对高层建筑性能产生的影响往往伴随着经济损失。出现这一现象的原因一部分可能与气候异常有关,另一部分原因可能是建筑物的群集效应增强了风环境干扰。随着计算设计、人工智能、传感和传动以及网络物理基础设施的飞速发展,现在是探索未来建筑拓扑、利用动态立面主动变换轮廓来应对风环境变化的最好时机。


通过直接应用于桥梁和其他结构,这将准实时地或根据风环境变化的需要提高建筑性能。


建筑物的自主变形可以通过现有的城市传感和计算网络的融合而实现。本文提出的网络物理系统是一个可以实现的思路,该系统通过城市感知和数据分析的知识融合来实现自主变形。计算模型的模拟结果验证了使用DRL和MPC控制建筑物横截面构造的变形系统。


初步结果显示,AI代理和前沿的变形技术在减轻风致效应,从而改善其对民用基础设施性能及安全性的影响上有巨大应用潜力。


改编原文:Fei Ding, Ahsan Kareem.Tall Buildings with Dynamic Facade Under Winds[J].Engineering,2020,6(12):1443-1453.


本文来自微信公众号:中国工程院院刊(ID:CAE-Engineering),作者:作者:丁菲,  Ahsan Kareem

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP

相关推荐