342 空气动力学学报 第25卷 序设计中利用MPI库函数MPI—COMM—GROUP、 MPI—GROUP—INCL及MPI—COMM—CREATE将所有 5.2计算结果及讨论 的Slave节点自定义为新的通讯域,用于分子数据交 换及子节点之间的全局通讯。我们给出非结构网格 图4(b)给出了流场趋于定常后十六分区非结构 计算网格,图4(a)为动态分区所用结构网格的边界。 由于整个动态分区过程可以看作是自适应分子数的 DSMC并行算法的计算流程,如图2。 4 DSMC中的相关模型 过程,分区结果使得每一个分区内的分子总数大体相 等,因此可以明显地看出:在靠近驻点处,因为密度较 4.1分子模型与反射模型 本文在直接模拟中采用了Bird建议的变径硬球 模型(variable hard sphere),简称VHS模型[ ,这样可 以使模拟分子具有与硬球模型一样均匀的散射几率, 又能使它的碰撞截面随相对速度的改变而改变,能保 证粘性系数 与温度 关系的一致。分子与物面的 相互作用采用了完全漫反射模型[引。完全漫反射模 型假定分子与表面作用后,离开表面的分子以平衡的 Maxwel1分布散射。 4.2碰撞对的选取 本文利用了Bird非时间计数器法(no time counter,简称NTC)[ ]进行碰撞对的选取,引入位置元 思想中的子网格,在同一网格下相邻子网格中进行碰 撞对的选取,这样可以降低算法对网格维度的要求, 可以做到不考虑分子在子网格中的具体位置对碰撞 几率的影响。 4.3 Larsen.Bergnakke碰撞模型 Larsen.Bergnakke碰撞模型 J将粒子之间的碰撞 分成弹性碰撞和以及有转动能和振动能参加的非弹 性碰撞,其比例为(1一 一 ): 1: 1,对于非弹 口 厶V 口 V 性碰撞,碰撞中的总能量Ec是相对平动能E与内能 e 之和,碰撞后分子能量根据平衡分布函数在平动模 式与内能模式之间重新分配。 5数值算例及结果分析 5.1计算模型与来流条件 本文用并行非结构网格DSMC方法模拟了高超 声速圆柱绕流,计算区域及边界条件如图3所示。来 流为由氮气与氧气组成的混合气体,组分摩尔百分比 为0.763:0.237,物面温度与流场温度分别为293K、 181K。来流速度为1418.7km/s,分子数密度为0.595 X 1022 大,分区区域面积较小;在圆柱的背风面,因为密度较 小,分区区域面积较大;在流动未受扰动的均匀流场 处,分区区域面积大体相等。 图3计算模型与边界条件 Fig.3 Geometrical model and boundary conditions (a)十六分区结构网格边界 (b)十六分区非结构网格 图4十六分区网格 Fig.4 Sixteen decompositions 图5给出串行程序与十六分区并行程序计算结 果的比较,串行程序的正确性已有文献[1]给出。图 5(a)、(b)、(c)、(d)分别为密度等值线、等马赫数线、 温度等值线与压力等值线。从结果的对比来看,串行 结果与并行结果一致,说明并行化后的DSMC过程是 正确的。为了定量地说明本文发展的动态自适应分 区策略,我们进行了等网格静态分区及相应的并行 DSMC计算,这里等网格静态指的是分区依据传统分 区标准进行,网格分区的结果使得各分区内的网格单 元数大致相等,网格分区只在流场计算之前分区一 次。图6给出了等网格静态十六分区与动态分区各 子进程分子数量的条形对比图。明显地看出在等网 维普资讯 http://www.cqvip.com 第3期 王学德等:动态负载平衡的二维非结构网格DSMC并行算法研究 343 格静态分区下,分子数量差别巨大,各进程问会出现 过多的相互等待,因此等网格静态分区很难做到负载 平衡。 (a) 等密度线 (b)等马赫线 (c)等温度线 (d)等压力线 图5并行与串行计算结果的比较 Fig.5 Comparison between serial and parallel results 为了验证本文发展的分区策略及并行算法,我们 给出了并行效率的比较。图7(a)为计算时间的对 比,图7(b)为加速比的比较。可以看出,动态分区在 相同数量处理器的条件下,所取得的加速比较高,与 理想加速比相比差别不大,证明了本文提出的动态分 区策略、通讯方法以及DSMC并行算法是成功的。从 图7还可以看出,相比等分子动态分区网格,等网格 1.5E+5 生IE+5 1 5E+4 0 0 ¨¨3 l 6 I h9 . l2 1..l5 l7 I l 处理器序号 (a)等网格静态分区 lE+5 5E+4 0 0 3 6 9 l2 l5 l7 处理器序号 (b)等分子动态分区 图6等网格静态与等分子动态分区处理器间分子数的比较 Fig.6 Comparison of number of molecules between static and dynamic decomposition (a)计算时间 处理器数量 (b)加速比 图7计算效率的比较 Fig.7 Comparisons of computing efifciency 维普资讯 http://www.cqvip.com
空气动力 学学报 第25卷 静态分区很难取得较高的加速比,并且随着处理器的 增加,加速比与理想加速比的差别逐渐增大。这充分 说明在相同的条件下,分区的分子数量是影响加速比 很重要的因素,传统的分区策略不适用于并行DSMC 计算。 为了进一步验证本文算法的有效性,我们利用文 献[10]的计算条件模拟了80kin下的高超声速圆柱绕 流。图8给出了本文计算的80kin高空下壁面热流系 数曲线和沿驻点线温度的分布,与文献[1O]相比较, 吻合得较好。 04 0.3 0 2 rL rL ¨ 纠 0.1 O (a)壁面热流系数 (b)驻点线温度 图8计算结果的比较 Fig.8 Comparisons of cMculated results 6 结 论 本文研究二维非结构网格DSMC并行算法,结合 高超声速圆柱绕流并行数值计算算例,我们得出了以 下结论: (1)基于结构背景网格上的非结构网格动态分 区策略能够保证各子区域的分子数量大致相等,实现 计算进程的动态负载平衡; (2)利用MPI库函数构造的通讯方法以及并行 算法适合非结构网格DSMC并行计算,数值算例取得 了较为理想的加速比; (3)传统的分区方法不适用于DSMC并行计算, 所取得的加速比与理想加速比相比差别较大。 参 考 文 献: 王学德,伍贻兆,夏健.二维非结构网格DSMC方法的 实现及其应用[J].南京航空航天大学学报,2004,36 (6):704—707. BIRD G A.Molecular gas dynamics[M].Oxford:Clraendon Press,1976. BIRD G A.Molecular gas dynamics and the direct simulation rLo f gas flow[M].OxfrL ord:ClrL raendonrL Press,19rL94. rL 樊菁,刘宏立,沈青等.直接统计模拟位置元方法中 .. 的分子表面反射确定论判据[J].空气动力学学报, 2000,18(2):180—187、 樊菁,彭世锍,刘宏立等.DSMC位置元方法中的表面 元的程序标识及分子表面反射的确定论判据[J].力学 学报,1999,31(6):671—676. BIRD G A.Apphcafion of hte DSMC method to the full shut— tle geometry[R]. 姒A一90—1692,1990. LAUX M,FASOULAS S,MESSERSCHMID E W.Develop— ment of a DSMC code on planar unstructured grids wiht auto— marie d adaptation【R J.AIAA-95—2053. LAUX M.Optimization and paralhlization of the DSMC methdo on unstructured ds[R].A A一97—25 12. WILMOTH R C,LEBEAU G J and CARLSON A B.DSMC d methodologies for computing low—densi ̄,hypersonic flow about reusable launch vehicles[R].AIAA一96—1812,1996. 樊菁,沈青.过渡领域高超声速圆柱绕流直接模拟 [J].空气动力学学报,1995,13(4):405—413. KIM M G.KIM H S.A parallel cell based DSMC method with dynamic load balancing using unstructured Adaptive meshes【RJ.AIAA 2003.1033. (下转第361页) rLl 维普资讯 http://www.cqvip.com
第3期 于陆军等:单循环脉冲爆轰发动机内外流场的动力学结构 36l 端压力的下降。 参 考 文 献 calculations of plume dynamics of a pulse detonation engine by the space—time CE/SE method【R].AIAA 200l一3612,2001. [5] 李辉煌,杨基明,徐立功.脉冲爆震发动机喷嘴流动的 数值模拟[J].推进技术,2004,25(6):553—556.(LI HUI. HELMAN D,SHREE、rE R P.and EIDELMAN S.Detonation HUANG.YANG JI—MING.XU LI—GONG.A numerical simu. pulse engine【RJ.Aj从86—1683,1986. 1ation on the noz ̄e lfow of pulse detonation engine[J].Jour・ hal ofPropulsion Technology,2004,25(6):553—556.) [2] COOPER M,JACKSON S,SHEPHERD J E.Efieet of dena— gration—to-detonatin transiiton on pulse detonation engine im— [6] LEVEQUE R J.Wave propagation algorithms for multidimen- sional hyperbolic【J J.J Cornptttatonali Physics,1997,13l: 327—353. pule[R].GALCIsT Report FM00—3,2000. [3] /3 CH/PING,KAILASANATH K.A numerical study of reac— ifve lfows in pulse detonation engines[R].Aj从2001—3933。 2oo1. [7] ABATE G,SHYY W.Dynamle structure of confined shocks undergoing sudden expansion[J].Progress in Aerospace Sci・ e, e.2002,38:23—42. [4] ZHANG ZENG-CHAN,JOHN YU S T,HE HAO,et a1.Direct Dynamic structure of the internal and external flow field in a single—cycle pulse detonation engine YU Lu—jun,FAN Bao—chun,DONG Gang,GUI Ming—yue (Laboratory ofTransient Ph ̄ics,Naajlng University ofSceince and Technology,Nanjingjla, ̄u 210094,China) Abstract:By solving Navier-Stokes equations in conjunction with the chemistry,a numerical simulation of pulse deto— nation process induced by flame in the tube with CH4一Oz—N2 ixtmure and the distribution of the internal and external axisym— metric flow ifeld was performed,and a CH4一Oz—N2 system,which included 14 species and 19 element reactions,was in— volved.The computational results demonstrate the diffraction of shock wave,vortex ring and complex vortex/shock interac— tions in the vicinity of the thruster exit.The dynamic structure is also discussed. Key words:PDE;numerical simulation;chemical reaction mechanism;dynamic structure (上接第344页) A parallel algorithm of 2D unstructured DSMC method with dynamic load balance WANG Xue.de ,一,WU Yi.zhao2,XIA Jian (I.School ofPower Engineering,Nanifg Uninversity ofScience and Technoloy,Nangjig 210094,Chinna; 2.College ofAerospace Engieenring,Nanjing University ofAeronautics and Astronautics,Nanjig 21n0016,China) Abstract:This paper is to study parallel algorithm of 2D unstuctured DSMC method on PC・r-CLUSTERS that is dis-— tributed memory architecture using the MPI standard library.In order to obtain high parallel efficiency,a new adaptive do— main decomposition technique is presented.Because this method results in equal number of molecules among processors, dynamic load balance is maintained.Single step communication methods are constructed by means of MPI library.A com— plete parallel algorithm of 2D unstructured DSMC method is designed using SPMD and master/slave parallel mode.New fea— ture of FORTRAN90 is fully exploited which makes the code more flexible.Finally,numerical experiments are made for hy— personic rarefied gas flow past cylinder.In some extent,the numerical results confirm the feasibility of method mentioned above. Key words:unstructured d;direct simulation;DSMC;parallel algorithm;dynamic load balance;MPI
因篇幅问题不能全部显示,请点此查看更多更全内容