CFD 并行应用的可扩展性分析

CFD 并行应用的可扩展性分析

一、CFD并行应用程序的可扩展性分析(论文文献综述)

董玲玉,周志锋,戴潮虎,赵珂,吴宗芸,刘天才,赵民富,杨文,胡长军[1](2021)在《数值堆热工流体高精细并行模拟优化技术研究》文中认为热工流体模拟是数值反应堆的重要组成部分,高精细、大规模数值计算是实现高保真数值模拟的基础。使用计算流体力学(CFD)软件进行高精细、大规模数值模拟对计算资源和存储资源提出了巨大挑战,需依赖超级计算机并行实现。本文以基于谱元法求解N-S(Navier-Stokes)方程的数值方法为研究对象,针对区域分解和基于典型混合架构国产超级计算机的并行优化两个核心问题,提出了一种面向海量精细网格的混合并行递归谱二分法实现的大规模区域分解方法,建立了一套以小矩阵乘为核心的申威(SW26010处理器)众核架构并行优化技术。混合并行大规模区域分解方法在天河二号超算上进行测试,相比开源CFD软件Nek5000的串行区域分解模块性能提升约95%;面向申威的小矩阵乘优化在神威·太湖之光超算上进行测试,当谱元阶数达到24时性能提高约51.9%。两种技术均在中国数值反应堆核心软件CVR-PACA中得以应用。

杨子韬[2](2021)在《多层自适应网格的格子Boltzmann方法研究及其应用》文中认为

陈坚强,吴晓军,张健,李彬,贾洪印,周乃春[3](2021)在《FlowStar:国家数值风洞(NNW)工程非结构通用CFD软件》文中研究表明计算流体力学(CFD)仿真软件是流体相关的数学物理知识和工程实践经验的数字化表达,是工业数字化转型的重要助推。然而,大型工业CFD软件研发难度极高,需要同时兼顾功能多样、系统稳定、性能优越、交互友好等特征。依托国家数值风洞(NNW)工程,研发出一款通用流场模拟软件NNW-FlowStar,并在航空、航天等工业部门大力推广使用。软件基于非结构有限体积求解方法和大规模并行计算技术开发,结合现代化软件工程思维设计,具备先进的数值方法、高效的计算效率和友好的用户操作界面,可满足各类复杂外形的高效气动模拟。独特的重叠网格技术配合六自由度运动模块,可帮助实现武器分离、舱门定轴转动等各类气动-运动协同仿真需求。多类标模案例和复杂工程应用表明,FlowStar软件算法鲁棒、精度可靠,是一款高精度、高效率、高可靠性的通用CFD仿真软件。通过对软件的架构设计和功能应用进行介绍,使相关从业人员能更好地了解FlowStar软件,最终促进国产自主CFD软件生态的良性发展。

尚子豪[4](2021)在《RPV钢辐照损伤的原子动力学蒙特卡洛模拟程序开发与应用》文中提出核能在节能减排、优化全球能源结构、实现绿色发展等方面发挥的作用已经得到了世界范围内的广泛认可。目前,核能已经对国防、科研、医疗、工业、农业、航空和海洋等诸多领域产生显着影响。随着现代化建设的不断发展,未来我国的能源需求将进一步增加。与此同时,一旦核电站出现事故就会对生态环境造成严重的放射性污染。因此,核电站的运行安全问题一直是人们关注的焦点。核反应堆压力容器(RPV)钢是核电站不可更换的关键性设备,其服役安全决定着整个核电站的运行安全及使用寿命。RPV钢长期接受高能中子辐照会诱导材料内部产生纳米级的富Cu团簇,这些团簇通过阻碍位错导致RPV钢出现硬化和脆化的现象,使得RPV钢宏观性能显着降低。这些纳米团簇尺寸分布范围广泛,不同温度下也会出现结构差异,采用实验手段观察相对复杂和困难。近年来,伴随着科学计算领域兴起和国内高性能计算的快速发展,采用计算机模拟技术为验证理论模型,研究实验现象背后的机理开辟了道路。动力学蒙特卡洛作为一种具有代表性的模拟方法,能够完成原子级的长时间尺度大规模数值模拟,非常适合用于研究RPV钢的辐照损伤机制。本文对基于原子动力学蒙特卡洛方法的Open KMC程序进行开发与优化,并应用于模拟RPV钢的辐照损伤问题,从理论上对杂质原子与辐射诱导产生的空位点缺陷之间的相互作用进行了深入研究。最后在“神威·太湖之光”上完成大规模并行可扩展性测试。论文的研究内容和结论如下:(1)对Open KMC程序中嵌入原子势(EAM)能量计算模型进行开发,使得程序可以采用EAM势完成RPV钢的长时间模拟演化过程。分别采用Pair势和EAM势这两种势能模型,并充分考虑不同势函数下的原子间相互作用范围,提出了空位选取优化算法,算法通过减少冗余的空位更新操作,提高了程序计算效率。采用TAU工具定位程序的通信热点函数,并分析了影响通信性能的原因,最后给出对应的通信优化策略。(2)将Fe-Cu二元合金作为RPV钢材料,并引入一定数量的空位(Vacancy),采用优化后的Open KMC程序完成Pair和EAM两种势能模型下2.5亿粒子长时间尺度的数值模拟工作。模拟结果验证了纯Cu团簇和Cu-Va复合体团簇的析出现象。并发现Cu-Va复合体团簇的结构是空位团簇被Cu原子从外层包裹所构成的。通过对不同尺寸范围的团簇进行考察,发现不同尺寸范围内团簇的平均尺寸和数量密度均表现出上升趋势。同时,越大尺寸范围对应的团簇数量越少,但团簇粗化更加明显,且平均尺寸和数量密度变化的波动性更强。在体系内引入不同数量的空位进行对比分析,更多的空位加快了Cu原子的聚集过程,空位增加对团簇整体数量密度影响较小,但能促进较大团簇的粗化。最后计算了663K~773K四种温度下的沉淀推进系数,并与实验值计算结果进行比较,发现模拟结果与实验值结果具有相同的变化趋势,当温度升高,EAM势能模型对应的模拟结果与实验值结果具有很好的拟合程度。(3)在国产超级计算机“神威·太湖之光”上完成了万亿粒子规模的并行可扩展性测试。可扩展性测试分别采用Pair势和EAM势。在强可扩展性测试当中,固定问题规模,将总核数从1万核逐渐增加至260万核,当核数分别小于13万核和6.5万核时,Pair势和EAM势对应的测试结果均展现出了超线性加速比。在弱可扩展性测试当中,保持各进程工作负载不变,总核数由65核逐渐增加至585万核,模拟粒子的规模最高达到了1.44万亿,Pair势与EAM势的测试结果始终保持着80%左右的理想并行效率。

李冰[5](2021)在《风电场精细化实时仿真技术研究》文中认为在“碳中和、碳达峰”的国内能源发展目标引领下,我国正在逐步构建以新能源发电为主体的新型电力系统。风电在我国新能源发电中占据较高的比重。大规模、高比例的风电并网对电力系统的安全稳定运行产生了一定影响。为了更加深入地研究风电场动态对电网的影响,亟需针对风电场的仿真工具进行进一步研究。现存风电场仿真工具主要存在两方面问题。一方面,现存仿真工具基于不同的研究目的使用了不同程度的简化模型,而风电场是一个多时间尺度、多耦合的复杂系统,因此现存简化仿真工具无法捕捉不同模型之间的耦合动态响应;另一方面,由于风电场仿真模型复杂、计算量较大,因此现存仿真工具大多存在仿真速度较慢、效率较低的问题。为了应对这些问题和挑战,本文研究了风电场精细化实时仿真技术。根据仿真模型时间尺度的不同,风电场精细化仿真模型可以划分为风场和风电机组两个部分。本文分别开发了风场和风电机组的精细化实时仿真平台。本文主要研究内容包括:(1)本文将风电机组精细化仿真模型分为机械系统和电磁系统两部分,并分别搭建了二者的实时仿真器。首先,为了实现机械系统模型的实时仿真,本文引入了实时操作系统以提供硬实时运行环境。其次,本文针对机械系统开源仿真软件OpenFAST进行了二次开发,实现了机械系统的实时仿真器RT-OpenFAST。实时性测试结果表明,RT-OpenFAST在操作系统不同的负载条件下均能满足毫秒级定时需求。最后,基于实时数字仿真器RTDS,本文搭建了机组电磁系统的实时仿真模型。(2)本文开发了 RT-OpenFAST与RTDS之间的数字通信接口。本文在实时操作系统中引入了开源的实时网络协议栈RTnet。并针对RT-OpenFAST编写了一套实时通信程序,从而实现了 RT-OpenFAST的对外实时通信接口。本文在RTDS侧搭建了一套通信控制逻辑。由此实现了 RTDS对外通信接口的控制功能,以及仿真平台的初始化控制功能。基于所开发的实时仿真器和数字通信接口,本文最终实现了机组级的精细化实时仿真平台。本文基于仿真对比验证了所提出的实时仿真平台的优越性。此外,本文通过仿真实验揭示了风电机组中机械系统和电磁系统的耦合动态响应。(3)本文开发了中保真度风场实时仿真器。首先,基于美国国家能源实验室开发的开源风电场仿真软件FAST.Farm,本文对其中的风场仿真模块AWAE进行了上层封装。其次,针对AWAE模块计算速度较慢的问题,本文基于CPU+GPU异构计算平台对AWAE模块进行了硬件加速,极大地提高了其执行速度。此外,本文也对AWAE进行了软件层面的优化。通过软硬件两方面地优化,最终使AWAE模块满足了实时仿真的计算速度要求。最后,基于实时操作系统及异构计算平台,本文开发了风场实时仿真器RT-AWAE。

陈呈,赵丹,王岳青,邓亮,杨超,苏铖宇,王昉[6](2021)在《NNW-TopViz流场可视分析系统》文中认为流场可视化技术采用图形图像直观地表现CFD数值模拟的计算结果,使用户能够方便地对这些数据进行分析、比较和研究。然而,CFD数值模拟的流动复杂,其产生的流场数据规模巨大、数据类型复杂、特征提取困难,传统的串行可视化软件效率低、交互手段单一,难以满足数据分析的需求。国家数值风洞(NNW)工程研制了一套流场数据处理可视化软件系统(NNW-TopViz,简称TopViz),具有对流场数据处理与特征提取、几何图形绘制等可视化与交互功能。根据可视分析效率需求,TopViz实现了线程并行,在多核计算环境下有效提高了可视化计算和交互效率;针对流场特征提取困难、常规方法效率低的问题,TopViz实现了基于卷积神经网络的流场旋涡特征提取方法,提升了特征提取准确率和效率;为提高软件交互效率并提供便捷的交互方式和体验,基于头戴式显示设备和体感控制器构建沉浸式虚拟显示与交互平台,TopViz实现了手势和眼球凝视2种交互方法,提供沉浸式环境下多视图、多角度流场探测方式。

李鹏,陈坚强,丁明松,何先耀,赵钟,董维中[7](2021)在《NNW-HyFLOW高超声速流动模拟软件框架设计》文中研究指明NNW-HyFLOW在国家数值风洞(NNW)工程支持下,由风雷开源软件提供基础框架支撑,将建设成为基于结构/非结构混合网格,面向高超声速应用领域的国产自主工业CFD软件,具备高温气体热化学非平衡效应模拟及其相关气动力、气动热和气动物理特性计算分析等主要特色功能。本文从框架设计、数据结构、耦合方法、并行计算方法以及接口设计等方面对软件设计思想和框架特点进行了介绍,给出了求解器采用的理论模型、核心数值算法及其实现方法,结合HEG风洞试验、RAM-C飞行试验、Electre飞行试验以及航天飞机OV102飞行试验等典型算例开展了数值模拟。研究表明:NNW-HyFLOW具有底层代码复用、功能兼容性好、扩展能力强和接口灵活等优点,其当前测试版本已经具备了较好的高超声速非平衡流动数值模拟能力,在热化学非平衡效应及其影响的气动力特性、气动热环境和等离子体分布特性预测与评估方面,具有较高的数值计算精准度,初步满足了高超声速复杂飞行器高温非平衡流动数值模拟的需求。

梁正虹[8](2021)在《CPU+GPU异构并行计算研究及其在可压缩流动中的应用》文中研究表明计算流体力学(Computational Fluid Dynamics,CFD)是一门用计算机数值求解流动控制方程来研究各种流动现象、规律的学科。CFD涉及到计算机科学与技术、流体力学、计算数学等多个专业研究领域。在航空航天领域,CFD已经成为获取高超声速飞行器气动力/热数据、开展高超声速流动基础研究的三大研究手段之一。随着求解问题复杂度的增加,几何外形、数值方法、物理化学模型等的日益精细、复杂,CFD对计算资源有了更高的需求。近年来,GPU发展迅速,基于CPU/GPU异构架构的计算体系成为构造大型超算系统的主要方式。计算机性能飞跃式的发展给CFD领域带了新的机遇和挑战。本文面向CPU/GPU异构体系和可压缩流CFD应用,围绕着可压缩流CFD异构并行计算技术开展研究,重点研究可压缩流CFD算法在CPU/GPU异构计算体系的并行化。研究主要分为两部分:一、可压缩领域常用通量分裂格式在GPU架构下的性能研究。以一维激波管为算例,使用CUDA编程模型编写一维欧拉求解器,对可压缩领域常用的Van Leer格式、Roe格式和AUSMPW+格式在CPU/GPU异构架构上进行分析。结果表明,Roe格式对流场解析效果好,且在异构平台加速性能高,应用前景较好;格式构造中存在的条件分支严重影响了格式的加速性能,构造数值格式时,合理的减少条件分支,将会大大提高其在异构平台的加速效果。二、基于FR格式的异构平台可压缩流求解器。针对当下适用于非结构网格的通量重构格式FR开展GPU可压缩流并行算法研究。首先,根据异构计算机特点结合CFD计算流程,提出基于CPU/GPU异构计算体系并行计算模式;开展基于FR格式的并行任务划分。接着,根据计算点类型对并行任务进行分类,构建Kernel函数;针对GPU数据访存特点,提出基于FR格式的数组存储结构。最后,用圆柱绕流算例验证了GPU算法的有效性,考核了其加速比,并成功将其应用于高超声速升力体数值模拟中。实验结果表明,本文设计的异构可压缩流求解器在单GPU上相较于单核CPU,最大能够达到50倍以上加速比,且能够应用于复杂的高超声速流动模拟,具备一定的工程实用价值。

范良[9](2021)在《基于OpenMP/MPI的大规模标量场数据并行体可视化技术研究》文中提出体可视化将三维体数据直接映射为半透明的二维图片,具有强大的空间表现能力,是重要的三维标量场数据可视化方法。但是,体绘制算法设计复杂,涉及大量浮点运算,目前的串行体绘制算法难以满足大规模标量场数据体可视化需求。本文采用线程/进程并行的方法,提出并行体绘制算法,解决大规模标量场数据体可视化,且满足实时交互需求。本文的贡献主要体现在以下三个方面:(1)线程并行投影四面体算法。可见性排序和四面体投影分类/拆分是串行投影四面体算法中最耗时的两个部分,本文使用Open MP编程框架,研究并实现了相应的线程并行算法。经过20核CPU实验测试,与串行投影四面体算法相比,本文算法加速比为3.5;与VTK体绘制算法相比,本文算法加速比为2.5。(2)进程并行体绘制算法。本文采用MPI编程框架,设计并实现了基于进程并行的体绘制算法。在并行读取大规模体数据的基础上,每个进程使用KD树算法进行数据分割;然后,每个进程采用独立的管线计算体绘制图像,并通过树合成策略合成最终结果。经过80核CPU实验测试,与串行体绘制算法相比,本文算法加速比为37.6。(3)松耦合C/S并行体可视化系统。客户端产生交互命令和显示体绘制结果,服务器承担可视化计算和绘制任务。其中,客户端/服务器之间采用Socket通信,服务器进程之间采用MPI通信。充分利用设计模式技术,采用模块化的实现,确保了系统的高度灵活性和可扩展性。经过节点内并行和跨节点并行实验测试,本系统可以很好地应用于大规模非结构网格数据体可视化,且满足实时交互需求。

董本松[10](2021)在《基于国产自主可控平台的Office口令恢复优化技术研究》文中认为目前,数据的存储、传输和使用普遍采用加密的形式,目的是提高数据的安全性。同时,不法分子也会利用各种加密手段,隐藏犯罪信息,给安全部门的工作带来了新挑战。由于加密算法的不断改进,密钥的位数越来越多,密钥组合的形式越来越复杂,导致口令恢复的计算规模逐渐增大。已有的CPU平台无法满足恢复口令的计算需求,GPU平台存在访存问题,限制了口令恢复的性能。鉴于此,迫切需求一种高效能的口令恢复系统,以实现大规模计算资源的动态聚合,进而实现对加密数据的高效分析和恢复。本文提出对Office口令恢复优化技术的研究,以提高口令恢复的性能为目的。具体研究内容和贡献点如下:1.本文以Office口令恢复算法为研究对象,分析并设计了基于申威众核平台的口令恢复系统。同时对其算法进行了深入的并行性分析和相关性处理,测试并统计了口令恢复算法的热点函数,找出了影响其性能的瓶颈。2.针对国产申威众核平台的特点,提出了6种优化策略,改进并优化了口令恢复系统。该优化策略较好地利用了申威众核平台的从核计算性能和局部存储优势。为了解决循环嵌套函数执行时间较长的问题,提出了利用SW26010的64个从核加速计算。为了解决函数中访存延迟较大的问题,提出了利用局存(Local Direct Memory,LDM)减少访存延迟。为了解决函数间数据传输效率较低的问题,提出了利用DMA(Direct Memory Access)批量式传输技术。为了解决64KB的局存空间有限的问题,提出了利用tile语句的循环分块原理。为了解决从核计算性能降低或通信开销增加的问题,提出了利用双缓冲机制。为了解决64个从核内部密集型数据的计算问题,提出了利用数据级并行的向量化。3.本文对优化策略的正确性,口令恢复系统的有效性、可扩展性和可控性,以及申威众核平台的优越性进行了实验验证。实验结果表明,优化后的系统具有并行性较强、恢复速度较快、吞吐量较大等特点。与开源软件Hashcat相比,口令恢复性能提高了2.06倍,与常用的口令恢复工具AOPR、EDPR和Accent Software相比,分别提高了97.21、19.96和15.31倍。该优化策略较好地发挥了国产申威众核平台的优势,提高了口令恢复的效率,缓解了实际的应用需求。

二、CFD并行应用程序的可扩展性分析(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、CFD并行应用程序的可扩展性分析(论文提纲范文)

(1)数值堆热工流体高精细并行模拟优化技术研究(论文提纲范文)

1 区域分解与CFD软件优化移植的国内外相关研究
2 数值反应堆热工流体CFD模拟计算模型
    2.1 计算模型
    2.2 基本流程
3 混合并行大规模区域分解方法
    3.1 递归谱二分法原理
    3.2 递归谱二分法MPI/OpenMP混合并行实现
    3.3 并行效果测试
4 面向申威众核架构的并行优化技术
    4.1 SW26010介绍
    4.2 小矩阵乘面向SW26010的并行优化技术
        1) MPE向量化
        2) CPE移植优化
    4.3 性能测试
        1)性能优化测试
        2) 扩展性测试
5 结论及下一步工作

(3)FlowStar:国家数值风洞(NNW)工程非结构通用CFD软件(论文提纲范文)

1 软件设计
    1.1 整体架构
    1.2 数值方法
    1.3 多体运动求解方法
    1.4 重叠网格技术
    1.5 并行计算技术
    1.6 图形界面设计
2 主要功能
    2.1 定常流动模拟
        2.1.1 全机及部件气动力分析
        2.1.2 发动机进排气影响
        2.1.3 喷流干扰评估
    2.2 单套网格非定常流动模拟
    2.3 多套网格非定常多体运动模拟
    2.4 多套网格准定常捕获轨迹系统(CTS)
    2.5 多套网格定常网格测力
    2.6 数据分析
        2.6.1 舵面气动分析
        2.6.2 气动载荷插值
        2.6.3 进气道性能分析
        2.6.4 监测点流场提取
        2.6.5 流场输出
3 软件验证与确认
4 工程应用
    4.1 发动机尾吊式客机气动分析
    4.2 飞行器内埋弹舱舱门开闭过程模拟
    4.3 导弹头罩分离模拟
5 结论

(4)RPV钢辐照损伤的原子动力学蒙特卡洛模拟程序开发与应用(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 本文研究内容与组织结构
第2章 理论基础
    2.1 原子动力学蒙特卡洛方法
    2.2 原子间相互作用势
        2.2.1 对势
        2.2.2 嵌入原子势
    2.3 反应堆压力容器钢辐照损伤的形成机制
    2.4 并行数值模拟的实现
        2.4.1 MPI并行通信
        2.4.2 同步子域算法
        2.4.3 高性能计算
    2.5 本章小结
第3章 势函数开发与程序优化
    3.1 EAM势在OpenKMC程序中的实现
    3.2 空位选取的计算优化
    3.3 并行热点分析与优化策略
        3.3.1 TAU热点分析工具
        3.3.2 通信热点分析与优化策略
    3.4 本章小结
第4章 OpenKMC在数值模拟上的应用
    4.1 基于两种势函数的长时间数值模拟
        4.1.1 参数设置与时间转换
        4.1.2 并行模拟结果的验证分析
    4.2 团簇尺寸和数量密度变化的具体分析
        4.2.1 团簇尺寸分段后的对比分析
        4.2.2 最大团簇的变化过程
        4.2.3 空位浓度对团簇演化的影响
    4.3 数值模拟结果与实验值结果的比较
    4.4 本章小结
第5章 万亿粒子大规模可扩展性测试
    5.1 “神威·太湖之光”上的强可扩展性测试
    5.2 “神威·太湖之光”上的弱可扩展性测试
    5.3 本章小结
第6章 总结与展望
    6.1 本文主要结论
    6.2 研究展望
参考文献
附录A EAM势截断半径下的两种原子间位置关系
攻读学位期间取得的科研成果
致谢

(5)风电场精细化实时仿真技术研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 课题研究的背景及意义
    1.2 课题研究现状
        1.2.1 风电机组精细化实时仿真研究现状
        1.2.2 风电场精细化实时仿真研究现状
    1.3 本文主要工作
第2章 风电机组精细化实时仿真平台
    2.1 风电机组精细化模型及其实现
    2.2 机械系统模型及其实现
        2.2.1 机械系统的气动动态模型
        2.2.2 机械系统的结构动力学模型
        2.2.3 基于OpenFAST的机械系统模型实现
    2.3 机械系统模型的实时仿真实现
        2.3.1 实时操作系统环境搭建
        2.3.2 RT-OpenFAST开发
    2.4 电磁系统模型及其实时仿真实现
        2.4.1 发电机的数学模型及其求解方法
        2.4.2 变换器和网络数学模型及其求解方法
        2.4.3 基于RTDS的电磁暂态实时仿真
    2.5 实时仿真平台接口设计
        2.5.1 通信方案设计
        2.5.2 RTDS通信接口实现
    2.6 本章小结
第3章 实时仿真平台稳定性分析及仿真验证
    3.1 仿真平台接口稳定性分析与验证
        3.1.1 接口稳定性理论分析
        3.1.2 硬件平台通信接口性能验证
    3.2 精细化模型与简化模型仿真结果对比
    3.3 风电机组的机械-电磁耦合特性
    3.4 本章小结
第4章 风场建模及其实时仿真技术
    4.1 风场尾流特性模型
        4.1.1 尾流速度亏损模型
        4.1.2 尾流蜿蜒特性模型
    4.2 基于FAST.Farm的风场仿真程序开发
        4.2.1 FAST.Farm简介
        4.2.2 风场仿真加速方案
        4.2.3 加速方案性能验证
    4.3 风场实时仿真实现方案
        4.3.1 软件环境
        4.3.2 RT-AWAE开发
    4.4 风场实时仿真算例分析
        4.4.1 实时性能测试
        4.4.2 风场实时仿真
    4.5 本章小结
第5章 结论与展望
    5.1 研究结论
    5.2 研究展望
参考文献
致谢
攻读学位期间发表的学术论文目录
    一. 参与项目
    二. 成果
学位论文评阅及答辩情况表

(6)NNW-TopViz流场可视分析系统(论文提纲范文)

1 国内外相关工作
    1.1 并行可视技术
    1.2 智能特征提取
    1.3 沉浸式三维虚拟显示和多通道交互
2 NNW-TopViz技术特点
    2.1 并行可视化技术
        2.1.1 流场数据可视化计算并行性分析
        2.1.2 并行可视化设计与实现
    2.2 智能特征提取技术
    2.3 沉浸式三维虚拟显示和多通道交互技术
        2.3.1 沉浸式三维虚拟显示
        2.3.2 沉浸式多通道交互
        2.3.3 交互界面
3 NNW-TopViz系统设计与开发
    3.1 系统整体架构
    3.2 系统详细设计与开发
        3.2.1 系统模型
        3.2.2 系统功能
4 NNW-Topviz测试与分析
    4.1 系统简介
    4.2 并行扩展性测试
    4.3 智能特征提取测试
5 总结

(7)NNW-HyFLOW高超声速流动模拟软件框架设计(论文提纲范文)

1 软件设计
    1.1 框架设计
    1.2 数据结构
    1.3 耦合算法
    1.4 并行计算
    1.5 接口设计
2 理论方法
    2.1 控制方程
    2.2 物理化学模型
    2.3 数值方法
3 算例验证
    3.1 HEG风洞试验
    3.2 RAM-C飞行试验
    3.3 Electre钝锥模型试验
    3.4 航天飞机STS飞行试验
4 结束语

(8)CPU+GPU异构并行计算研究及其在可压缩流动中的应用(论文提纲范文)

摘要
abstract
1 绪论
    1.1 课题研究的背景和意义
    1.2 国内外研究和发展现状
        1.2.1 计算机架构发展趋势
        1.2.2 异构计算机特点
        1.2.3 CFD离散格式概述
        1.2.4 CPU/GPU异构计算体系下可压缩CFD并行算法发展现状
    1.3 本文的主要工作
2 GPU并行计算
    2.1 引言
    2.2 GPU体系结构
    2.3 GPU软件系统
    2.4 CUDA编程模型
        2.4.1 CUDA执行模式
        2.4.2 CUDA存储结构
        2.4.3 CUDA数据通信及同步
    2.5 本章小结
3 典型通量分裂格式在异构计算体系下的性能分析
    3.1 引言
    3.2 典型通量分裂格式
        3.2.1 FVS
        3.2.2 FDS
        3.2.3 AUSM
    3.3 计算模型
        3.3.1 Riemann问题计算模型
        3.3.2 控制方程
    3.4 基于CPU/GPU的一维Euler算法流程
    3.5 结果分析
        3.5.1 计算结果对比
        3.5.2 并行算法性能对比
        3.5.3 格式加速效果分析
    3.6 本章总结
4 基于通量重构格式的可压缩流数值计算方法
    4.1 引言
    4.2 流动控制方程
        4.2.1 N-S方程
        4.2.2 湍流模型
    4.3 基于通量重构方法的空间离散
    4.4 时间离散方法
    4.5 边界条件
    4.6 本章小结
5 GPU可压缩流并行算法研究
    5.1 引言
    5.2 CPU/GPU异构可压缩流求解器并行模式
    5.3 CPU/GPU可压缩流求解器关键技术
        5.3.1 FR格式任务划分
        5.3.2 核函数构建
        5.3.3 数据存储方式
    5.4 性能测试
        5.4.1 加速比定义
        5.4.2 性能评估
    5.5 升力体算例
    5.6 本章小结
6 总结与展望
    6.1 全文总结
    6.2 工作展望
致谢
参考文献
攻读硕士学位期间发表的学术论文及研究成果

(9)基于OpenMP/MPI的大规模标量场数据并行体可视化技术研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 体可视化研究现状
        1.2.1 体绘制
        1.2.2 体可视化系统
    1.3 大规模标量场体可视化研究现状
        1.3.1 并行体绘制
        1.3.2 C/S架构并行可视化
    1.4 本文研究内容与组织结构
2 大规模标量场数据体可视化基础
    2.1 体可视化理论基础
        2.1.1 体数据
        2.1.2 体绘制算法
    2.2 大规模标量场数据并行体可视化理论基础
        2.2.1 并行计算
        2.2.2 并行计算编程框架
    2.3 章末小结
3 基于线程并行的体绘制算法研究
    3.1 并行可见性排序算法
    3.2 并行四面体投影分类与拆分算法
        3.2.1 四面体投影分类/拆分归一化
        3.2.2 顶点数组偏移量计算
    3.3 三角形投影光栅化和渲染
    3.4 实验分析
        3.4.1 本文算法性能分析
        3.4.2 两层嵌套循环分析
        3.4.3 不同非结构网格体绘制算法性能对比分析
        3.4.4 执行时间分类分析
        3.4.5 可扩展性分析
    3.5 章末小结
4 基于进程并行的体绘制算法设计与实现
    4.1 并行数据分割算法实现
        4.1.1 KD树理论基础
        4.1.2 并行KD树体数据分割算法
        4.1.3 基于KD树的可见性排序算法
    4.2 体绘制图像合成算法实现
        4.2.1 颜色融合
        4.2.2 基于树的图像合成
    4.3 实验分析
        4.3.1 数据分割算法性能
        4.3.2 并行体绘制算法性能
    4.4 章末小结
5 松耦合的C/S并行体可视化系统设计与实现
    5.1 系统需求分析
        5.1.1 背景及用途
        5.1.2 功能需求
        5.1.3 性能需求
        5.1.4 技术需求
    5.2 系统设计与实现
        5.2.1 系统设计
        5.2.2 系统实现
    5.3 系统性能优化
        5.3.1 图片压缩/解压
        5.3.2 传递函数延时更新
        5.3.3 两层LOD模型
    5.4 系统测试与性能评估
        5.4.1 节点内并行性能
        5.4.2 跨节点并行性能
    5.5 章末小结
6 总结与展望
致谢
参考文献
攻读硕士学位期间发表的论文及科研成果

(10)基于国产自主可控平台的Office口令恢复优化技术研究(论文提纲范文)

摘要
abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 课题来源
    1.4 本文主要研究内容及创新点
    1.5 论文结构安排
2 相关研究工作
    2.1 口令恢复算法
        2.1.1 Office口令恢复的计算流程分析
        2.1.2 Office口令恢复的开销热点分析
    2.2 国产申威众核处理器
    2.3 并行开发工具
        2.3.1 消息传递接口
        2.3.2 开源加速器
        2.3.3 单指令多数据流
        2.3.4 消息传递接口+开源加速器
    2.4 并行性能的评价指标
    2.5 传统Office口令恢复工具存在的问题
    2.6 本章小结
3 系统总体结构设计
    3.1 系统框架
    3.2 系统相关类及函数介绍
    3.3 系统主要模块简介
    3.4 系统主要模块实现
        3.4.1 Office文档解析模块
        3.4.2 预处理模块
        3.4.3 口令扩展模块
        3.4.4 Hash迭代模块
        3.4.5 AES模块
        3.4.6 对比验证模块
    3.5 本章小结
4 基于申威众核平台的口令恢复系统优化研究
    4.1 相关性分析
    4.2 口令恢复系统优化
        4.2.1 加速循环并行化
        4.2.2 优化全局访存操作
        4.2.3 提高数据传输效率
        4.2.4 循环分块
        4.2.5 双缓存机制
        4.2.6 向量化
    4.3 本章小结
5 性能测试与结果分析
    5.1 测试环境和测试用例
        5.1.1 测试环境
        5.1.2 测试用例
    5.2 测试对比工具及测试目的
        5.2.1 测试对比工具
        5.2.2 测试目的
    5.3 实验结果与对比分析
        5.3.1 正确性测试
        5.3.2 有效性测试
        5.3.3 可扩展性测试
        5.3.4 与其他现有口令恢复工具的对比
        5.3.5 与其他平台的性能对比
    5.4 本章小结
6 总结与展望
    6.1 全文工作总结
    6.2 下一步工作展望
参考文献
附录:攻读学位期间发表的学术论文及参与项目
致谢

四、CFD并行应用程序的可扩展性分析(论文参考文献)

  • [1]数值堆热工流体高精细并行模拟优化技术研究[J]. 董玲玉,周志锋,戴潮虎,赵珂,吴宗芸,刘天才,赵民富,杨文,胡长军. 原子能科学技术, 2021(09)
  • [2]多层自适应网格的格子Boltzmann方法研究及其应用[D]. 杨子韬. 上海大学, 2021
  • [3]FlowStar:国家数值风洞(NNW)工程非结构通用CFD软件[J]. 陈坚强,吴晓军,张健,李彬,贾洪印,周乃春. 航空学报, 2021(09)
  • [4]RPV钢辐照损伤的原子动力学蒙特卡洛模拟程序开发与应用[D]. 尚子豪. 太原理工大学, 2021(01)
  • [5]风电场精细化实时仿真技术研究[D]. 李冰. 山东大学, 2021(12)
  • [6]NNW-TopViz流场可视分析系统[J]. 陈呈,赵丹,王岳青,邓亮,杨超,苏铖宇,王昉. 航空学报, 2021(09)
  • [7]NNW-HyFLOW高超声速流动模拟软件框架设计[J]. 李鹏,陈坚强,丁明松,何先耀,赵钟,董维中. 航空学报, 2021(09)
  • [8]CPU+GPU异构并行计算研究及其在可压缩流动中的应用[D]. 梁正虹. 西南科技大学, 2021(08)
  • [9]基于OpenMP/MPI的大规模标量场数据并行体可视化技术研究[D]. 范良. 西南科技大学, 2021(08)
  • [10]基于国产自主可控平台的Office口令恢复优化技术研究[D]. 董本松. 中原工学院, 2021(08)

标签:;  ;  ;  ;  ;  

CFD 并行应用的可扩展性分析
下载Doc文档

猜你喜欢