论文目录 | |
致谢 | 第1-6页 |
中文摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
目录 | 第8-11页 |
1 绪论 | 第11-21页 |
· 研究背景 | 第11-12页 |
· 并行计算现状 | 第12-14页 |
· 传统的有限元并行计算 | 第12-13页 |
· GPU通用计算 | 第13-14页 |
· 有限元并行算法现状 | 第14-17页 |
· 局部并行求解法 | 第14-15页 |
· 区域分解法 | 第15-16页 |
· EBE法 | 第16-17页 |
· 计算环境 | 第17-18页 |
· 软件环境 | 第17页 |
· 硬件环境 | 第17-18页 |
· 论文主要研究内容 | 第18-21页 |
2 基于GPU的并行计算 | 第21-35页 |
· 引言 | 第21页 |
· GPU和GPU通用计算 | 第21-23页 |
· CUDA编程模模式 | 第23-27页 |
· CUDA概述 | 第23-24页 |
· 内核(kernel) | 第24-25页 |
· 线程层次 | 第25-26页 |
· 存储器层次结构和数据类型 | 第26-27页 |
· CUDA Fortran并行程序设计 | 第27-33页 |
· 稠密矩阵乘积的设计 | 第27-30页 |
· 测试结果 | 第30-33页 |
· 本章小结 | 第33-35页 |
3 大型线性方程组的求解 | 第35-57页 |
· 引言 | 第35页 |
· 有限元方程离散的线性方程组 | 第35-42页 |
· 固结理论概述 | 第35页 |
· Terzaghi一维固结理论 | 第35-36页 |
· Terzaghi-Rendulic固结理论 | 第36-37页 |
· Biot固结理论 | 第37-42页 |
· 线性方程组的求解 | 第42-49页 |
· 线性方程组的求解方法 | 第42-45页 |
· 迭代预处理技术 | 第45-47页 |
· PSQMR及并行计算原理 | 第47-49页 |
· 刚度矩阵的存储方法 | 第49-52页 |
· 等带宽存储法 | 第49-50页 |
· 一维变带宽存 | 第50页 |
· CSC存储法和相关的存储法 | 第50-51页 |
· EBE存储法 | 第51-52页 |
· 其他存储 | 第52页 |
· 稀疏矩阵矢量乘积 | 第52-56页 |
· 稀疏矩阵-矢量乘的CPU实现(SpMV-CPU)) | 第52-54页 |
· 稀疏矩阵-矢量乘GPU并行算法(SpMV-GPU1) | 第54-55页 |
· 稀疏矩阵-矢量乘GPU并行算法的改进(SpMV-GPU2) | 第55-56页 |
· 本章小结 | 第56-57页 |
4 Biot固结问题求解性能的比较 | 第57-67页 |
· 引言 | 第57页 |
· PGI Fortran与Intel Fortran编译器效率比较 | 第57-58页 |
· 求解效率对比 | 第58-60页 |
· P3dBiot程序与Abaqus软件计算效率对比 | 第58页 |
· 稀疏存储法与EBE存储法比较 | 第58-60页 |
· 基于GPU的并行计算结果 | 第60-65页 |
· 本章小结 | 第65-67页 |
5 土-结构相互作用问题的预处理技术与GPU加速的迭代求解 | 第67-77页 |
· 引言 | 第67页 |
· 最新提出的预处理技术 | 第67-68页 |
· 非精确分块对角预处理 | 第67-68页 |
· 分区块SSOR预处理 | 第68页 |
· 桩筏基础算例分析 | 第68-75页 |
· 不同弹性模量对结果影响 | 第69-72页 |
· 不同有限元网格划分对结果影响 | 第72-74页 |
· 不同线程块划分对结果影响 | 第74-75页 |
· 本章小结 | 第75-77页 |
6 总结和未来工作 | 第77-79页 |
· 全文总结 | 第77页 |
· 未来工作 | 第77-79页 |
参考文献 | 第79-83页 |
附录A P3DBiot固结有限元程序 | 第83-90页 |
A.1 P3dBiot固结有限元程序简介 | 第83页 |
A.2 计算模型参数 | 第83-84页 |
A.3 主程序源代码 | 第84-90页 |
附录B 输入文件和输出文件 | 第90-93页 |
B.1 程序数据输入文件 | 第90-91页 |
B.2 程序数据输出文件 | 第91-92页 |
B.3 程序与Abaqus计算结果验证 | 第92-93页 |
作者简历 | 第93-97页 |
学位论文数据集 | 第97页 |