论文目录 | |
摘要 | 第10-12页 |
ABSTRACT | 第12-15页 |
第一章 绪论 | 第15-39页 |
· 研究背景 | 第16-24页 |
· GPU与异构系统 | 第17-20页 |
· 大规模CPU-GPU异构系统面临的技术挑战 | 第20-24页 |
· 相关工作 | 第24-34页 |
· GPU编程、优化方法和性能模型 | 第24-30页 |
· CPU-GPU异构系统编程和优化方法 | 第30-31页 |
· 典型千万亿次异构系统体系结构和并行软件支持 | 第31-34页 |
· 研究内容 | 第34-36页 |
· 主要创新 | 第36-37页 |
· 论文组织 | 第37-39页 |
第二章 千万亿次CPU-GPU异构系统并行编程模型研究 | 第39-53页 |
· 千万亿次系统MPI/Open MP/Streaming混合编程模型 | 第39-40页 |
· 混合编程模型的任务映射 | 第40-46页 |
· 结点为中心的任务映射 | 第42页 |
· CPU为中心的任务映射 | 第42-44页 |
· GPU为中心的任务映射 | 第44-45页 |
· 任务映射方法总结 | 第45页 |
· 实验 | 第45-46页 |
· 基于共享内存的多进程共享GPU技术 | 第46-51页 |
· 实现原理 | 第47-48页 |
· 实现方法 | 第48-50页 |
· 实验 | 第50-51页 |
· 本章小结 | 第51-53页 |
第三章 从千万亿次扩展到百万万亿次编程模型分析 | 第53-69页 |
· 未来E级系统的发展趋势 | 第53-55页 |
· 结点间MPI编程和全系统MPI+X混合编程模型分析 | 第55-57页 |
· 结点内编程模型的需求 | 第57-58页 |
· 结点内编程模型分析与总结 | 第58-67页 |
· 消息传递 | 第58-59页 |
· 共享存储 | 第59-61页 |
· 单边访问 | 第61-62页 |
· 分布数组 | 第62-64页 |
· 异构模型 | 第64-66页 |
· 国内的研究工作 | 第66-67页 |
· 特征总结 | 第67页 |
· 本章小结 | 第67-69页 |
第四章 基于测量的自适应任务划分 | 第69-83页 |
· 异构计算平台任务划分问题的提出 | 第69-72页 |
· 异构平台科学计算任务平衡划分的重要性 | 第70-71页 |
· 异构平台科学计算任务平衡划分的难点 | 第71-72页 |
· 基于测量的自适应任务划分 | 第72-77页 |
· 任务划分比率初值设定 | 第73-74页 |
· 划分任务 | 第74页 |
· 更新任务比例数据库 | 第74-75页 |
· 基于测量的自适应任务划分示例分析:矩阵乘 | 第75-77页 |
· 实验与讨论 | 第77-81页 |
· GPU/CPU及各CPU核间任务划分比例调整 | 第78-79页 |
· 优化前后性能对比 | 第79页 |
· 多结点实验测试 | 第79-81页 |
· 本章小结 | 第81-83页 |
第五章 嵌套双缓冲软件流水技术 | 第83-93页 |
· 软件流水的提出 | 第83-86页 |
· CPU与GPU的单边数据通信模型 | 第83-85页 |
· GPU程序代价模型 | 第85页 |
· 传统双缓冲软件流水执行模型和代价模型 | 第85-86页 |
· 传统方法的不足 | 第86页 |
· 嵌套双缓冲软件流水 | 第86-89页 |
· 执行模型和代价模型 | 第86-87页 |
· 基于有限状态自动机的高效实现 | 第87-89页 |
· Cache旁路的流式数据拷贝优化 | 第89-90页 |
· 基于天河 -1 平台评测 | 第90-91页 |
· 本章小结 | 第91-93页 |
第六章 千万亿次CPU-GPU异构系统LINPACK实现与优化 | 第93-111页 |
· 千万亿次CPU-GPU异构系统 | 第93-95页 |
· 天河 -1 | 第93-95页 |
· 天河 -1A | 第95页 |
· LINPACK编程 | 第95-100页 |
· LINPACK算法实现 | 第96-97页 |
· 异构系统LINPACK实现 | 第97-99页 |
· MPI/Open MP/Streaming编程模型实现 | 第99-100页 |
· 优化方法 | 第100-103页 |
· 自适应任务划分和嵌套双缓冲软件流水 | 第100页 |
· MPI/Open MP混合编程方式下SWAP算法优化 | 第100-102页 |
· 结点间GPU空间传输零拷贝和通信优化技术 | 第102页 |
· 传统的通用优化方法 | 第102-103页 |
· 实验 | 第103-108页 |
· 单进程测试 | 第103-104页 |
· 多进程测试 | 第104-108页 |
· 本章小结 | 第108-111页 |
第七章 结论与展望 | 第111-113页 |
· 论文工作总结 | 第111-112页 |
· 课题研究展望 | 第112-113页 |
致谢 | 第113-115页 |
参考文献 | 第115-129页 |
作者在学期间取得的学术成果 | 第129-131页 |