教育论文网

面向千万亿次CPU-GPU异构系统的编程模型与性能优化关键技术研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文电子数字计算机(不连续作用电子计算机)论文各种电子数字计算机论文
面向千万亿次CPU-GPU异构系统的编程模型与性能优化关键技术研究
论文目录
 
摘要第10-12页
ABSTRACT第12-15页
第一章 绪论第15-39页
  · 研究背景第16-24页
    · GPU与异构系统第17-20页
    · 大规模CPU-GPU异构系统面临的技术挑战第20-24页
  · 相关工作第24-34页
    · GPU编程、优化方法和性能模型第24-30页
    · CPU-GPU异构系统编程和优化方法第30-31页
    · 典型千万亿次异构系统体系结构和并行软件支持第31-34页
  · 研究内容第34-36页
  · 主要创新第36-37页
  · 论文组织第37-39页
第二章 千万亿次CPU-GPU异构系统并行编程模型研究第39-53页
  · 千万亿次系统MPI/Open MP/Streaming混合编程模型第39-40页
  · 混合编程模型的任务映射第40-46页
    · 结点为中心的任务映射第42页
    · CPU为中心的任务映射第42-44页
    · GPU为中心的任务映射第44-45页
    · 任务映射方法总结第45页
    · 实验第45-46页
  · 基于共享内存的多进程共享GPU技术第46-51页
    · 实现原理第47-48页
    · 实现方法第48-50页
    · 实验第50-51页
  · 本章小结第51-53页
第三章 从千万亿次扩展到百万万亿次编程模型分析第53-69页
  · 未来E级系统的发展趋势第53-55页
  · 结点间MPI编程和全系统MPI+X混合编程模型分析第55-57页
  · 结点内编程模型的需求第57-58页
  · 结点内编程模型分析与总结第58-67页
    · 消息传递第58-59页
    · 共享存储第59-61页
    · 单边访问第61-62页
    · 分布数组第62-64页
    · 异构模型第64-66页
    · 国内的研究工作第66-67页
    · 特征总结第67页
  · 本章小结第67-69页
第四章 基于测量的自适应任务划分第69-83页
  · 异构计算平台任务划分问题的提出第69-72页
    · 异构平台科学计算任务平衡划分的重要性第70-71页
    · 异构平台科学计算任务平衡划分的难点第71-72页
  · 基于测量的自适应任务划分第72-77页
    · 任务划分比率初值设定第73-74页
    · 划分任务第74页
    · 更新任务比例数据库第74-75页
    · 基于测量的自适应任务划分示例分析:矩阵乘第75-77页
  · 实验与讨论第77-81页
    · GPU/CPU及各CPU核间任务划分比例调整第78-79页
    · 优化前后性能对比第79页
    · 多结点实验测试第79-81页
  · 本章小结第81-83页
第五章 嵌套双缓冲软件流水技术第83-93页
  · 软件流水的提出第83-86页
    · CPU与GPU的单边数据通信模型第83-85页
    · GPU程序代价模型第85页
    · 传统双缓冲软件流水执行模型和代价模型第85-86页
    · 传统方法的不足第86页
  · 嵌套双缓冲软件流水第86-89页
    · 执行模型和代价模型第86-87页
    · 基于有限状态自动机的高效实现第87-89页
  · Cache旁路的流式数据拷贝优化第89-90页
  · 基于天河 -1 平台评测第90-91页
  · 本章小结第91-93页
第六章 千万亿次CPU-GPU异构系统LINPACK实现与优化第93-111页
  · 千万亿次CPU-GPU异构系统第93-95页
    · 天河 -1第93-95页
    · 天河 -1A第95页
  · LINPACK编程第95-100页
    · LINPACK算法实现第96-97页
    · 异构系统LINPACK实现第97-99页
    · MPI/Open MP/Streaming编程模型实现第99-100页
  · 优化方法第100-103页
    · 自适应任务划分和嵌套双缓冲软件流水第100页
    · MPI/Open MP混合编程方式下SWAP算法优化第100-102页
    · 结点间GPU空间传输零拷贝和通信优化技术第102页
    · 传统的通用优化方法第102-103页
  · 实验第103-108页
    · 单进程测试第103-104页
    · 多进程测试第104-108页
  · 本章小结第108-111页
第七章 结论与展望第111-113页
  · 论文工作总结第111-112页
  · 课题研究展望第112-113页
致谢第113-115页
参考文献第115-129页
作者在学期间取得的学术成果第129-131页

本篇论文共131页,点击这进入下载页面
 
更多论文
面向千万亿次CPU-GPU异构系统的编程
面向瞬时故障的可配置容错技术研究
面向延迟优化的多核处理器Cache数据
面向异构体系结构的稀疏矩阵算法研
嵌入式实时系统通信机制与优化技术
符号执行可扩展性及可行性关键技术
基于几何代数的计算机视觉问题研究
基于多视图几何的视觉辅助惯导组合
基于轮廓和边缘的空间非合作目标视
社交媒体中的信息检索与传播分析
大规模空间数据的高性能查询处理关
软件行为动态分析关键技术研究
基于异构关系的微博网络意见动力学
数据流上序敏感查询处理关键技术研
基于位置的移动信息服务技术与应用
基于医学断层图像的网格生成技术研
非量测相机检校与目标运动参数测量
面向多核/众核体系结构的确定性并行
软件自动修复关键技术研究
多层超图剖分算法及其在大规模CFD并
基于概率生成模型的社区发现和网络
资源受限的超高分辨率图像压缩关键
结构化P2P网络抖动的应对策略研究
抗污染攻击的安全网络编码技术研究
Web服务组合的关键安全技术研究
基于逻辑集中控制的网络路由关键技
嗜盐微生物对典型多环芳烃的降解及
基于样本和特征的迁移学习方法及应
基于巨磁阻抗效应的弱磁传感器技术
基于传感器阵列瞬态响应信号分析的
光学遥感压缩成像理论与系统设计
遥感数据处理任务综合调度问题研究
“两弹一星”工程管理创新研究
高性能时钟分布与偏斜调整技术研究
基于CMP+GPU异构计算系统的并行离散
基于几何表示的典型量子系统辨识与
KDP晶体单点金刚石车削关键技术研究
光学镜面相位恢复子孔径拼接测量技
层板式鼻锥的结构特性与传热分析研
超声速预混气中爆震波起爆与传播机
机载GNSS/SINS组合精密导航关键技术
弹道中段目标双基地微动特性分析与
基于复杂网络社区探测的作战体系目
介质覆盖基片集成波导缝隙天线研究
单/多通道跳频信号侦察处理关键技术
小基线子集长时间序列差分干涉技术
非理想CSI情形下中继/多小区MIMO系
无线物理层安全通信中的波束成形技
面向资源的规约挖掘与强制技术研究
若干图像和语音数据分类问题研究
基于互联网的用户行为可信性关键技
SAR图像地雷场检测技术研究
深海浅地层岩芯取样钻机末端铠装光
基于LabVIEW的变频器性能试验系统的
东北大秧歌与太极拳对老年人核心力
体育舞蹈对提高体育院校大学生审美
运动性游戏课程对学前儿童体质发展
水平三学生体育与健康课学习评价体
长春市普通高中《学校体育工作条例
“体教结合”模式下长春市高中篮球
辽宁省中小学网球项目开展现状及培
创新视角下吉林省体育学硕士研究生
吉林省高校体育专业篮球“球感”教
长春市普通高校乒乓球教学的开展现
游泳运动对长春市儿童健康体适能的
沙河市篮球联赛开展现状的调查与分
心理训练对吉林省摔跤运动员竞技能
长春市高校运动训练专业跆拳道专项
青少年轮滑俱乐部准军事化管理新模
鞍山市健身俱乐部经营现状分析及发
长春市朝阳区普庆社区老年体育开展
简化太极拳对长春市中年男性公务员
长春市自由式滑雪空中技巧人才培养
中国传统武术的思想内涵及其对现代
长春市普通高校女大学生参加体育锻
吉林省柔道后备人才培养现状的调查
高校公共体育篮球选项课实施“成功
长春市体育彩票购买者信息需求对消
我国青年冰壶运动员的心理训练与其
音乐训练对体育院校健美操运动员表
吉林市滑雪指导员现状分析与对策
中职篮和美职篮小前锋竞技能力的比
吉林省冰雪体育旅游业的发展现状及
吉林省高校体育院系足球项目审美教
瑜伽对缓解表演专业大学生压力的研
长春市五人制足球比赛的现状分析及
新疆冰雪旅游与冰雪文化相融理论与
吉林市大众参与休闲体育的特征分析
体育院校运动训练专业游泳专修课程
长春市普通高校体育场馆资源利用研
 
异构并行系统论文 GPU论文 千万亿次论文 编程模型论文 并行优化论文
版权申明:目录由用户z**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved