教育论文网

高性能GPU系统结构的研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文其他计算机论文
高性能GPU系统结构的研究
论文目录
 
摘要第1-6页
ABSTRACT第6-12页
第1章 绪论第12-26页
  1.1 GPU背景介绍第13-20页
    1.1.1 GPU的软件第13-15页
    1.1.2 GPU的硬件第15-18页
    1.1.3 片外存储器第18-20页
  1.2 本文主要工作第20-22页
    1.2.1 L1 data cache效率第21页
    1.2.2 多样分支第21-22页
    1.2.3 高带宽存储器第22页
  1.3 本文主要创新工作第22-24页
    1.3.1 一种支持细粒度和粗粒度cache-line管理的L1 data cache结构第22-23页
    1.3.2 线程-通道混洗压缩第23-24页
    1.3.3 研究高带宽存储器HBM的新特征在GPU中的应用第24页
  1.4 本文组织结构第24-26页
第2章 国内外研究现状第26-36页
  2.1 GPU的性能第26-33页
    2.1.1 Warp调度策略第26-28页
    2.1.2 L1 data cache第28-31页
    2.1.3 GPU硬件资源利用率第31-33页
  2.2 GPU的功耗第33-36页
第3章 一种支持细粒度和粗粒度Cache-Line管理的L1 Data Cache架构第36-70页
  3.1 相关背景介绍第36-41页
    3.1.1 共享存储器和L1 Data Cache第38-39页
    3.1.2 Amoeba-Cache第39-41页
  3.2 GPU片上存储器的使用情况第41-45页
    3.2.1 L1 Data Cache的使用情况分析第41-43页
    3.2.2 共享存储器的使用情况第43-45页
  3.3 Elastic-Cache结构第45-53页
    3.3.1 Chunk-tag和Common-tag第45-46页
    3.3.2 Elastic-Cache的基本操作第46-47页
    3.3.3 对共享存储器的修改第47-48页
    3.3.4 Elastic-Cache的实现方法第48-52页
    3.3.5 替换策略和cache一致性第52-53页
  3.4 实验方法第53页
  3.5 实验结果第53-68页
    3.5.1 性能第53-61页
    3.5.2 L1 Data Cache缺失率第61-63页
    3.5.3 L1 Data Cache的效率第63-65页
    3.5.4 停顿次数第65-66页
    3.5.5 代价第66-68页
    3.5.6 标签和数据的并行访问第68页
  3.6 相关工作第68-69页
  3.7 本章小结第69-70页
第4章 线程-通道混洗压缩第70-98页
  4.1 相关背景介绍第70-72页
  4.2 相关工作第72-77页
    4.2.1 多样分支和PDOM第72-74页
    4.2.2 压缩机制第74-77页
  4.3 寄存器文件的设计第77-79页
    4.3.1 PDOM中的寄存器文件第77页
    4.3.2 TBC中的寄存器文件第77-79页
  4.4 线程-通道混排压缩第79-88页
    4.4.1 TBC局限性分析第79-81页
    4.4.2 寄存器文件的改进第81-84页
    4.4.3 提前调度机制第84-86页
    4.4.4 硬件支持第86-88页
  4.5 实验方法第88页
  4.6 实验结果第88-95页
    4.6.1 SIMD通道利用率和压缩效率第89-91页
    4.6.2 空闲周期数第91-92页
    4.6.3 性能第92页
    4.6.4 对存储系统的影响第92-94页
    4.6.5 寄存器文件的bank访问代价第94页
    4.6.6 TLSC的实现代价第94-95页
  4.7 TLSC的架构兼容性分析第95-96页
  4.8 本章小结第96-98页
第5章 HBM的新特征在GPU中的应用第98-112页
  5.1 相关背景介绍第98-100页
  5.2 GDDR5和HBM的比较第100-102页
  5.3 结合GPU Cache架构探索HBM第102-103页
  5.4 实验方法第103-105页
    5.4.1 GPU性能第103-105页
    5.4.2 HBM的功耗第105页
  5.5 实验结果第105-110页
    5.5.1 GPU的性能第105-108页
    5.5.2 HBM的功耗第108-110页
  5.6 相关工作第110页
  5.7 本章小结第110-112页
第6章 总结与展望第112-116页
  6.1 本文工作总结第112-113页
  6.2 工作展望第113-116页
    6.2.1 对Elastic-cache进行扩展第113页
    6.2.2 TLSC在不同寄存器文件结构上的移植第113-114页
    6.2.3 访存请求调度策略对HBM的影响第114-116页
参考文献第116-128页
发表论文和参加科研情况说明第128-130页
致谢第130-132页

本篇论文共132页,点击这进入下载页面
 
更多论文
高性能GPU系统结构的研究
云计算的调度策略研究与性能分析
单细胞三维结构与衍射图像特征的分
基于内容的立体图像编辑方法研究
基于开放公共本体的语义软件服务机
高速并联机械手高精度控制方法研究
高速并联抓放机器人的精度设计与运
基于描述逻辑的大规模本体推理关键
功能型半导体纳米材料在氢离子和光
三重拐点期城镇化质量与效率及其驱
生产性服务业网络促进制造业价值链
面向组织绩效的企业团队领导力模型
EVA考核对国有企业R&D投入的影响及
基于价值链协同的政府采购云信息服
分析师羊群行为、信息传递与资产定
多模态生理信号情感识别研究
微波辅助类芬顿催化剂效能比较及制
基于有限旋量的并联机构构型综合方
基于能量理论的滚刀破岩特性分析及
基于各向异性建模的柴油机塑料零部
多供水需求下水库多年调节策略和he
柴油机串联发电复合涡轮全历程能流
柴油机正时齿轮系非线性动力学及噪
旋转行波超声电机若干动力学问题分
窄带阵列信号的二维测向技术研究
超分辨率图像盲复原算法的研究
显微CT系统标定关键技术的研究
复杂光学特性表面视觉测量关键技术
多模态数据分类的模糊粗糙方法研究
供水管道电化学腐蚀机理研究
多晶硅生产废水中氯离子的去除研究
汲取液中表面活性剂对正渗透过程特
磷钼聚合物缓蚀阻垢剂的研究
沉淀—微滤组合工艺处理模拟含碘放
车载地图智能道路自动识别及更新的
基于进化算法的软件多缺陷定位研究
移动公司客户关系管理系统设计与实
基于ASP.NET的住院管理系统的设计与
证券网站用户管理系统
某市事业单位人才管理系统的设计与
县级财政业务综合管理平台系统的设
员工培训管理信息系统的设计与实现
商业银行客户管理系统的设计与实现
弧齿锥齿轮螺旋变性半展成加工方法
考虑环境载荷影响的海洋平台起重机
带状雨洪调蓄措施在城市道路景观设
新能源汽车锂电池热管理仿真分析
加筋板的极限强度与可靠性分析
防洪保护区洪水风险分析模型优化与
考虑减流河段补水需求的锦屏梯级水
旧城区改造中的雨洪管理体系研究
长期循环荷载下考虑蠕变特性的饱和
各国雨洪管理理论体系对比研究
严寒、长间歇期高拱坝浇筑进度仿真
基于自适应差分进化算法的堆石坝坝
乌东德水电站水垫塘护坡防护结构型
混凝土重力坝施工进度仿真与多属性
调水工程中调蓄工程群水量联动机制
基于潮、雨遭遇情景的城市防潮排涝
钢筋混凝土中氯离子传输三维细观数
基于纤维取向对钢纤维混凝土非线性
爆炸地震与空气冲击波作用下网架结
农宅建设的新模式——以华润希望小
基于老年人行为心理需求的公共图书
天津地区地被植物生态化景观设计研
京津冀地区古代佛教建筑天然光环境
寒冷地区中小学教学楼被动式绿色设
建筑一体化电热冷联产光伏组件综合
基于多目标优化算法的寒冷地区办公
城市景观工程设计中的设计变更控制
浅谈海岛古村落保护与发展——以舟
基于改进遗传算法的高速汽油机性能
耦合多种激励源的国Ⅴ柴油机振动性
FAI_SCR标定系统的开发与催化器氨存
分离式热管换热器在液浸聚光光伏系
地区复杂电网的脆弱性风险评估
基于风险管理的X地区高压输变电作业
基于数据包络分析(DEA)的电网资产
海河流域典型灌区节水水平评估及节
人体呼出气检测技术及实验研究
高电子迁移率晶体管建模及参数提取
干法刻蚀对产品缺陷的相关性分析与
面向嵌入式系统的音视频接收与同步
高清数字电视信号传输的设计与实施
发音器官在生理识别中的贡献率及相
RFID群组认证协议的设计与分析
基于扩频的间隔包大小网络流水印技
基于485总线的分布式输入输出系统
大学生即时通讯软件使用行为影响因
P2P视角下的个人信用风险评价方法应
时空数据的离群点识别研究
 
图形处理器论文 高速缓冲存储器论文 寄存器文件论文 线程 高带宽存储器论文
版权申明:目录由用户zz**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved