教育论文网

基于MIC众核架构的并行算法设计与优化

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文电子数字计算机(不连续作用电子计算机)论文各种电子数字计算机论文并行计算机论文
基于MIC众核架构的并行算法设计与优化
论文目录
 
摘要第1-5页
ABSTRACT第5-13页
注释表第13-14页
缩略词第14-15页
第一章 绪论第15-21页
  1.1 研究背景第15-17页
    1.1.1 众核处理器与高性能计算第15-16页
    1.1.2 高性能计算与科学工程应用第16-17页
  1.2 国内外研究现状第17-18页
  1.3 研究内容与意义第18-19页
  1.4 论文结构第19-21页
第二章 众核架构相关技术概述第21-30页
  2.1 Intel众核架构第21页
  2.2 二代Knight Landing新特性第21-28页
    2.2.1 微架构变化第21-23页
    2.2.2 多通道内存(MCDRAM)第23-25页
    2.2.3 缓存集群(Cluster)第25-26页
    2.2.4 向量指令集(AVX-512)第26-28页
  2.3 OpenMP编程模型第28-30页
第三章 众核架构下的SpMV算法设计与优化第30-48页
  3.1 并行算法移植与优化的一般方法第30-34页
    3.1.1 第一步:并行度优化第30-31页
    3.1.2 第二步:向量化第31-32页
    3.1.3 第三步:访存带宽优化第32-34页
  3.2 稀疏矩阵向量乘第34-37页
    3.2.1 基本概念第34页
    3.2.2 压缩算法相关研究第34-35页
    3.2.3 针对MIC的改进压缩算法第35-37页
  3.3 SpMV算法移植与优化方法第37-42页
    3.3.1 线程级并行第37-38页
    3.3.2 AVX-512 掩码优化第38-39页
    3.3.3 高速带宽内存优化第39-40页
    3.3.4 缓存集群优化第40-42页
  3.4 实验结果与分析第42-47页
    3.4.1 实验平台与测试数据集第42-43页
    3.4.2 改进的ELLPACK参数分析第43-44页
    3.4.3 算法性能评估第44-46页
    3.4.4 加速比分析第46-47页
  3.5 本章小结第47-48页
第四章 偏微分求解算法设计与优化第48-62页
  4.1 偏微分方程迭代求解算法第48-49页
    4.1.1 基本概念第48-49页
    4.1.2 Stencil相关研究第49页
  4.2 Stencil设计与优化第49-56页
    4.2.1 线程级并行与向量化第50页
    4.2.2 分块优化策略研究第50-52页
    4.2.3 针对MIC的改进Stencil算法第52-55页
    4.2.4 访存优化第55-56页
  4.3 实验结果与分析第56-61页
    4.3.1 实验平台与测试数据集第56-57页
    4.3.2 分块优化策略对比第57页
    4.3.3 缓存利用率分析第57-58页
    4.3.4 MCDRAM实验与分析第58-59页
    4.3.5 Cluster实验结果分析第59-60页
    4.3.6 执行时间与加速比第60-61页
  4.4 本章小结第61-62页
第五章 BP神经网络设计与优化第62-71页
  5.1 人工神经网络第62-65页
    5.1.1 反向传播算法基本概念第62页
    5.1.2 BP算法分析第62-65页
  5.2 BP算法设计与优化第65-69页
    5.2.1 缓存分块优化第65-67页
    5.2.2 寄存器分块与向量化第67-69页
  5.3 实验结果与分析第69-70页
    5.3.1 测试数据集与实验参数第69页
    5.3.2 优化前后性能对比第69页
    5.3.3 加速比第69-70页
  5.4 本章小结第70-71页
第六章 总结与展望第71-73页
  6.1 全文总结第71-72页
  6.2 未来工作第72-73页
参考文献第73-78页
致谢第78-79页
在学期间的研究成果以发表的学术论文第79页

本篇论文共79页,点击这进入下载页面
 
更多论文
基于MIC众核架构的并行算法设计与优
基于三焦点张量重投影的视频稳像算
基于压缩感知的人脸识别算法研究
基于电磁场控制的力触觉再现方法研
用于机器学习中图像识别的虚拟样本
基于DBNs网络的非限制性人脸识别算
基于相关叉指换能器的声表面波标签
基于改进TLD框架的目标跟踪
数字图像篡改盲检测研究
表情不变的三维人脸识别
基于视觉导向的插件机定位技术的研
基于图像匹配的大视角目标快速精确
基于TLD框架的目标跟踪算法
基于改进霍夫变换的几何形状检测算
基于AdaBoost算法的人脸检测系统研
机器视觉系统下的机车轮对踏面损伤
多波束前视声呐图像提高分辨率技术
小型无人机系统下基于视频处理的特
单目结构光三维测量精度优化技术研
基于波前传感器的像差测量系统研究
CT影像直接3D打印数据处理技术研究
基于遗传算法的设备布局和生产调度
基于机器视觉的小孔内表面缺陷检测
视觉导引AGV精准导引与精确定位技术
一种六自由度力反馈装置的设计与研
制造执行系统中数据挖掘关键技术研
物联制造环境下的实时调度决策机制
MFC多文档实现模态参数识别软件的设
基于共生矩阵和霍夫变换的磨粒纹理
变焦高精度双目立体视觉测量技术研
运动模糊视觉特征的三维重建技术研
三维工序模型的加工特征识别与抑制
面向结构光对缝测量的光条细化方法
基于RGB-D图像的SLAM问题关键技术研
基于群组的多人脸图像联合识别方法
基于核心点的大数据聚类算法
基于光电传感的RFID识读性能半物理
物流环境下二维条码动态图像质量检
基于WSO-LDA的微博话题“主题+观点
电子商务环境下零售商营销渠道选择
基于复杂环境视频序列的运动目标检
面向退化增强及复原图像的主客观一
基于视觉感知和自然场景统计的图像
基于多示例学习的任意姿态人体检测
移动云中基于位置隐私保护的推荐系
基于拓扑关系的距离度量与聚类算法
多子空间Skyline查询处理技术研究
不确定移动对象查询与更新的关键技
利用空间结构信息的图像分类方法研
基于有效距离的特征提取和特征选择
基于增量运动模型连续Skyline查询处
Web服务组合隐私信息流分析方法研究
基于云平台的加密数据计算方法
基于分布式移动对象连接操作的代价
基于主成分分析的软件缺陷预测研究
基于特征配置的系统安全性建模和分
基于有监督预训练NIN和深度ELM模型
面向非特定人群的动态手语语句识别
基于人体测量尺寸的三维人体建模
Java API代码约束与文档描述不一致
支持时间属性的隐私需求建模与验证
基于稀疏表示的二值图像超分辨率重
云环境中交通流数据的索引技术及研
面向渗透测试的漏洞检测与攻击方法
基于天空区域分割的暗原色先验去雾
线扫描光学相干显微(OCM)系统及应
红外舰船目标的检测跟踪与射流定位
基于FPGA的HEVC关键模块硬件实现
机器视觉系统下机车轮对踏面全景生
基于概率特征描述子的非局部均值图
抗介质超高频RFID标签研究
基于机器视觉的蜂窝结构三维外形测
开缝衬套成形质量的单目视觉检测技
基于质量追溯的质量管理信息系统研
基于网络相机的分布式机器视觉检测
机器视觉辅助下的激光三维扫描标示
 
众核架构论文 稀疏矩阵向量乘论文 有限差分论文 BP神经网络论文 访存密集论文
版权申明:目录由用户uhzgnaw7**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved