登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 通信工程 > 正文

基于GPU的Vampire的主要算法的研究与实现开题报告

 2020-04-12 08:46:56  

1. 研究目的与意义(文献综述)

1.1 课题国内外研究现状

1.1.1 cpu/gpu异构系统

gpu(graphics processing units)最初是1999年由nvidia提出的不同于cpu硬件设计的专用于处理计算机图形学中的任务的硬件模块。gpu芯片上更多的资源(晶体管)用于计算,用于缓存和控制的部件仅占很少一部分,而cpu中大量的资源用于缓存和逻辑控制,只有少部分资源用于计算,如图1.1所示。随着半导体技术的不断发展,gpu中可集成的晶体管数目快速增加,gpu的峰值性能正在以超过摩尔定律(平均每半年增加一倍)的速度增加着,gpu也因此具有计算能力强大、高带宽、高性价比、低能耗比的优点。随着大量软件编程语言的出现,如brook ,gpu的性能和可编程性的不断提高,除了专业图形应用外,gpu越来越多的被应用于大量的通用计算领域,具有这类特征的gpu称为gpgpu(general purpose gpu)。

图1.1 cpu与gpu内部硬件资源分配

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

2.1 研究目标及主要工作

本次毕设的研究目标是针对vampire需要海量数据运算进而存在程序执行效率不高的问题,提出基于cpu/gpu异构平台的vampire主要算法的高性能设计与实现。

本次设计的主要工作是充分考虑到计算内核组织方式、进程线程同步及调度方式、寄存器及各种存储器的访问使用、cpu-gpu之间的通信、cpu/gpu任务的划分等多种影响并行计算程序性能的因素,研究vampire的算法原理和cuda硬件结构,最大限度地开发算法的并行性,合理划分cpu/gpu的工作任务以期实现负载平衡,设置合理的数据结构减少cpu-gpu之间的通信带来的同步开销及延迟,充分利用cuda复杂的存储结构层次,实现最佳的访存方式,分析设计线程、线程块组织方式,实现线程、线程块之间的科学调度执行,从而实现充分发挥gpgpu的并行执行能力,减少同步开销及访存延迟,提高cpu、gpu的资源利用率,达到vampire程序总体的较高性能的优化。

2.2 关键技术

(1)研究分析vampire多种,如:实现和算法原理,磁性材料原子建模的居里温度测算、磁滞回线的计算、与温度相关的磁性材料的各向异性及效应的模拟、以及不同关键参数下的冷却场的模拟等程序的实现和算法原理,结合cpu、gpu的执行计算特点,考虑如何利用cuda机制提供的细颗粒的线程、数据级并行及粗颗粒的任务级并行,实现算法的最大限度的并行开发。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

时间

进度安排

第1周—第3周

查阅相关资料,明确研究内容及方案,完成开题报告

第4周—第5周

熟悉掌握GPGPU并行编程的基本理论,完成相关外文文献资料的阅读翻译,理解vampire软件仿真算法原理

第6周-第9周

熟悉CUDA开发环境及编程语言,实现Vampire并行化算法的分析构思,进行vampire程序算法的并行编程,实现系统整体功能,并进行相应性能测试。

第10周—第12周

充分研究CPU/GPU异构系统的并行程序的优化手段,并结合vampire测试结果,实现进一步程序性能的优化。

第13周—第15周

完成系统最终的各项性能测试工作,并撰写毕业论文。

第16周

毕业论文定稿,准备论文答辩。

第17周

毕业论文答辩

4. 参考文献(12篇以上)

[1] jason sanders,edward kandrot.cuda by example. person eduction , july 2010.

[2] manuel ujaldon. high performance computing and simulations on the gpu using cuda. interantional conference on high performance comupting and simulation,ieee 2012

[3] j cheng,m grossman,t mckercher.professional cuda c programming.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图