CUDA并行编程实战
![]() |
《CUDA并行编程实战》,安索奇 著,出版社: 机械工业出版社。
内容简介
本书是一本深入浅出的CUDA编程实践指南。由CUDA编程领域的资深专家撰写,主要介绍使用C++对NVIDIA GPU进行编程,覆盖了GPU内核与硬件、并行思维与编程[1]、warp和协作组、并行模板、纹理、蒙特卡罗应用等内容,旨在帮助读者快速掌握CUDA编程的核心技能。书中详细介绍了CUDA的基本概念、架构和编程模型,并通过丰富的实战案例和详细解析,指导读者如何编写、优化和调试CUDA程序。本书注重理论与实践相结合,旨在培养读者解决实际问题的能力。无论读者是初学者还是有一定经验的开发者,都能从本书中获益。掌握CUDA编程技能将为读者的职业发展增添重要竞争力,助力读者在科学研究、工程开发、数据分析等领域中脱颖而出。
目录
译者序
前言
第1章 GPU内核与硬件介绍1
1.1?背景1
1.2?第一个CUDA示例2
1.3?CPU架构9
1.4?CPU的计算能力10
1.5?CPU内存管理:利用缓存隐藏延迟11
1.6?CPU:并行指令集13
1.7?GPU架构13
1.7.1?回顾历史13
1.7.2 NVIDIA的GPU型号14
1.8?Pascal架构14
1.9?GPU内存类型16
1.10?warp和wave17
1.11?线程块与网格18
1.12 占用率19
第1章尾注20
第2章 并行思维与编程21
2.1?Flynn分类法21
2.2 内核函数调用语法28
2.3 启动三维内核函数29
2.4 延迟隐藏和占用率35
2.5 并行模式36
2.6 并行归约37
2.7 共享内存48
2.8 矩阵[2]乘法51
2.9 分块矩阵乘法58
2.10 BLAS62
第2章尾注66
第3章 warp和协作组68
3.1 协作组中的CUDA对象71
3.2 分块分区75
3.3 向量加载81
3.4 warp级内部函数和子warp84
3.5 线程分歧和同步85
3.6 避免死锁87
3.7 协同组91
3.8 HPC特性97
第3章尾注98
第4章 并行模板100
4.1 二维模板100
4.2 二维模板的级联计算112
4.3 三维模板116
4.4 数字图像处理119
4.5 Sobel滤波器127
4.6 中值滤波器127
第4章尾注132
第5章 纹理133
5.1 图像插值134
5.2 GPU纹理135
5.3 图像旋转137
5.4 lerp函数138
5.5 纹理硬件141
......
参考文献
- 跳转 ↑ 学习编程的乐趣与挑战:从目标设定到实践探索的全面指南 ,搜狐,2025-01-02
- 跳转 ↑ 矩阵究竟是什么,搜狐,2023-09-17