CUDA並行編程實戰
![]() |
《CUDA並行編程實戰》,安索奇 著,出版社: 機械工業出版社。
內容簡介
本書是一本深入淺出的CUDA編程實踐指南。由CUDA編程領域的資深專家撰寫,主要介紹使用C++對NVIDIA GPU進行編程,覆蓋了GPU內核與硬件、並行思維與編程[1]、warp和協作組、並行模板、紋理、蒙特卡羅應用等內容,旨在幫助讀者快速掌握CUDA編程的核心技能。書中詳細介紹了CUDA的基本概念、架構和編程模型,並通過豐富的實戰案例和詳細解析,指導讀者如何編寫、優化和調試CUDA程序。本書注重理論與實踐相結合,旨在培養讀者解決實際問題的能力。無論讀者是初學者還是有一定經驗的開發者,都能從本書中獲益。掌握CUDA編程技能將為讀者的職業發展增添重要競爭力,助力讀者在科學研究、工程開發、數據分析等領域中脫穎而出。
目錄
譯者序
前言
第1章 GPU內核與硬件介紹1
1.1?背景1
1.2?第一個CUDA示例2
1.3?CPU架構9
1.4?CPU的計算能力10
1.5?CPU內存管理:利用緩存隱藏延遲11
1.6?CPU:並行指令集13
1.7?GPU架構13
1.7.1?回顧歷史13
1.7.2 NVIDIA的GPU型號14
1.8?Pascal架構14
1.9?GPU內存類型16
1.10?warp和wave17
1.11?線程塊與網格18
1.12 占用率19
第1章尾注20
第2章 並行思維與編程21
2.1?Flynn分類法21
2.2 內核函數調用語法28
2.3 啟動三維內核函數29
2.4 延遲隱藏和占用率35
2.5 並行模式36
2.6 並行歸約37
2.7 共享內存48
2.8 矩陣[2]乘法51
2.9 分塊矩陣乘法58
2.10 BLAS62
第2章尾注66
第3章 warp和協作組68
3.1 協作組中的CUDA對象71
3.2 分塊分區75
3.3 向量加載81
3.4 warp級內部函數和子warp84
3.5 線程分歧和同步85
3.6 避免死鎖87
3.7 協同組91
3.8 HPC特性97
第3章尾注98
第4章 並行模板100
4.1 二維模板100
4.2 二維模板的級聯計算112
4.3 三維模板116
4.4 數字圖像處理119
4.5 Sobel濾波器127
4.6 中值濾波器127
第4章尾注132
第5章 紋理133
5.1 圖像插值134
5.2 GPU紋理135
5.3 圖像旋轉137
5.4 lerp函數138
5.5 紋理硬件141
......
參考文獻
- 移至 ↑ 學習編程的樂趣與挑戰:從目標設定到實踐探索的全面指南 ,搜狐,2025-01-02
- 移至 ↑ 矩陣究竟是什麼,搜狐,2023-09-17