内容简介
Hands-On GPU Programming with Python and CUDA hits the ground running: you’ll start by learning how to apply Amdahl’s Law, use a code profiler to identify bottlenecks in your Python code, and set up an appropriate GPU programming environment. You’ll then see how to "query" the GPU’s features and copy arrays of data to and from the GPU’s own memory.As you make your way through the book, you’ll launch code directly onto the GPU and write full blown GPU kernels and device functions in CUDA C. You’l
AI简介
这是一本深入讲解GPU编程的书籍,它以Python和CUDA为基础,详细讲解了如何编写高效的GPU程序。书中首先介绍了GPU编程的普及性与优势,以及CUDA框架,并详细讲解了如何查询GPU的特征,如何复制数据到GPU,并如何编写和调试CUDA代码。
书中详细介绍了Amdahl's Law的应用,以及如何通过代码剖析来理解程序的性能瓶颈,并针对这些瓶颈进行优化。书中还详细介绍了安装PyCUDA的准备工作,以及学习如何编写自定义CUDA内核函数。
书中还详细介绍了并行前缀算法理论,以及如何通过CUDA内核的线程组织和块级同步等技术,实现高效的并行计算。书中还详细介绍了编译与调试CUDA-C程序,以及如何利用printf语句、Nsight IDE、NVIDIA命令行和视觉分析工具等工具来调试和分析CUDA代码。
书中还详细介绍了cuBLAS库的使用和性能评估,以及cuFFT库的快速傅里叶变换操作。书中还详细介绍了cuDNN库的使用,以及如何利用集群计算和消息传递接口(MPI) 来提高计算效率。
书中还详细介绍了区块链技术及其挖矿过程,以及CUDA warp lockstep属性理解。