GPU 编程与性能优化
CUDA 与 cuDNN
GPU 编程基本原理
特别是如何使用 CUDA 进行并行计算,以及 cuDNN 库在加速深度学习中的应用
内存管理
核函数设计
性能监控与调优
性能优化
掌握一些基本的性能分析工具和方法,比如使用 nvprof 或 TensorFlow Profiler 分析模型运行瓶颈,并实施相应的优化措施。
特别是如何使用 CUDA 进行并行计算,以及 cuDNN 库在加速深度学习中的应用
掌握一些基本的性能分析工具和方法,比如使用 nvprof 或 TensorFlow Profiler 分析模型运行瓶颈,并实施相应的优化措施。