hpc

GPU 编程与性能优化

CUDA 与 cuDNN

GPU 编程基本原理

特别是如何使用 CUDA 进行并行计算,以及 cuDNN 库在加速深度学习中的应用

内存管理

核函数设计

性能监控与调优

性能优化

掌握一些基本的性能分析工具和方法,比如使用 nvprof 或 TensorFlow Profiler 分析模型运行瓶颈,并实施相应的优化措施。

Author

derolol

Posted on

2024-06-26

Updated on

2024-06-26

Licensed under

p