AMD GPU MI210 深度学习疑难杂症
ROCm
Pytorch
方法一:使用 docker 镜像 rocm/pytorch
方法二:Pytorch 官方轮子
APEX
- Pytorch 扩展,用于混合精度与分布式训练的工具
- Github
ModuleNotFoundError: fused_layer_norm_cuda
通过源码安装 APEX 解决,注意 Pytorch 版本对应的源码分支
- GitHub 拉取相应分支源码
cd apex
- 输入命令安装 apex,耗费时间可能较长
1 | if pip >= 23.1 (ref: https://pip.pypa.io/en/stable/news/#v23-1) which supports multiple `--config-settings` with the same key... |
AMD GPU MI210 深度学习疑难杂症