PyTorchインストール時のトラブル

PyTorchのソースからインストールの備忘録、、、

備忘録と言いつつ行った日からだいぶ時間経ってからの記録なので内容はおぼろげ(.zsh_historyを参考にしながら)記述。

DeepLearning系を触らずにいたら、`pytorch` が動かなくなってしまっていた。

RuntimeError: CUDA error: no kernel image is available for execution on the device

と、エラーが返ってきた。

CUDAのバージョンとpytorchのバージョンがあっていなのかな。

pip install torch==XXX+cuXXX` 

でバージョン指定を探ったが、自分の環境に合ったものがなかった。

ので、ソースからインストールを行った。

git clone --recursive https://github.com/pytorch/pytorch
cd pytorch
python setup.py install

cmake がないといわれ、なぜか pip install で cmake をインストールしていた。

ninjaライブラリもインストール ( pip install ninja )

CMAKE_PREFIX_PATH=${CONDA_PREFIX:-"$(dirname $(which conda))/../"}  python setup.py install`

で、エラー

以下と類似した cmake でのエラー

github.com

Cmake 3.23 で起こる問題なので、ダウングレードしたらうまくいったよ

というヒント。 バージョンは `3.23` ではなかったが、それ以降の最新版だったので、

pip install cmake==3.22

で、3.23 の1つ前のバージョン3.22をインストール

再度、

CMAKE_PREFIX_PATH=${CONDA_PREFIX:-"$(dirname $(which conda))/../"}  python setup.py install

で、何かエラーがでて、再度、`CMAKE_CUDA_COMPILER=/usr/local/cuda/bin/nvcc`を追加して、インストール。

最終、
ninja, cmake==3.22をインストールし、以下のコマンドでインストール成功

CMAKE_CUDA_COMPILER=/usr/local/cuda/bin/nvcc CMAKE_PREFIX_PATH=${CONDA_PREFIX:-"$(dirname $(which conda))/../"} python setup.py install