最終的にインストールに失敗したのだが、備忘のために残す
インストール方法
GPUなしのNVIDIA DIGITS3で始めるDeepLearningをとても参考にした
Caffeはすでにインストール済みのため、DIGITSのインストールとCaffeとの連携を設定した
GPUの利用は諦めている
DIGITS
root@ubuntu1404:/usr/local/src# cat digits.sh #!/bin/bash CUDA_REPO_PKG=cuda-repo-ubuntu1404_7.5-18_amd64.deb && wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/$CUDA_REPO_PKG && sudo dpkg -i $CUDA_REPO_PKG ML_REPO_PKG=nvidia-machine-learning-repo_4.0-2_amd64.deb && wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1404/x86_64/$ML_REPO_PKG && sudo dpkg -i $ML_REPO_PKG root@ubuntu1404:/usr/local/src# ./digits.sh ... root@ubuntu1404:/usr/local/src# aptitude update ... root@ubuntu1404:/usr/local/src# aptitude install digits ...
DIGITSとCaffeの連携
root@ubuntu1404:/usr/local/src# cd /usr/share/digits/ root@ubuntu1404:/usr/share/digits# python -m digits.config.edit -v ... ==================================== Caffe ===================================== Where is caffe installed? Suggested values: (U*) [unset] (P) [PATH/PYTHONPATH] <PATHS> >> /usr/local/src/caffe ERROR: Library at "libcaffe.so.1.0.0-rc3" does not have expected suffix "-nv". Are you using the NVIDIA/caffe fork? Invalid input ...
Caffeのインストールに問題が合ったのか不明だが、エラーとなった
このまま進むと以下のようなエラーとなるため、強引ではあるが/usr/bin 配下を変更した
(パッケージ更新の際に消えるはず)
エラー内容
ERROR: Check failed: error == cudaSuccess (35 vs. 0) CUDA driver version is insufficient for CUDA runtime version
/usr/bin 配下を変更
root@ubuntu1404:/usr/bin# which caffe /usr/bin/caffe root@ubuntu1404:/usr/bin# mv caffe caffe.default root@ubuntu1404:/usr/bin# ln -s /usr/local/src/caffe/build/tools/caffe
ディープラーニングする
データセットのダウンロード
root@ubuntu1404:/usr/local/src/data# /usr/share/digits/tools/download_data/main.py mnist mnist ...
データセットを登録し、学習させる
急にエラーとなって動作しなくなったorz。再セットアップすることに
root@ubuntu1404:/usr/local/src/caffe# tail -f /var/log/digits/digits.log ... 2016-04-18 00:26:09 [2314] [INFO] Starting gunicorn 17.5 cudaRuntimeGetVersion() failed with error #35 Default value for caffe_root "<PATHS>" invalid: Library at "not" does not have expected suffix "-nv". Are you using the NVIDIA/caffe fork? Error: No valid default value found for configuration option "caffe_root"