GPUなしのDIGITS

最終的にインストールに失敗したのだが、備忘のために残す

インストール方法

GPUなしのNVIDIA DIGITS3で始めるDeepLearningをとても参考にした
Caffeはすでにインストール済みのため、DIGITSのインストールとCaffeとの連携を設定した
GPUの利用は諦めている

DIGITS

root@ubuntu1404:/usr/local/src# cat digits.sh
#!/bin/bash

CUDA_REPO_PKG=cuda-repo-ubuntu1404_7.5-18_amd64.deb &&
    wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/$CUDA_REPO_PKG &&
    sudo dpkg -i $CUDA_REPO_PKG

ML_REPO_PKG=nvidia-machine-learning-repo_4.0-2_amd64.deb &&
    wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1404/x86_64/$ML_REPO_PKG &&
    sudo dpkg -i $ML_REPO_PKG

root@ubuntu1404:/usr/local/src# ./digits.sh
...

root@ubuntu1404:/usr/local/src# aptitude update
...

root@ubuntu1404:/usr/local/src# aptitude install digits
...

DIGITSとCaffeの連携

root@ubuntu1404:/usr/local/src# cd /usr/share/digits/
root@ubuntu1404:/usr/share/digits# python -m digits.config.edit -v
...
==================================== Caffe =====================================
Where is caffe installed?

        Suggested values:
        (U*) [unset]
        (P)  [PATH/PYTHONPATH] <PATHS>
>> /usr/local/src/caffe
ERROR: Library at "libcaffe.so.1.0.0-rc3" does not have expected suffix "-nv". Are you using the NVIDIA/caffe fork?
Invalid input
...

Caffeのインストールに問題が合ったのか不明だが、エラーとなった
このまま進むと以下のようなエラーとなるため、強引ではあるが/usr/bin 配下を変更した
(パッケージ更新の際に消えるはず)

エラー内容

2016-04-17_210825

ERROR: Check failed: error == cudaSuccess (35 vs. 0) 
CUDA driver version is insufficient for CUDA runtime version

/usr/bin 配下を変更

root@ubuntu1404:/usr/bin# which caffe
/usr/bin/caffe
root@ubuntu1404:/usr/bin# mv caffe caffe.default
root@ubuntu1404:/usr/bin# ln -s /usr/local/src/caffe/build/tools/caffe

ディープラーニングする

データセットのダウンロード

root@ubuntu1404:/usr/local/src/data# /usr/share/digits/tools/download_data/main.py mnist mnist
...

データセットを登録し、学習させる

2016-04-17_205646

2016-04-17_205914

2016-04-17_210001

2016-04-17_210311

2016-04-17_210414

2016-04-17_210653

2016-04-17_220548

急にエラーとなって動作しなくなったorz。再セットアップすることに

2016-04-18_003000

root@ubuntu1404:/usr/local/src/caffe# tail -f /var/log/digits/digits.log
...
2016-04-18 00:26:09 [2314] [INFO] Starting gunicorn 17.5
cudaRuntimeGetVersion() failed with error #35
Default value for caffe_root "<PATHS>" invalid:
        Library at "not" does not have expected suffix "-nv". Are you using the NVIDIA/caffe fork?

Error: No valid default value found for configuration option "caffe_root"