【画像認識】「Caffe」をWindowsで使う!MNISTデータ準備編
はじめに
こんばんは!
私は、昨日今日とSSIIに参加しています。
SSIIには初めて参加するんですが、
とてもコアな学会だな
というのが一番の印象です。
正直、わからない言葉の連発で頭が痛くなります。(^_^;
そういうこともあって、もっと勉強しなきゃという気にさせてもらえます。
なんでSSIIの話をしたのかというと、
SSIIの中で「Deep Learning」が様々な研究で使用されており、
今私が試している「Caffe」ももちろん紹介されていました。
つまり、今後の画像認識の主流となるであろうDeep Learningが
どれだけ学術研究で使用されているのかということを再認識していただければと思った次第です。
Caffeを使う
今回は、Caffeを使用して、MNISTを試してみます。
MNISTに関してはこちら
CaffeのWindowsの環境構築は、以下記事を参考にしてください。
環境構築が済んだことを前提に、MNISTを動かしてみます。
まず、MNISTのデータをこちらからダウンロードします。
【ダウンロードするファイル】
- train-images-idx3-ubyte.gz
- train-labels-idx1-ubyte.gz
- t10k-images-idx3-ubyte.gz
- t10k-labels-idx1-ubyte.gz
ダウンロードしたファイルは、7zip等のツールを使用して解凍します。
解凍するとおそらく以下のようなファイルができます。
- train-images.idx3-ubyte
- train-labels.idx1-ubyte
- t10k-images.idx3-ubyte
- t10k-labels.idx1-ubyte
このままでは、Caffeで使用できません。
なので、以下のバッチ処理を実行し、Caffeで使用可能なデータ形式に変換します。
※ちなみに、「convert_mnist_data.exe」は前回ビルドして生成されたフォルダ内に作られています。
SET EXE=≪ご自身の環境に合わせてください≫\Release\convert_mnist_data.exe SET ROOT=≪ご自身の環境に合わせてください≫\examples\mnist\data %EXE% %ROOT%\train-images.idx3-ubyte %ROOT%\train-labels.idx1-ubyte %ROOT%\mnist_train_lmdb --backend=lmdb %EXE% %ROOT%\t10k-images.idx3-ubyte %ROOT%\t10k-labels.idx1-ubyte %ROOT%\mnist_test_lmdb --backend=lmdb pause
成功すると、以下フォルダが生成され、
各フォルダ内に、「data.mdb」と「lock.mdb」ファイルが格納されています。
ちょっと長くなったので、
実行方法は次回にします。
関連記事
qstairs.hatenablog.com
qstairs.hatenablog.com
qstairs.hatenablog.com