【画像認識】画像認識のキホン
今何かと流行りの画像認識
今回は画像認識の基本的なことを解説します。
まず、画像認識とは何でしょうか。
「画像認識 (Image Recognition)とは、画像および動画から文字や顔などのオブジェクトや特徴を認識し検出するパターン認識技術の一分野です。」
参考:画像認識 - MATLAB - MathWorks 日本
要は、画像から見つけたいものを見つける技術ということです。
では、どのように見つけるか。
アプローチとしては大きく2つあります。
1.見つけたいものを学習させて見つける方法
2.学習させずに見つける方法
1.見つけたいものを学習させて見つける方法
学習とは、今はやりのDeep Learning等の機械学習があります。
簡単に言うと、見つけたいものの特徴を登録した辞書を学習で作成し、
見つけたいものか判断したい画像に対して作成した辞書との差を求めます。
この「差」とは、どれだけ辞書に登録した特徴と近いかを表した値になります。
そして、値が閾値よりも近ければ見つけたいものであるとして検出するという流れになります。
2.学習させずに見つける方法です。
学習させない方法はいろんな手法があるので一概には言えませんが、
代表的な例ですと、背景差分が有名でしょうか。
背景差分では動体を検知することを目的とし、
背景画像と対象の画像の各画素の輝度差分を求め、
差分が大きい画素(差分が閾値以上)には動体があるものとして判定します。
以上が画像認識のキホンです。
今後も様々な画像認識処理について紹介していく予定です。
OpenCVを使った解説も考えています。