前回は、画像認識をするためには、
画像の特徴が必要という内容でした。
画像の中に写っているものの「局所特徴」をとらえることで、
様々な画像認識を行うことができることを説明しました。
『「画像認識」の「特徴量」(1):「局所特徴」ってなに?メリットは?どんな性質が必要なの?についてまとめました』
しかし、局所特徴はどうやって見つければいいの?
という話はしていませんでした。
そこで本記事では、
特徴量はどうやって抽出するの?
について、具体的には、
「エッジ検出」
を解説します。
加えて、エッジ検出で使う
「空間フィルタ」
についてもサクッと説明したいと思います。
その後、エッジ検出のいくつかの発展バージョンも簡単にご紹介します。
本記事の概要
「画像認識」の「特徴量」(2):「エッジ検出」とは?どんな仕組み?「空間フィルタ」とは?どう使っているの?についてまとめました
エッジ検出とは?
エッジという言葉は、「縁」の意味があります。
例えば、白い壁の部屋に黒い犬が映った画像では、
犬の黒色と背景の白色の違いを区別できれば、
犬を抽出できますよね。
”色が黒の部分だけ抜き出す”
みたいなプログラムをかけば、認識が完了です。
でもこれだと、他の画像では使えそうにありませんよね。
もっと汎用的な仕組みにしたいわけです。
そこで、ものの輪郭(エッジ)を認識する方法はないかな?
と考えてみます。
すると、いろいろな画像で物体の輪郭(エッジ)という特徴を調べることができますよね。
この技術の1つが「エッジ検出」になります。
以下では、
- エッジ検出の仕組み
- エッジ検出に欠かせない「空間フィルタ」について
- 空間フィルタの使われ方の原理
- なぜ空間フィルタを使うとよいのか
など、具体例をわかりやすい図で示しながら、解説しています。
また、数式を使わずに書いているので、数学の苦手な方でも安心です。
また、空間フィルタと関係が深いことから、
ディープラーニングでもよく聞く「畳み込み」についても理解できる内容となっています。
畳み込みは英語でコンボリューション(Convolution)なので、
CNN(畳み込みニューラルネットワーク)と呼ばれたりします。
画像処理をよくやるけど、
- エッジ検出ってどんな仕組みなんだろう?
といった方や、
- ディープラーニングの仕組みを学ぶための基礎力をつけておきたい
方にもおすすめの内容となっています。
この先は会員限定になります。
会員の方はログインをお願いいたします。
登録がまだの方は、会員登録をお願いします。
>>> 会員登録はこちら
↓こちら無料で読めます