人工知能技術の進歩とともに、
画像認識をやってみたい!
という方も多いかと思います。
今回は、画像認識の特徴量について、
特に「局所特徴」についてまとめたいと思います。
局所特徴は、特徴量の最も基本的なもので、
さらに発展的な特徴量の基礎となっています。
物体検出をディープラーニングでやりたい!
R−CNNでCNN特徴を使うんだけど、なにこれ?
といった方も、
まずは局所特徴を学ぶことで、
応用的な特徴量も理解が促進されるはずです。
というわけで、本記事では、
画像認識の特徴量の基本「局所特徴」について
サクッと初心者の方にもわかりやすいようにまとめたいと思います。
本記事の概要
「画像認識」の「特徴量」(1):「局所特徴」ってなに?メリットは?どんな性質が必要なの?についてまとめました
初心者の方向けに、まず、画像認識について
補足しておきますね。
画像認識とは
- 画像の中の物体を理解すること
と言えます。
例えば、画像の中の人や物を入力すると、
出力として、人がいる、コップがある
が得られる技術のことになります。
画像の内容を理解するためには、
画像の特徴をつかむ必要があります。
じゃあ、
- 画像の特徴ってなんだろう?
って思われる方も多いかと思います。
そこで本記事で、
特徴量の1つで、1番基礎となる
- 局所特徴
について紹介します。
じゃあ、以下で、
- 局所特徴ってなに?
- 局所特徴を使うメリットは?
- 局所特徴ってどんな性質が必要なの?
についてまとめていきますね。
画像認識の特徴量:「局所特徴」とは?
局所特徴とは、一言でいうと、
画像全体の中の一部分から得られる特徴のことです。
局所特徴の反対のものとして、全体特徴もあります。
例えば、人が立っている画像を考えてみます。
人の画像では、人の頭や腕など、
体のそれぞれの部分部分が、特徴的な形になっています。
この画像の局所特徴は?と言われたら、
体の各部分のみの範囲を考えて抽出した特徴
ということになります。
人の頭・腕・足などは、例えば、
本やパソコン、車などと比べてみると、
違った特徴だとわかっていただけるかと思います。
この違いを利用して、画像の認識ができるようになります。
ちなみに、画像の全体特徴は、
人の立っている画像全体から得られる特徴になります。
頭も腕も足もすべて含んだ特徴となります。
局所特徴を使うメリットは?
- 全体特徴にも、局所特徴の情報が入ってるんじゃないの?
- だったら、どっちでも同じじゃないの?
と思われる方もおられるかもしれません。
実は、局所特徴の方が画像認識する上では有利なんです。
その理由を説明しますね。
例えば、人と車と荷物が写ってる画像の特徴量を考えてみますね。
この画像の局所特徴は、
- 人の頭・腕・足
- 車のナンバー・フロントガラス・タイヤ・・・
- 荷物の形・色・ロゴ・・・
などになります。
それに対して、
全体特徴では、人と車と荷物のすべてを含んだ特徴となります。
局所特徴と全体特徴の違い
それでは、2枚の画像について考えてみます。
- 人だけが映った画像(左)
- 人・車・荷物が映った画像(右)
についてです。
人だけが映った画像の局所特徴は、
頭や腕などでした。
人・犬・車が映った画像の、
人の部分の局所特徴は、頭や腕などです。
つまり、
- どちらも人の局所特徴は(ほぼ)同じ
と考えられます。
人が他のものと一緒に写ったからといって、
腕や足が大きく変化するわけではないですよね。
それに対して、
2つの画像の全体特徴を比べてみると、
まったく違うものになります。
つまり、
人という同じ特徴を持つ部分を含んでいても、
全体特徴では似ていないため、認識できない
ということになります。
以上から、特徴を小さくすることで、
様々な画像での汎用的な特徴として利用できる
ということがわかります。
これが局所特徴を使うメリットになります。
といっても、
- 人の画像にもいろいろあるんじゃない?
- 走ってる人と体育座りをしている人の局所特徴は違うんじゃない?
といった疑問があるかと思います。
実は、局所特徴をうまく活用するためには、
必要な条件がありますので、
それをまとめたいと思います。
局所特徴に必要な性質とは
人を例に説明していきますね。
(1), 再現性
上で、人の局所特徴量は、頭や手と書きました。
でも、画像によっては、頭や手が映っていない人の画像もありますよね。
なので、局所特徴として活用するためには、
画像の中に共通して存在している必要があります。
これを「再現性」といいます。
(2), 弁別性
人の頭とマネキンの頭は、とても似ていますよね。
これらを区別したいなら、
画像自体に区別できるだけの情報が含まれている必要があります。
これを「弁別性」といいます。
(3), 頑健性
人の頭とマネキンの頭を区別できるだけの写真を撮リました。
しかし、出来上がった画像は、手ブレしていたり、影など邪魔となるノイズが入っていました。
画像にノイズやブレなどがあると、
ノイズのある画像の頭と、ノイズのない画像の頭が違って見えることがあります。
局所特徴には、このようなノイズに負けない特徴っを持つ必要があります。
これを「頑健性」といいます。
(4), 不変性
人の頭でも、
- 正面から見た時
- 横から見た時
- 斜め上から見た時
など、視点を変えると違って見える場合があります。
局所特徴には、たとえ視点を変えたとしても、
それらは頭だ、という特徴を持っている必要があります。
これを「不変性」といいます。
このように、局所特徴には、
- 共通して現れる情報であること「再現性」
- 区別できるだけの情報があること「弁別性」
- ノイズなどに負けないこと「頑健性」
- 視点の変化などに負けないこと「不変性」
といった性質が必要になります。
じゃあ、これらを満たすような局所特徴って、
画像から、どうやって抽出するの?
って思われる方も多いかと思います。
その辺を次の記事でまとめたいと思います。
こちらもございます↓
本書は、画像処理を学んでみたい
- 画像処理の初学者の方
- 入門書を読んだけど難しかった方
- 画像処理で挫折した方
向けに、
- 画像データの感覚
- 画像データの扱い方のイメージ
をつかむことで、
入門書を読み解ける基礎力をつけれるようになる1冊です。
ちなみに本書は、Kindle Unlimitedの登録することで、
- 無料で読むことが可能
です。
お試し登録(解約できて無料)をしてみてはいかがでしょうか(初回30日間無料で体験できます)↓
こちらもございます↓
『 画像処理・画像認識の記事のまとめ(目次)一覧はこちらにございます 』