「画像認識」に必要な「画像データ」とは？どうやって集めればいいの？有名な画像データとは？といった点を知りたいあなたはこちらをどうぞ【画像データセット】

サクッとわかる人工知能第２巻: ディープラーニングの祖先を「改良」する (ミント出版)

画像処理　１番最初の入門書画像処理シリーズ (ミント出版)

『「クローリング」や「スクレイピング」を学びたいあなたにおすすめの本、８冊＋α はこちらです』

本記事の概要 [表示]

「画像認識」に必要な「画像データセット」とは？どうやって集めればいいの？有名な画像データセットとは？といった点を知りたいあなたはこちらをどうぞ【画像データセット】】

画像データセットに必要な条件とは？

画像認識をするには、画像データが必要、と書きました。

インターネットやSNSなどには大量の画像があるので、

クローリングやスクレイピングすればいいんじゃないの？

と思われるかもしれません。

クローリングやスクレイピングって何？って方はこちら↓

しかし、画像認識システムを作る時の画像データとしてはこれでは不十分なんです。

え？なんで？

と思われるかもしれません。

画像認識で必要とする画像データには、

必要な条件があるからです。

画像認識に適切な画像データとは、

画像
それが何の画像かのラベル

の２点がセットになっているものになります。

具体的に言うと、例えば、

「犬」の画像には、正解ラベルとして「犬」
「猫」の画像には正解ラベルとして「猫」
「コップ」の画像には正解ラベルとして「コップ」

・・・・

のように、

画像と正解ラベルがセットになったもの

というわけです。

画像認識のための画像データセットはどうやって集めるの？

多くの人が画像認識を行っていますが、

1人ひとりがそれぞれ画像とラベルを手作業で作っていったら、非効率的ですよね。

大量のラベル付け作業は、なるべく避けたいものです。

そこで役立つのが、

既にラベル付けされた画像データセットです。

画像認識のコミュニティでは、

いくつかの画像データセットが、無料で公開されています。

それらを使えば、画像認識モデルを作ることができる、というわけです。

ちなみに、どうしても独自データを作成したい！

という場合には、

クラウドソーシングなどを使うことで、

ラベル付けを安価にやってもらうことも可能です。

例えば、以下の書籍などがございます↓

ヒューマンコンピュテーションとクラウドソーシング (機械学習プロフェッショナルシリーズ)

講談社

人工知能　１番最初の入門書: ディープラーニングの祖先を理解する (ミント出版)

というわけで、ここでは有名な画像データセットについて紹介します。

画像認識に使える、有名な画像データセットとは

もっとも有名なものの１つに、手書き数字のデータセットがあります。

MNIST, Extended MNIST

６万枚もの手書き数字（0から9）の画像が、

その答えラベル（0から9）とともにまとめられています。

画像認識の練習問題としてよく出てくるタスクの１つとなっています。

画像サイズは28×28で、グレースケール画像です。

MNISTは、Modified National Institute of Standards and Technology の略で、

画像数を増やした、Extended MNIST (EMNIST)も作成されています。

EMNISTは、28万の手書き数字と英文画像のデータセットになっています。

CIFAR-10

６万枚の一般的な物体の画像データセットです。

CIFAR-10の10は、クラスが10種類であることを表しています。

クラスには、

飛行機, 車, 船, トラック
鳥, ネコ, 鹿, 犬, カエル, 馬

の１０種類があります。

６万枚の画像をこの１０種類に分類できるように画像認識器を学習させることができます。

画像サイズは32×32で、カラー画像になっています。

CIFAR-100

CIFAR-10を拡大したデータセットです。

100種類のクラスラベルが付けられており、

それぞれに600枚の画像データセットがあります。

加えて、20種類のスーパークラスのラベルもあります。

一枚の画像には、

より抽象度の高いスーパークラスのラベル(coarse label)
より具体的なクラスのラベル（fine label）

の２種類のラベルがあるわけです。

画像サイズは32×32で、カラー画像になっています。

ImageNet

約1420万枚もの巨大な画像データセットです。

２万種類以上のラベルが使って分類されています。

また、少なくとも100万種類には、バウンディングボックスの情報も示されています。

（バウンディングボックスとは、物体検出で使われる

画像中に物体がある領域を示した四角の箱のことです。）

ちなみに、画像認識コンテストの１つである

ILSVRC : the ImageNet Large Scale Visual Recognition Challenge

でも使われています。

冒頭で述べた、ディープラーニングの画像認識精度の大幅な向上は、このコンテストで示されました。

ちなみに、こんな大きな画像データにラベルをつけるなんてすごいと思われるかもしれませんが、

ラベル付けにはクラウドソーシングの１種であるAmazon Mechanical Turkが使われました。

そこで活躍するラベル付けの職人さんは、

平均的には、１分間に５０枚ものラベルをつけるそうです。

というわけで、本記事では、

画像認識には、どんな画像データが必要なの？
画像データを得たいんだけど、どうしたらいいの？
有名な画像データセットって？

といった画像データセットについて、サクッとまとめました。

↓こちら無料で読めます

ミント出版

サクッとわかる人工知能第２巻: ディープラーニングの祖先を「改良」する (ミント出版)

画像処理　１番最初の入門書画像処理シリーズ (ミント出版)

アマゾン Kindle Unlimited はこちら

ちなみにこちらでご紹介したシリーズは、Kindle Unlimitedの登録することで、

無料で読むことが可能です。

お試し登録（解約できて無料）をしてみてはいかがでしょうか（初回３０日間無料で体験できます）↓

Google Cloud AutoML Vision入門画像認識・機械学習・AIを使ったウェブサイトやアプリをつくる

秀和システム

OpenCV4基本プログラミング: さらに進化した画像処理ライブラリの定番

カットシステム

今すぐ試したい! 機械学習・深層学習(ディープラーニング) 画像認識プログラミングレシピ

秀和システム

Rによる画像処理と画像認識:動かしながらしくみを理解する

森北出版

秀和システム

詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識

オライリージャパン

医療AIとディープラーニングシリーズ標準医用画像のためのディープラーニング: 入門編 (医療AIとディープラーニングシリーズ No. 2)

オーム社