【ディープラーニング 転移学習】深層学習の計算コストを下げれる「転移学習」とは？転移学習で使う「学習済みモデル」の代表例とその入手方法とは？【機械学習 転移学習】

サクッとわかる人工知能第２巻: ディープラーニングの祖先を「改良」する (ミント出版)

画像処理　１番最初の入門書画像処理シリーズ (ミント出版)

初めてのTensorFlow 数式なしのディープラーニング

本記事の概要 [表示]

【ディープラーニング転移学習】深層学習の計算コストを下げれる「転移学習」とは？転移学習で使う「学習済みモデル」の代表例とその入手方法とは？【機械学習転移学習】

転移学習（Transfer Learning）とは？

「転移」とは、何かを移すことを言います。

何を移すかというと、ズバリ、学習済みの結果です。

ディープラーニングの学習は、

重みの決定

と言い換えることができます。

１つのディープラーニングモデルの中に、

重みは数十のものから、数百万のものなど様々なものがあります。

データをもとにして、重みを決定するのがディープラーニングと言えます。

では、あるディープラーニングモデルを計算して、

学習を完了したものがあるとします。

そのデータでの最適な重みがわかっている状態です。

例えば、犬、猫を分類する画像認識をディープラーニングで実現したとします。

学習後には、犬、猫を分類できる「重み」が得られています。

この重みを使うことで、新しい犬や猫の入力画像が、犬か猫のどちらかを分類することができます。

ここまでは普通のディープラーニングの分類問題になります。

では、転移学習ではどう考えるのでしょうか？

転移学習では、

犬、猫で学習した特徴は、

他の動物の分類にも使えるんじゃないの？

という発想があってもいいですよね。

犬猫で学習した重みには、

他の動物の違いを表現する情報も（部分的には）含んでいる

とみなすこともできます。

これが「転移学習」のアイデアになります。

つまり、「転移学習」では、

すでに学習済みのモデル（重み）を使い、

新しいタスクについての重みを

「そのまま使う」

もしくは

「再調整」する

ということが行われます。

重みやディープラーニングのネットワーク構造について、

ゼロから計算したり検討する必要がないので、

計算コストを大きく下げることが可能です。

以上から、転移学習で必要になるのは、

学習済みのモデル

ということになります。

そこで次は、私たちが手に入れることのできる

学習済みモデルの代表的なものについて、

サクッとご紹介します。

学習済みモデルを使うことで、

あなたのディープラーニングが大きく加速するはずです。

学習済みモデルの代表例とは

InceptionV3

2014年の画像認識コンペ（ILSVRC）の分類部門で優勝したモデルになります。

1000種類ものラベルについて分類するタスクで好成績を収めています。

Inceptionモデルの初期モデルは、GoogLeNetと呼ばれます。

その名の通り、Googleが出した学習済みモデルになります。

この学習済みモデルに、新しい画像を入力すると、

入力画像の特徴が学習されていれば、

適切な分類結果をサクッと得られることになります。

Xception

こちらはInceptionモデルの改良モデルです。

ディープラーニングのフレームワーク「Keras」の作者でもあるFrancois Cholletが提案したモデルになります。

畳み込み計算の効率化を検討したモデルになっています。

ResNet50

2015年の画像認識コンペ（ILSVRC）の分類部門、物体検知部門で優勝したモデルになります。

Residualブロックを使い、より深い構造を実現しています。

こちらは、Microsoftが出した学習済みモデルになります。

VGG16, VGG19

オックスフォード大学が出した学習済みモデルで、

ILSVRCでも優秀な結果を残したモデルになります。

１６層（VGG16）、１９層（VGG19）などがあります。

といった感じで、

様々な学習済みモデルが公開されており、

私たちはこれらをスタートにして、

転移学習することで、効率的にディープラーニングを行うことができます。

とはいっても、上で示した学習済みモデルは、

どれも画像認識用のものでした。

ディープラーニングには、その他にも、

自然言語処理
音声認識

などの他のタスクでも活用されています。

画像認識だけじゃなく、

自然言語処理や音声認識でも使える

学習済みモデルはないの？

と思われる方も多いかと思います。

実は、ディープラーニングの学習済みモデルを集めたサイトがあり、

オープンな学習済みモデルをサクッと探し、ラクに活用することができます。

学習済みモデルを気軽に検索・活用できる「Model Asset Exchange（MAX）」とは

「Model Asset Exchange(MAX)」とは、

学習済みのディープラーニングモデルを集めたサイトです。

誰でもサクッと使えるオープンなもの

を集めています。

サイトはこちらになります。

上で紹介した画像認識用のモデルだけでなく、

音声認識、自然言語処理に関する学習済みモデルなど、３０種類まとめられています。

中には少しマニアックなものもあるようですが、

うまく活用されていくことで、

ディープラーニングの裾野が広がっていくのではないかと思います。

（こちらについては、別記事で詳しくまとめる予定です。SNSなどフォローしておいてもらえると見逃さないかと思います。）

というわけで、本記事では、

ディープラーニングの計算量を抑えながら、

よい性能も出せる学習方法

「転移学習」

についてサクッと説明しました。

また、転移学習で使える

「学習済みモデル」

の代表的なものをサクッと示しました。

最後に、学習済みモデルを集めたオープンなサイト

Model Asset Exchange(MAX)

についてサクッとご紹介しました。

こちらもございます↓

リックテレコム

カラー図解 Raspberry Piではじめる機械学習基礎からディープラーニングまで (ブルーバックス 2052)

講談社

TensorFlowではじめるDeepLearning実装入門 impress top gearシリーズ

インプレス

詳解ディープラーニング第2版 ~TensorFlow/Keras・PyTorchによる時系列データ処理~ (Compass Booksシリーズ)

マイナビ出版

現場で使える! Python深層学習入門 Pythonの基本から深層学習の実践手法まで (AI & TECHNOLOGY)

翔泳社

現場で使える！TensorFlow開発入門 Kerasによる深層学習モデル構築手法

翔泳社

PythonとKerasによるディープラーニング

マイナビ出版

『「機械学習」に関する記事のまとめ（目次）はこちらからどうぞ』

こちらもございます↓

『「画像処理」や「画像認識」に関する記事の一覧（目次）はこちらです』

『「Python」に関する記事の一覧はこちらです』

『「数学」の記事一覧をこちらにまとめました』

↓こちら無料で読めます

人工知能　１番最初の入門書: ディープラーニングの祖先を理解する (ミント出版)

ミント出版

サクッとわかる人工知能第２巻: ディープラーニングの祖先を「改良」する (ミント出版)

画像処理　１番最初の入門書画像処理シリーズ (ミント出版)