転移学習

完了

生活の中では、同様の転移可能なスキルに関する専門知識を既に持っていれば、新しいスキルを習得するのが簡単になります。 たとえば、バスの運転方法を教えるのは、その人が自動車の運転方法を既に習得している場合の方が簡単でしょう。 このドライバーは、自動車で既に学習した運転技術を基礎として、それをバスの運転に適用します。

同じ原則が、"転移学習" と呼ばれる手法を使用したディープ ラーニング モデルのトレーニングにも適用できます。

転移学習のしくみ

画像分類用の畳み込みニューラル ネットワーク (CNN) は、通常、特徴を抽出する複数の層で構成され、最後の完全に接続された層でこれらの特徴に基づいて画像を分類します。

A CNN consisting of a set of feature extraction layers and a fully-connected prediction layer

概念的には、このニューラル ネットワークは、次の 2 つの異なる層のセットで構成されています。

  1. "特徴の抽出" を実行する基本モデルの層のセット。
  2. 抽出された特徴を受け取り、それらを使用してクラスを "予測" する、完全に接続された層。

特徴抽出層は、畳み込みフィルターとプーリングを適用して、区別に使用できる画像のエッジ、角、およびその他のパターンを強調します。また、理論的には、ネットワークの入力層と同じ次元を持つ画像のセットに対しても機能します。 予測層では、各特徴を、画像の分類に使用する各クラス ラベルの確率を表す一連の出力にマップします。

ネットワークをこのような種類の層に分割することにより、既にトレーニング済みのモデルから特徴抽出層を取得し、1 つまたは複数の層を追加して、画像の適切なクラス ラベルを予測するために抽出された特徴を使用することができます。 この方法では、特徴抽出層の事前トレーニング済みの重みを維持することができます。つまり、追加した予測層をトレーニングするだけで済みます。

画像分類用に確立された畳み込みニューラル ネットワーク アーキテクチャは多数あり、転移学習の基本モデルとして使用できます。そのため、他のユーザーが既に実行した作業に基づいて、効果的な画像分類モデルを簡単に作成できます。