転移学習

完了

多くの場合、類似の譲渡可能なスキルに関する専門知識を既に持っている場合は、新しいスキルを習得する方が簡単です。 たとえば、既に車の運転方法を学習している場合は、バスの運転方法を誰かに教える方が簡単でしょう。 ドライバーは、既に車で学習した運転スキルに基づいて構築し、バスの運転に適用できます。

転移学習と呼ばれる手法を使用して、ディープ ラーニング モデルのトレーニングにも同じ原則を適用できます。

転移学習のしくみ

画像分類用の畳み込みニューラル ネットワーク (CNN) は、通常、特徴を抽出する複数のレイヤーで構成され、最終的に完全に接続されたレイヤーを使用して、これらの特徴に基づいて画像を分類します。

特徴抽出レイヤーのセットと完全に接続された予測レイヤーで構成される CNN

概念的には、このニューラル ネットワークは、2 つの異なるレイヤー セットで構成されています。

  1. 特徴抽出を実行する基本モデルからのレイヤーのセット。
  2. 抽出された特徴を受け取り、クラス 予測に使用する完全に接続されたレイヤー。

特徴抽出レイヤーでは、畳み込みフィルターとプーリングを適用して、画像内のエッジ、コーナー、およびその他のパターンを区別するために使用できます。理論上は、ネットワークの入力層と同じ寸法の画像のセットに対して機能する必要があります。 予測レイヤーは、画像の分類に使用する各クラス ラベルの確率を表す一連の出力に特徴をマップします。

ネットワークをこれらの種類のレイヤーに分離することで、既にトレーニング済みのモデルから特徴抽出レイヤーを取得し、1 つ以上のレイヤーを追加して、抽出された特徴を使用して画像の適切なクラス ラベルを予測できます。 このアプローチでは、特徴抽出レイヤーの事前トレーニング済みの重みを保持できます。つまり、追加した予測レイヤーのみをトレーニングする必要があります。

画像分類用に確立された畳み込みニューラル ネットワーク アーキテクチャが多数存在し、転送学習の基本モデルとして使用できるため、他のユーザーが既に行った作業を基にして、効果的な画像分類モデルを簡単に作成できます。