ハイパーパラメーターを使用してモデルを改善する

完了

データセットが小さい単純なモデルは、多くの場合、1 つのステップに収まりますが、データセットが大きくモデルが複雑な場合は、モデルとトレーニング データを繰り返し使用し、出力を予想されるラベルと比較して適合させる必要があります。 予測が十分に正確である場合は、モデルがトレーニング済みと見なされます。 そうでない場合は、モデルを少し調整し、もう一度ループします。

ハイパーパラメーターは、そのループ中のモデルの適合方法を変更する値です。 たとえば、学習率は各トレーニング サイクル中にモデルをどの程度調整するかを設定するハイパーパラメーターです。 学習率が高いということは、モデルをより速くトレーニングできるという意味ですが、高すぎる場合は調整が非常に大きくなり、モデルが "微調整" されず、最適になりません。

データの前処理

前処理とは、データがモデルに渡される前に行う変更を指します。 以前、前処理にはデータセットのクリーニングが含まれる可能性があることを説明しました。 これは重要ですが、前処理にはモデルの使用が簡単になるように、データの形式の変更も含まれる可能性があります。 たとえば、"red"、"orange"、"yellow"、"lime"、"green" と記述されているデータは、赤の量と緑の量を示す数値など、コンピューターによりネイティブな形式に変換すると、よりうまく機能する可能性があります。

スケーリング機能

最も一般的な前処理手順は、特徴が 0 と 1 の間に入るようにスケーリングすることです。 たとえば、自転車の重量と人が自転車で移動する距離の 2 つの数値は非常に異なる場合がありますが、両方の数値を 0 と 1 の間にスケーリングすることで、モデルはデータからより効果的に学習できます。

カテゴリを特徴として使用する

機械学習では、"bicycle"、"skateboard"、"car" などのカテゴリ別特徴量を使用することもできます。これらの特徴量は one-hot ベクトルで 0 または 1 の値で表されています。このベクトルは、可能な各値に対して 0 または 1 を持つベクトルです。 たとえば、bicycle、skateboard、car はそれぞれ (1,0,0)、(0,1,0)、(0,0,1) になります。