概要

完了

分類の概要を完了したので、いくつかの重要なポイントをまとめてみましょう。

分類には、従来の回帰と多くの共通点があることを確認しました。 どちらの場合も、教師あり学習、コスト関数を使用し、テストデータセットとトレーニング データセットを使用して実際のパフォーマンスを推定できます。 ここでは、この 2 種類のモデル間のほぼハイブリッドであるロジスティック回帰に焦点を当て、出力のしきい値を設定すると、 avalanche/no-avalancheなどのカテゴリ ラベルがどのように与えるかを示しました。

特に、関係するコスト関数は直感的でないことが多いため、分類モデルの評価が回帰モデルよりも若干困難になる可能性がある方法について説明しました。

また、特徴の追加と結合によってモデルが大幅に改善される方法についても説明しました。 重要なのは、データが何を意味するのかを本当に考えているのが、最良の結果を達成するための鍵であることを示しました。

このモジュールでは、ロジスティック回帰を使用しました。 ただし、ここで取り上げた主題のほとんどは、2 つ以上の可能なカテゴリを予測しようとするモデルを含む、他の多くの種類の分類モデルにも適用されます。