新しい回帰モデルを検出する

完了

ユニット 2 では、データ ポイントに直線を適合させる方法について説明しました。 しかし、回帰は、複数の要因を持つものや、1 つの要因の重要性が別のものに依存するものなど、さまざまな種類の関係に適合する可能性があります。

モデルを使用した実験

回帰モデルは、多くの場合、小規模なデータ サンプルで動作し、堅牢で解釈が容易で、さまざまな種類が存在する場合に選択されます。

線形回帰は最も単純な回帰形式で、使用される特徴の数に制限はありません。 線形回帰には多くの形式があります。多くの場合、使用される特徴量の数と、適合する曲線の形状によって名前が付けらます。

デシジョン ツリーでは、変数を予測するためのステップ バイ ステップのアプローチが採用されています。 自転車の例で考える場合、デシジョン ツリーは最初にサンプルを春/夏と秋/冬の期間に含まれるものに分割し、曜日に基づいて予測を行うことができます。 春/夏の月曜日は自転車レンタル率が 1 日あたり 100 で、秋/冬の月曜日はレンタル率が 1 日あたり 20 であるかもしれません。

アンサンブル アルゴリズムは、1 つだけのデシジョン ツリーではなく、多数のツリーを構築し、より複雑なデータに対するより優れた予測を可能とします。 ランダム フォレストなどのアンサンブル アルゴリズムは、その強力な予測能力のため、機械学習やデータ サイエンスで広く使用されています。

データ サイエンティストは、多くの場合、さまざまなモデルを使用して実験を行います。 次の演習では、さまざまな種類のモデルで実験して、同じデータに対するパフォーマンスを比較します。