まとめ

完了

このモジュールでは、Python を使用してデータを探索、視覚化、操作する方法について学習しました。 データの探索は、データ サイエンスの中核であり、データ分析と機械学習の重要な要素です。

機械学習は、予測モデリングを扱うデータ サイエンスのサブセットです。 つまり、機械学習では、不明な値を予測するために、データを使用して予測モデルを作成します。 機械学習を利用して、スーパーマーケットで注文する食品の量を予測したり、写真に写っている植物を識別したりすることができます。

機械学習は、植物の高さや色などの特徴を表すデータ値 ("特徴量") と、植物の種類などの予測しようとしている値 ("ラベル") とのリレーションシップを識別することで機能します。 これらのリレーションシップは、"トレーニング" プロセスを通じてモデルに組み込まれます。

課題: 飛行データを分析する

このモジュールの演習で、自分でもデータを調べてみたいと思われた方は、米国運輸省の飛行記録を含む実際のデータセットに挑戦してみてはいかがでしょうか? この課題は、01 - Flights Challenge.ipynb ノートブックにあります。

Note

この課題は省略可能であり、完了までの時間は、このトレーニング モジュールの推定時間には含まれていません。 好きなだけ時間をかけてかまいません。