機械学習のデータ サイエンスについて

初級
AI エンジニア
データ サイエンティスト
開発者
学生
Azure

Microsoft Learn では、対話的な方法で、従来の機械学習の概要を理解することができます。 これらのラーニング パスは、ディープ ラーニングのトピックに移行するための優れた基盤にもなり、各自の生産性を向上させます。

最も基本的な従来の機械学習モデルから、探索的データ分析やカスタマイジングのアーキテクチャまで、ブラウザーを離れることなく、概念的内容や対話型の Jupyter Notebook を簡単に把握することができます。

知識と興味に応じて自分のパスを選択してください。

オプション 1: 完全なコース: 機械学習のためのデータ サイエンスの基礎

ほとんどのユーザーには、このパスがお勧めです。 これには、概念の理解を最大限に高めるカスタム フローを備えた、他の 2 つのラーニング パスと同じモジュールがすべて含まれています。 基になる概念と、最も一般的な機械学習ツールでモデルを構築する方法について知りたい場合は、このパスを使用してください。 また、従来の機械学習からの移行を予定していて、ディープ ラーニングとニューラル ネットワーク (ここでのみ紹介します) について知りたい場合にも、このパスが最適です。

オプション 2: "機械学習のデータ サイエンスについて理解する" ラーニング パス

機械学習のしくみについて知りたいが、あまり数学的な知識がない場合は、このパスを使用してください。 過去の知識 (コーディングの概念の簡単な知識は必要です) については問わず、コード、メタファー、ビジュアルについてのアハ体験を提供します。 実践的な内容ですが、使用可能なツールとライブラリの機能よりも基礎の理解に重点を置いています。

✔ 現在、このパスにいます。開始するにはスクロールしてください。

✔オプション 3: "機械学習モデルの作成" のラーニング パス

機械学習についてある程度理解している場合や、数学的な知識が豊富である場合は、"機械学習モデルの作成" のラーニング パスにすぐに移動することをお勧めします。 これらのモジュールは、機械学習の概念のいくつかを学習しますが、すぐに移動することで、scikit-learn、TensorFlow、PyTorch などのツールを使用できます。 このラーニング パスは、Azure ML や Azure Databricks などの製品の機械学習の例を理解するのに十分な知識をお求めの方にも最適です。

前提条件

なし

このラーニング パス内のモジュール

コンピューター サイエンスおよび統計学に関する知識がほとんど、またはまったくない方向けの機械学習の概要。 ここでは、いくつかの本質的な概念を紹介し、データについて調べ、Python を使用して、実世界と同じように機械学習モデルのトレーニング、保存、使用を行う、機械学習のライフサイクル全体を対話形式で体験します。

教師あり学習は、データの例からアルゴリズムに学習させる機械学習の一形態です。 教師あり学習によって、現実世界に関する予測を行えるモデルが自動的に生成されるしくみについて、段階的に詳しく説明します。 また、これらのモデルをテストする方法と、それらのトレーニング時に発生する可能性のある問題についても言及します。

機械学習モデルの力は、それらのモデルをトレーニングするために使用されるデータから生み出されます。 コンテンツと演習を通して、データを理解する方法、コンピューターが正しく解釈できるようにデータをエンコードする方法、エラーを取り除く方法のほか、高パフォーマンス モデルの作成に役立つヒントについて説明します。

回帰は、ほぼ間違いなく、最も広く使用されている機械学習手法であり、科学的発見、ビジネスプランニング、株式市場分析の共通の基盤になっています。 この学習資料では、単純なものと複雑なもの両方の回帰分析について詳しく説明し、モデルのパフォーマンスを評価する方法についていくつかのインサイトを提供します。

機械学習について考えるとき、トレーニング プロセスに注目することがよくあります。 このプロセスの前に少し準備を行うと、学習の速度と品質が向上するだけでなく、それまでに見たことがないデータに直面したときにモデルが正しく動作する信頼性も向上します。

分類とは項目をカテゴリに割り当てることを意味し、自動化された意思決定と考えることもできます。 ここでは、ロジスティック回帰を使用して分類モデルについて説明し、より複雑な分類方法への足掛かりを提供します。

多くの場合、より複雑なモデルを手動でカスタマイズすることで、その有効性を向上させることができます。 より複雑なモデルのアーキテクチャを変更することで、どれほどの効果が得られるかを演習を交えながら説明します。

データの分類において、モデルが適切か不適切かを知るにはどうすればよいでしょうか? コンピューターでモデルのパフォーマンスを評価する方法は、私たちには理解しにくいか、または実際の使用環境でのモデルの動作を簡略化しすぎる場合があります。 満足な方法で動作するモデルを構築するには、それを評価するための直感的な方法を見つけ、これらのメトリックによって私たちの見方がどれだけ偏よる場合があるかを理解する必要があります。

受信者操作特性曲線は、トレーニング済みの分類モデルを評価および微調整するための強力な方法です。 学習コンテンツと実践的な演習を通じて、これらの曲線の有用性を紹介し、説明します。