機械学習のデータサイエンスについて

ラーニングパス
9 モジュール

概略

レベル

初級
スキル

 
製品

Azure
ロール

AI エンジニアデータサイエンティスト開発者 Student
サブジェクト

機械学習

Microsoft Learn では、対話的な方法で、従来の機械学習の概要を理解することができます。これらのラーニングパスは、ディープラーニングのトピックに移行するための優れた基盤にもなり、各自の生産性を向上させます。

最も基本的な従来の機械学習モデルから、探索的データ分析やカスタマイジングのアーキテクチャまで、ブラウザーを離れることなく、概念的内容や対話型の Jupyter Notebook を簡単に把握することができます。

知識と興味に応じて自分のパスを選択してください。

オプション 1: 完全なコース: 機械学習のためのデータサイエンスの基礎

ほとんどのユーザーには、このパスがお勧めです。これには、概念の理解を最大限に高めるカスタムフローを備えた、他の 2 つのラーニングパスと同じモジュールがすべて含まれています。基になる概念と、最も一般的な機械学習ツールでモデルを構築する方法について知りたい場合は、このパスを使用してください。また、従来の機械学習からの移行を予定していて、ディープラーニングとニューラルネットワーク (ここでのみ紹介します) について知りたい場合にも、このパスが最適です。

オプション 2: "機械学習のデータサイエンスについて理解する" ラーニングパス

機械学習のしくみについて知りたいが、あまり数学的な知識がない場合は、このパスを使用してください。以前の教育に関する前提条件はありません（ただし、コーディング概念への軽い知識は必要です）。コード、メタファー、ビジュアルを使い、「なるほど」と納得できる瞬間を提供します。実践的な内容ですが、使用可能なツールとライブラリの機能よりも基礎の理解に重点を置いています。

✔ 現在、このパスにいます。開始するにはスクロールしてください。

✔オプション 3: "機械学習モデルの作成" のラーニングパス

機械学習についてある程度理解している場合や、数学的な知識が豊富である場合は、"機械学習モデルの作成" のラーニングパスにすぐに移動することをお勧めします。これらのモジュールでは、機械学習のいくつかの概念を教えますが、速いペースで進んで、scikit-learn、TensorFlow、PyTorch といったツールを活用する能力を目指します。このラーニングパスは、Azure ML や Azure Databricks などの製品の機械学習の例を理解するのに十分な知識をお求めの方にも最適です。

前提条件

なし

このラーニングパス内のモジュール

機械学習の概要

コンピューターサイエンスおよび統計学に関する知識がほとんど、またはまったくない方向けの機械学習の概要。ここでは、いくつかの重要な概念を確認し、データについて調べ、実際の場合と同様に、Python を使って機械学習モデルをトレーニングし、保存し、使うという機械学習のライフサイクル全体を対話形式で体験します。

教師あり学習を使用して従来の機械学習モデルを構築する

教師あり学習は、データの例からアルゴリズムに学習させる機械学習の一形態です。教師あり学習によって、現実世界に関する予測を行えるモデルが自動的に生成されるしくみについて、段階的に詳しく説明します。また、これらのモデルをテストする方法と、それらのトレーニング時に発生する可能性のある問題についても言及します。

機械学習用のデータの概要

機械学習モデルの力は、それらのモデルをトレーニングするために使用されるデータから生み出されます。コンテンツと演習を通して、データを理解する方法、コンピューターが正しく解釈できるようにデータをエンコードする方法、エラーを取り除く方法のほか、高パフォーマンスモデルの作成に役立つヒントについて説明します。

機械学習で回帰モデルをトレーニングして理解する

回帰は、ほぼ間違いなく、最も広く使用されている機械学習手法であり、科学的発見、ビジネスプランニング、株式市場分析の共通の基盤になっています。この学習資料では、単純なものと複雑なもの両方の回帰分析について詳しく説明し、モデルのパフォーマンスを評価する方法についていくつかのインサイトを提供します。

機械学習モデルを調整してテストする

機械学習について考えるとき、トレーニングプロセスに注目することがよくあります。このプロセスの前に少し準備を行うと、学習の速度と品質が向上するだけでなく、それまでに見たことがないデータに直面したときにモデルが正しく動作する信頼性も向上します。

機械学習での分類モデルを作成して理解する

分類とは項目をカテゴリに割り当てることを意味し、自動化された意思決定と考えることもできます。ここでは、ロジスティック回帰を使用して分類モデルについて説明し、より複雑な分類方法への足掛かりを提供します。

ランダムフォレストを使用してアーキテクチャとハイパーパラメーターを選択およびカスタマイズする

多くの場合、より複雑なモデルを手動でカスタマイズすることで、その有効性を向上させることができます。より複雑なモデルのアーキテクチャを変更することで、どれほどの効果が得られるかを演習を交えながら説明します。

混同行列とデータの不均衡

データの分類において、モデルが適切か不適切かを知るにはどうすればよいでしょうか? コンピューターがモデルのパフォーマンスを評価する方法は、モデルの実際の動作を理解するのが難しい場合や、モデルの動作を過度に簡略化する場合があります。十分に機能するモデルを構築するには、それらを評価する直感的な方法を見つけ、これらのメトリックがビューにどのように偏っているかを理解する必要があります。

ROC と AUC でモデルのパフォーマンスを測定および最適化する

受信者オペレーター特性 (ROC) 曲線は、トレーニング済みの分類モデルを評価および微調整するための強力な方法です。学習コンテンツと実践的な演習を通じて、これらの曲線の有用性を紹介し、説明します。

機械学習のデータ サイエンスについて

概略

オプション 1: 完全なコース: 機械学習のためのデータ サイエンスの基礎

オプション 2: "機械学習のデータ サイエンスについて理解する" ラーニング パス

✔オプション 3: "機械学習モデルの作成" のラーニング パス