試験 DP-100: Azure でのデータ サイエンス ソリューションの設計と実装の学習ガイド

このドキュメントの目的

この学習ガイドは、この試験で想定される内容を理解するのに役立つもので、試験に出る可能性のあるトピックの概要と、その他のリソースへのリンクが掲載されています。 このドキュメントの情報と資料は、試験の準備を進めるときに学習の焦点を合わせるのに役立ちます。

便利なリンク 説明
2024 年 4 月 15 日時点の評価されるスキルを確認する この一覧は、指定された日付以降の評価されるスキルを示しています。 この日付以降に受験する予定であれば、この一覧を確認してください。
2024 年 4 月 15 日より前の評価されるスキルを確認する 指定された日付より前に受験する予定であれば、この一覧を確認してください。
ログの変更 指定された日付に行われた変更を確認する場合、変更ログに直接進むことができます。
認定資格の取得方法 1 つの試験に合格するだけで取得できる認定資格もありますが、それ以外は、複数の試験に合格する必要があります。
認定資格の更新 Microsoft のアソシエイト、エキスパート、専門の認定資格は、毎年有効期限が切れます。 Microsoft Learn で無料のオンライン評価に合格すると、更新できます。
Microsoft Learn プロファイル 認定プロファイルを Learn に接続すると、試験のスケジュール設定と更新、および証明書の共有と印刷を行うことができます。
合格スコア 合格するには、700 以上のスコアが必要です。
試験サンドボックス 試験サンドボックスにアクセスして、試験の環境を確認できます。
便宜を要求する 支援機器を使用する場合、時間延長が必要な場合、または試験エクスペリエンスのいずれかの部分を変更する必要がある場合は、便宜を図るよう要求できます。
無料の練習用評価を受ける 試験対策用の練習問題で実力を試すことができます。

試験の更新

試験は、ロールを実行するために必要なスキルを反映するように定期的に更新されます。 試験を受けるタイミングに応じて、2 つのバージョンの評価されるスキルの目標が含まれています。

常に、英語版の試験が最初に更新されます。 一部の試験は他の言語にローカライズされており、英語版が更新されてから約 8 週間後に更新されます。 Microsoft では、前述のようにローカライズ版を更新するためにあらゆる努力を行いますが、場合によっては、予定どおりに試験のローカライズ版が更新されないことがあります。 その他の利用可能な言語は、試験の詳細 Web ページの「試験のスケジュール設定」セクションに表示されます。 試験が希望する言語で実施されていない場合、試験完了までの時間を 30 分延長するように要求できます。

評価される各スキルの後に続く箇条書きは、そのスキルをどのようにして評価するかを説明することを目的としています。 関連するトピックが試験に出題される可能性があります。

ほとんどの問題は一般提供 (GA) の機能について出題されます。 プレビュー機能が一般的に使用されている場合は、これらの機能に関する問題が試験に含まれることがあります。

2024 年 4 月 15 日時点の評価されるスキル

視聴者プロフィール

この試験の受験者は、データ サイエンスと機械学習を応用して Azure で機械学習ワークロードを実装して実行するための、対象分野の専門知識を持っている必要があります。

このロールの責任には、以下が含まれます。

  • データ サイエンス ワークロードに適した作業環境の設計と作成。

  • データの探索。

  • 機械学習モデルのトレーニング。

  • パイプラインの実装。

  • 運用環境を準備するためのジョブの実行。

  • スケーラブルな機械学習ソリューションの管理、デプロイ、監視。

この試験の受験者には、以下を使用したデータ サイエンスの知識と経験が必要です。

  • Azure Machine Learning

  • MLflow

スキルの概要

  • 機械学習ソリューションの設計と準備 (20 - 25%)

  • データの探索とモデルのトレーニング (35 - 40%)

  • デプロイ用のモデルを準備する (20 - 25%)

  • モデルのデプロイと再トレーニング (10 - 15%)

機械学習ソリューションの設計と準備 (20 - 25%)

機械学習ソリューションを設計する

  • トレーニング ワークロードに適したコンピューティング仕様を決定する

  • モデル デプロイの要件について説明する

  • モデルの構築またはトレーニングに使用する開発アプローチを選択する

Azure Machine Learning ワークスペースの管理

  • Azure Machine Learning ワークスペースを作成する

  • ワークスペース操作用の開発者ツールを使用してワークスペースを管理する

  • ソース管理用に Git 統合を設定する

  • レジストリを作成して管理する

Azure Machine Learning ワークスペースのデータを管理する

  • Azure Storage のリソースを選択する

  • データストアの登録と維持

  • データ資産の作成と管理

Azure Machine Learning で実験用のコンピューティングを管理する

  • 実験とトレーニングのコンピューティング先を作成する

  • 機械学習ユース ケースの環境を選択する

  • Apache Spark プールを含む、アタッチされたコンピューティング リソースを構成する

  • コンピューティングの使用状況を監視する

データの探索とモデルのトレーニング (35 - 40%)

データ資産とデータ ストアを使用してデータを探す

  • 対話型開発におけるデータへのアクセスとラングリング

  • Apache Spark を使用した対話型データのラングリング

Azure Machine Learning デザイナーを使用してモデルを作成する

  • トレーニング パイプラインを作成する

  • デザイナーからデータ資産を使用する

  • デザイナーでカスタム コード コンポーネントを使用する

  • 責任ある AI のガイドラインを含むモデルを評価する

自動機械学習を使用して最適なモデルを探す

  • 表形式データに自動機械学習を使用する

  • Computer Vision に自動機械学習を使用する

  • 自然言語処理に自動機械学習を使用する

  • 前処理やアルゴリズムを含む、トレーニング オプションの選択と理解

  • 責任ある AI のガイドラインを含む、自動機械学習の実行を評価する

カスタム モデル トレーニングにノートブックを使用する

  • コンピューティング インスタンスを使用してコードを開発する

  • MLflow を使用してモデル トレーニングを追跡する

  • モデルを評価する

  • Python SDK v2 を使用してモデルをトレーニングする

  • ターミナルを使用してコンピューティング インスタンスを構成する

Azure Machine Learning でハイパーパラメーターを調整する

  • サンプリング方法を選択する

  • 検索空間を定義する

  • プライマリ メトリックを定義する

  • 早期終了オプションを定義する

デプロイ用のモデルを準備する (20 - 25%)

モデル トレーニング スクリプトを実行する

  • スクリプトのジョブ実行設定を構成する

  • ジョブ実行のコンピューティングを構成する

  • ジョブ内のデータ資産からデータを使用する

  • Azure Machine Learning を使用してスクリプトをジョブとして実行する

  • MLflow を使用してジョブ実行からメトリックをログする

  • ログを使用してジョブ実行エラーのトラブルシューティングを行う

  • ジョブ実行の環境を構成する

  • ジョブのパラメーターを定義する

トレーニング パイプラインを実装する

  • パイプラインを作成する

  • パイプライン内のステップ間でデータを渡す

  • パイプラインの実行とスケジュール設定

  • パイプラインの実行を監視する

  • カスタム コンポーネントを作成する

  • コンポーネントベースのパイプラインを使用する

Azure Machine Learning でモデルを管理する

  • MLflow モデルの出力について説明する

  • モデルをパッケージ化するための適切なフレームワークを特定する

  • 責任ある AI の原則を使用してモデルを評価する

モデルのデプロイと再トレーニング (10 - 15%)

モデルをデプロイする

  • オンライン デプロイの設定を構成する

  • バッチ デプロイ用にコンピューティングを構成する

  • モデルをオンライン エンドポイントにデプロイする

  • バッチ エンドポイントにモデルをデプロイする

  • オンラインでデプロイされたサービスをテストする

  • バッチ エンドポイントを呼び出してバッチ スコアリング ジョブを開始する

機械学習の運用 (MLOps) のプラクティスを適用する

  • Azure DevOps または GitHub を含む、Azure Machine Learning ジョブをトリガーする

  • 新しいデータの追加またはデータの変更に基づいてモデルの再トレーニングを自動化する

  • イベントベースの再トレーニング トリガーを定義する

学習リソース

試験を受ける前に、トレーニングを行い、実践的な経験を積むことをお勧めします。 自己学習のオプションとクラスルーム トレーニングのほか、ドキュメント、コミュニティ サイト、ビデオへのリンクも提供しています。

学習リソース ラーニングおよびドキュメントへのリンク
トレーニングを受けよう マイペースで進められるラーニング パスとモジュールを選択するか、講師による指導付きコースを受講する
ドキュメントの検索 Azure Databricks
Azure Machine Learning
Azure Synapse Analytics
MLflow と Azure Machine Learning
質問をする Microsoft Q&A | Microsoft Docs
コミュニティ サポートを受ける AI - Machine Learning - Microsoft Tech Community
AI - Machine Learning ブログ - Microsoft Tech Community
Microsoft Learn をフォローする Microsoft Learn - Microsoft Tech Community
ビデオを見つける Microsoft Learn ショー

ログの変更

表を理解するための鍵: トピック グループ (機能グループとも呼ばれます) は太字の書体で、その後に各グループ内の目的が続きます。 表は、この試験で評価されるスキルの 2 つのバージョンを比較したもので、3 番目の列は変更の程度を示しています。

2024 年 4 月 15 日より前のスキル領域 2024 年 4 月 15 日時点のスキル領域 Change
受講者のプロファイル Minor
機械学習ソリューションの設計と準備 機械学習ソリューションの設計と準備 変更なし
機械学習ソリューションを設計する 機械学習ソリューションを設計する 変更なし
Azure Machine Learning ワークスペースの管理 Azure Machine Learning ワークスペースの管理 変更なし
Azure Machine Learning ワークスペースのデータを管理する Azure Machine Learning ワークスペースのデータを管理する 変更なし
Azure Machine Learning で実験用のコンピューティングを管理する Azure Machine Learning で実験用のコンピューティングを管理する 変更なし
データの探索とモデルのトレーニング データの探索とモデルのトレーニング 変更なし
データ資産とデータ ストアを使用してデータを探す データ資産とデータ ストアを使用してデータを探す 変更なし
Azure Machine Learning デザイナーを使用してモデルを作成する Azure Machine Learning デザイナーを使用してモデルを作成する 変更なし
自動機械学習を使用して最適なモデルを探す 自動機械学習を使用して最適なモデルを探す 変更なし
カスタム モデル トレーニングにノートブックを使用する カスタム モデル トレーニングにノートブックを使用する Minor
Azure Machine Learning でハイパーパラメーターを調整する Azure Machine Learning でハイパーパラメーターを調整する 変更なし
モデルをデプロイできるよう準備する モデルをデプロイできるよう準備する 変更なし
モデル トレーニング スクリプトを実行する モデル トレーニング スクリプトを実行する 変更なし
トレーニング パイプラインを実装する トレーニング パイプラインを実装する 変更なし
Azure Machine Learning でモデルを管理する Azure Machine Learning でモデルを管理する Minor
モデルのデプロイと再トレーニング モデルのデプロイと再トレーニング 変更なし
モデルをデプロイする モデルをデプロイする 変更なし
機械学習の運用 (MLOps) のプラクティスを適用する 機械学習の運用 (MLOps) のプラクティスを適用する 変更なし

2024 年 4 月 15 日より前の評価されるスキル

視聴者プロフィール

この試験の受験者は、データ サイエンスと機械学習を応用して Azure で機械学習ワークロードを実装して実行するための、対象分野の専門知識を持っている必要があります。

このロールの責任には、以下が含まれます。

  • データ サイエンス ワークロードに適した作業環境の設計と作成。

  • データの探索。

  • 機械学習モデルのトレーニング。

  • パイプラインの実装。

  • 運用環境を準備するためのジョブの実行。

  • スケーラブルな機械学習ソリューションの管理、デプロイ、監視。

この試験の受験者には、以下を使用したデータ サイエンスの知識と経験が必要です。

  • Azure Machine Learning

  • MLflow

スキルの概要

  • 機械学習ソリューションの設計と準備 (20 - 25%)

  • データの探索とモデルのトレーニング (35 - 40%)

  • デプロイ用のモデルを準備する (20 - 25%)

  • モデルのデプロイと再トレーニング (10 - 15%)

機械学習ソリューションの設計と準備 (20 - 25%)

機械学習ソリューションを設計する

  • トレーニング ワークロードに適したコンピューティング仕様を決定する

  • モデル デプロイの要件について説明する

  • モデルの構築またはトレーニングに使用する開発アプローチを選択する

Azure Machine Learning ワークスペースの管理

  • Azure Machine Learning ワークスペースを作成する

  • ワークスペース操作用の開発者ツールを使用してワークスペースを管理する

  • ソース管理用に Git 統合を設定する

  • レジストリを作成して管理する

Azure Machine Learning ワークスペースのデータを管理する

  • Azure Storage のリソースを選択する

  • データストアの登録と維持

  • データ資産の作成と管理

Azure Machine Learning で実験用のコンピューティングを管理する

  • 実験とトレーニングのコンピューティング先を作成する

  • 機械学習ユース ケースの環境を選択する

  • Apache Spark プールを含む、アタッチされたコンピューティング リソースを構成する

  • コンピューティングの使用状況を監視する

データの探索とモデルのトレーニング (35 - 40%)

データ資産とデータ ストアを使用してデータを探す

  • 対話型開発におけるデータへのアクセスとラングリング

  • Apache Spark を使用した対話型データのラングリング

Azure Machine Learning デザイナーを使用してモデルを作成する

  • トレーニング パイプラインを作成する

  • デザイナーからデータ資産を使用する

  • デザイナーでカスタム コード コンポーネントを使用する

  • 責任ある AI のガイドラインを含むモデルを評価する

自動機械学習を使用して最適なモデルを探す

  • 表形式データに自動機械学習を使用する

  • Computer Vision に自動機械学習を使用する

  • 自然言語処理に自動機械学習を使用する

  • 前処理やアルゴリズムを含む、トレーニング オプションの選択と理解

  • 責任ある AI のガイドラインを含む、自動機械学習の実行を評価する

カスタム モデル トレーニングにノートブックを使用する

  • コンピューティング インスタンスを使用してコードを開発する

  • MLflow を使用してモデル トレーニングを追跡する

  • モデルを評価する

  • Python SDKv2 を使用してモデルをトレーニングする

  • ターミナルを使用してコンピューティング インスタンスを構成する

Azure Machine Learning でハイパーパラメーターを調整する

  • サンプリング方法を選択する

  • 検索空間を定義する

  • プライマリ メトリックを定義する

  • 早期終了オプションを定義する

デプロイ用のモデルを準備する (20 - 25%)

モデル トレーニング スクリプトを実行する

  • スクリプトのジョブ実行設定を構成する

  • ジョブ実行のコンピューティングを構成する

  • ジョブ内のデータ資産からデータを使用する

  • Azure Machine Learning を使用してスクリプトをジョブとして実行する

  • MLflow を使用してジョブ実行からメトリックをログする

  • ログを使用してジョブ実行エラーのトラブルシューティングを行う

  • ジョブ実行の環境を構成する

  • ジョブのパラメーターを定義する

トレーニング パイプラインを実装する

  • パイプラインを作成する

  • パイプライン内のステップ間でデータを渡す

  • パイプラインの実行とスケジュール設定

  • パイプラインの実行を監視する

  • カスタム コンポーネントを作成する

  • コンポーネントベースのパイプラインを使用する

Azure Machine Learning でモデルを管理する

  • MLflow モデルの出力について説明する

  • モデルをパッケージ化するための適切なフレームワークを特定する

  • 責任ある AI のガイドラインを使用してモデルを評価する

モデルのデプロイと再トレーニング (10 - 15%)

モデルをデプロイする

  • オンライン デプロイの設定を構成する

  • バッチ デプロイ用にコンピューティングを構成する

  • モデルをオンライン エンドポイントにデプロイする

  • バッチ エンドポイントにモデルをデプロイする

  • オンラインでデプロイされたサービスをテストする

  • バッチ エンドポイントを呼び出してバッチ スコアリング ジョブを開始する

機械学習の運用 (MLOps) のプラクティスを適用する

  • Azure DevOps または GitHub を含む、Azure Machine Learning ジョブをトリガーする

  • 新しいデータの追加またはデータの変更に基づいてモデルの再トレーニングを自動化する

  • イベントベースの再トレーニング トリガーを定義する