試験 DP-100: Azure でのデータサイエンスソリューションの設計と実装の学習ガイド

[アーティクル]
02/18/2024

このドキュメントの目的

この学習ガイドは、この試験で想定される内容を理解するのに役立つもので、試験に出る可能性のあるトピックの概要と、その他のリソースへのリンクが掲載されています。このドキュメントの情報と資料は、試験の準備を進めるときに学習の焦点を合わせるのに役立ちます。

便利なリンク	説明
2024 年 4 月 15 日時点の評価されるスキルを確認する	この一覧は、指定された日付以降の評価されるスキルを示しています。この日付以降に受験する予定であれば、この一覧を確認してください。
2024 年 4 月 15 日より前の評価されるスキルを確認する	指定された日付より前に受験する予定であれば、この一覧を確認してください。
ログの変更	指定された日付に行われた変更を確認する場合、変更ログに直接進むことができます。
認定資格の取得方法	1 つの試験に合格するだけで取得できる認定資格もありますが、それ以外は、複数の試験に合格する必要があります。
認定資格の更新	Microsoft のアソシエイト、エキスパート、専門の認定資格は、毎年有効期限が切れます。 Microsoft Learn で無料のオンライン評価に合格すると、更新できます。
Microsoft Learn プロファイル	認定プロファイルを Learn に接続すると、試験のスケジュール設定と更新、および証明書の共有と印刷を行うことができます。
合格スコア	合格するには、700 以上のスコアが必要です。
試験サンドボックス	試験サンドボックスにアクセスして、試験の環境を確認できます。
便宜を要求する	支援機器を使用する場合、時間延長が必要な場合、または試験エクスペリエンスのいずれかの部分を変更する必要がある場合は、便宜を図るよう要求できます。
無料の練習用評価を受ける	試験対策用の練習問題で実力を試すことができます。

試験の更新

試験は、ロールを実行するために必要なスキルを反映するように定期的に更新されます。試験を受けるタイミングに応じて、2 つのバージョンの評価されるスキルの目標が含まれています。

常に、英語版の試験が最初に更新されます。一部の試験は他の言語にローカライズされており、英語版が更新されてから約 8 週間後に更新されます。 Microsoft では、前述のようにローカライズ版を更新するためにあらゆる努力を行いますが、場合によっては、予定どおりに試験のローカライズ版が更新されないことがあります。その他の利用可能な言語は、試験の詳細 Web ページの「試験のスケジュール設定」セクションに表示されます。試験が希望する言語で実施されていない場合、試験完了までの時間を 30 分延長するように要求できます。

注

評価される各スキルの後に続く箇条書きは、そのスキルをどのようにして評価するかを説明することを目的としています。関連するトピックが試験に出題される可能性があります。

注

ほとんどの問題は一般提供 (GA) の機能について出題されます。プレビュー機能が一般的に使用されている場合は、これらの機能に関する問題が試験に含まれることがあります。

2024 年 4 月 15 日時点の評価されるスキル

視聴者プロフィール

この試験の受験者は、データサイエンスと機械学習を応用して Azure で機械学習ワークロードを実装して実行するための、対象分野の専門知識を持っている必要があります。

このロールの責任には、以下が含まれます。

データサイエンスワークロードに適した作業環境の設計と作成。
データの探索。
機械学習モデルのトレーニング。
パイプラインの実装。
運用環境を準備するためのジョブの実行。
スケーラブルな機械学習ソリューションの管理、デプロイ、監視。

この試験の受験者には、以下を使用したデータサイエンスの知識と経験が必要です。

Azure Machine Learning
MLflow

スキルの概要

機械学習ソリューションの設計と準備 (20 - 25%)
データの探索とモデルのトレーニング (35 - 40%)
デプロイ用のモデルを準備する (20 - 25%)
モデルのデプロイと再トレーニング (10 - 15%)

機械学習ソリューションの設計と準備 (20 - 25%)

機械学習ソリューションを設計する

トレーニングワークロードに適したコンピューティング仕様を決定する
モデルデプロイの要件について説明する
モデルの構築またはトレーニングに使用する開発アプローチを選択する

Azure Machine Learning ワークスペースの管理

Azure Machine Learning ワークスペースを作成する
ワークスペース操作用の開発者ツールを使用してワークスペースを管理する
ソース管理用に Git 統合を設定する
レジストリを作成して管理する

Azure Machine Learning ワークスペースのデータを管理する

Azure Storage のリソースを選択する
データストアの登録と維持
データ資産の作成と管理

Azure Machine Learning で実験用のコンピューティングを管理する

実験とトレーニングのコンピューティング先を作成する
機械学習ユースケースの環境を選択する
Apache Spark プールを含む、アタッチされたコンピューティングリソースを構成する
コンピューティングの使用状況を監視する

データの探索とモデルのトレーニング (35 - 40%)

データ資産とデータストアを使用してデータを探す

対話型開発におけるデータへのアクセスとラングリング
Apache Spark を使用した対話型データのラングリング

Azure Machine Learning デザイナーを使用してモデルを作成する

トレーニングパイプラインを作成する
デザイナーからデータ資産を使用する
デザイナーでカスタムコードコンポーネントを使用する
責任ある AI のガイドラインを含むモデルを評価する

自動機械学習を使用して最適なモデルを探す

表形式データに自動機械学習を使用する
Computer Vision に自動機械学習を使用する
自然言語処理に自動機械学習を使用する
前処理やアルゴリズムを含む、トレーニングオプションの選択と理解
責任ある AI のガイドラインを含む、自動機械学習の実行を評価する

カスタムモデルトレーニングにノートブックを使用する

コンピューティングインスタンスを使用してコードを開発する
MLflow を使用してモデルトレーニングを追跡する
モデルを評価する
Python SDK v2 を使用してモデルをトレーニングする
ターミナルを使用してコンピューティングインスタンスを構成する

Azure Machine Learning でハイパーパラメーターを調整する

サンプリング方法を選択する
検索空間を定義する
プライマリメトリックを定義する
早期終了オプションを定義する

デプロイ用のモデルを準備する (20 - 25%)

モデルトレーニングスクリプトを実行する

スクリプトのジョブ実行設定を構成する
ジョブ実行のコンピューティングを構成する
ジョブ内のデータ資産からデータを使用する
Azure Machine Learning を使用してスクリプトをジョブとして実行する
MLflow を使用してジョブ実行からメトリックをログする
ログを使用してジョブ実行エラーのトラブルシューティングを行う
ジョブ実行の環境を構成する
ジョブのパラメーターを定義する

トレーニングパイプラインを実装する

パイプラインを作成する
パイプライン内のステップ間でデータを渡す
パイプラインの実行とスケジュール設定
パイプラインの実行を監視する
カスタムコンポーネントを作成する
コンポーネントベースのパイプラインを使用する

Azure Machine Learning でモデルを管理する

MLflow モデルの出力について説明する
モデルをパッケージ化するための適切なフレームワークを特定する
責任ある AI の原則を使用してモデルを評価する

モデルのデプロイと再トレーニング (10 - 15%)

モデルをデプロイする

オンラインデプロイの設定を構成する
バッチデプロイ用にコンピューティングを構成する
モデルをオンラインエンドポイントにデプロイする
バッチエンドポイントにモデルをデプロイする
オンラインでデプロイされたサービスをテストする
バッチエンドポイントを呼び出してバッチスコアリングジョブを開始する

機械学習の運用 (MLOps) のプラクティスを適用する

Azure DevOps または GitHub を含む、Azure Machine Learning ジョブをトリガーする
新しいデータの追加またはデータの変更に基づいてモデルの再トレーニングを自動化する
イベントベースの再トレーニングトリガーを定義する

学習リソース

試験を受ける前に、トレーニングを行い、実践的な経験を積むことをお勧めします。自己学習のオプションとクラスルームトレーニングのほか、ドキュメント、コミュニティサイト、ビデオへのリンクも提供しています。

学習リソース	ラーニングおよびドキュメントへのリンク
トレーニングを受けよう	マイペースで進められるラーニングパスとモジュールを選択するか、講師による指導付きコースを受講する
ドキュメントの検索	Azure Databricks Azure Machine Learning Azure Synapse Analytics MLflow と Azure Machine Learning
質問をする	Microsoft Q&A \| Microsoft Docs
コミュニティサポートを受ける	AI - Machine Learning - Microsoft Tech Community AI - Machine Learning ブログ - Microsoft Tech Community
Microsoft Learn をフォローする	Microsoft Learn - Microsoft Tech Community
ビデオを見つける	Microsoft Learn ショー

ログの変更

表を理解するための鍵: トピックグループ (機能グループとも呼ばれます) は太字の書体で、その後に各グループ内の目的が続きます。表は、この試験で評価されるスキルの 2 つのバージョンを比較したもので、3 番目の列は変更の程度を示しています。

2024 年 4 月 15 日より前のスキル領域	2024 年 4 月 15 日時点のスキル領域	Change
受講者のプロファイル		Minor
機械学習ソリューションの設計と準備	機械学習ソリューションの設計と準備	変更なし
機械学習ソリューションを設計する	機械学習ソリューションを設計する	変更なし
Azure Machine Learning ワークスペースの管理	Azure Machine Learning ワークスペースの管理	変更なし
Azure Machine Learning ワークスペースのデータを管理する	Azure Machine Learning ワークスペースのデータを管理する	変更なし
Azure Machine Learning で実験用のコンピューティングを管理する	Azure Machine Learning で実験用のコンピューティングを管理する	変更なし
データの探索とモデルのトレーニング	データの探索とモデルのトレーニング	変更なし
データ資産とデータストアを使用してデータを探す	データ資産とデータストアを使用してデータを探す	変更なし
Azure Machine Learning デザイナーを使用してモデルを作成する	Azure Machine Learning デザイナーを使用してモデルを作成する	変更なし
自動機械学習を使用して最適なモデルを探す	自動機械学習を使用して最適なモデルを探す	変更なし
カスタムモデルトレーニングにノートブックを使用する	カスタムモデルトレーニングにノートブックを使用する	Minor
Azure Machine Learning でハイパーパラメーターを調整する	Azure Machine Learning でハイパーパラメーターを調整する	変更なし
モデルをデプロイできるよう準備する	モデルをデプロイできるよう準備する	変更なし
モデルトレーニングスクリプトを実行する	モデルトレーニングスクリプトを実行する	変更なし
トレーニングパイプラインを実装する	トレーニングパイプラインを実装する	変更なし
Azure Machine Learning でモデルを管理する	Azure Machine Learning でモデルを管理する	Minor
モデルのデプロイと再トレーニング	モデルのデプロイと再トレーニング	変更なし
モデルをデプロイする	モデルをデプロイする	変更なし
機械学習の運用 (MLOps) のプラクティスを適用する	機械学習の運用 (MLOps) のプラクティスを適用する	変更なし

2024 年 4 月 15 日より前の評価されるスキル

視聴者プロフィール

このロールの責任には、以下が含まれます。

データサイエンスワークロードに適した作業環境の設計と作成。
データの探索。
機械学習モデルのトレーニング。
パイプラインの実装。
運用環境を準備するためのジョブの実行。
スケーラブルな機械学習ソリューションの管理、デプロイ、監視。

この試験の受験者には、以下を使用したデータサイエンスの知識と経験が必要です。

Azure Machine Learning
MLflow

スキルの概要

機械学習ソリューションの設計と準備 (20 - 25%)
データの探索とモデルのトレーニング (35 - 40%)
デプロイ用のモデルを準備する (20 - 25%)
モデルのデプロイと再トレーニング (10 - 15%)

機械学習ソリューションの設計と準備 (20 - 25%)

機械学習ソリューションを設計する

トレーニングワークロードに適したコンピューティング仕様を決定する
モデルデプロイの要件について説明する
モデルの構築またはトレーニングに使用する開発アプローチを選択する

Azure Machine Learning ワークスペースの管理

Azure Machine Learning ワークスペースを作成する
ワークスペース操作用の開発者ツールを使用してワークスペースを管理する
ソース管理用に Git 統合を設定する
レジストリを作成して管理する

Azure Machine Learning ワークスペースのデータを管理する

Azure Storage のリソースを選択する
データストアの登録と維持
データ資産の作成と管理

Azure Machine Learning で実験用のコンピューティングを管理する

実験とトレーニングのコンピューティング先を作成する
機械学習ユースケースの環境を選択する
Apache Spark プールを含む、アタッチされたコンピューティングリソースを構成する
コンピューティングの使用状況を監視する

データの探索とモデルのトレーニング (35 - 40%)

データ資産とデータストアを使用してデータを探す

対話型開発におけるデータへのアクセスとラングリング
Apache Spark を使用した対話型データのラングリング

Azure Machine Learning デザイナーを使用してモデルを作成する

トレーニングパイプラインを作成する
デザイナーからデータ資産を使用する
デザイナーでカスタムコードコンポーネントを使用する
責任ある AI のガイドラインを含むモデルを評価する

自動機械学習を使用して最適なモデルを探す

表形式データに自動機械学習を使用する
Computer Vision に自動機械学習を使用する
自然言語処理に自動機械学習を使用する
前処理やアルゴリズムを含む、トレーニングオプションの選択と理解
責任ある AI のガイドラインを含む、自動機械学習の実行を評価する

カスタムモデルトレーニングにノートブックを使用する

コンピューティングインスタンスを使用してコードを開発する
MLflow を使用してモデルトレーニングを追跡する
モデルを評価する
Python SDKv2 を使用してモデルをトレーニングする
ターミナルを使用してコンピューティングインスタンスを構成する

Azure Machine Learning でハイパーパラメーターを調整する

サンプリング方法を選択する
検索空間を定義する
プライマリメトリックを定義する
早期終了オプションを定義する

デプロイ用のモデルを準備する (20 - 25%)

モデルトレーニングスクリプトを実行する

スクリプトのジョブ実行設定を構成する
ジョブ実行のコンピューティングを構成する
ジョブ内のデータ資産からデータを使用する
Azure Machine Learning を使用してスクリプトをジョブとして実行する
MLflow を使用してジョブ実行からメトリックをログする
ログを使用してジョブ実行エラーのトラブルシューティングを行う
ジョブ実行の環境を構成する
ジョブのパラメーターを定義する

トレーニングパイプラインを実装する

パイプラインを作成する
パイプライン内のステップ間でデータを渡す
パイプラインの実行とスケジュール設定
パイプラインの実行を監視する
カスタムコンポーネントを作成する
コンポーネントベースのパイプラインを使用する

Azure Machine Learning でモデルを管理する

MLflow モデルの出力について説明する
モデルをパッケージ化するための適切なフレームワークを特定する
責任ある AI のガイドラインを使用してモデルを評価する

モデルのデプロイと再トレーニング (10 - 15%)

モデルをデプロイする

オンラインデプロイの設定を構成する
バッチデプロイ用にコンピューティングを構成する
モデルをオンラインエンドポイントにデプロイする
バッチエンドポイントにモデルをデプロイする
オンラインでデプロイされたサービスをテストする
バッチエンドポイントを呼び出してバッチスコアリングジョブを開始する

機械学習の運用 (MLOps) のプラクティスを適用する

Azure DevOps または GitHub を含む、Azure Machine Learning ジョブをトリガーする
新しいデータの追加またはデータの変更に基づいてモデルの再トレーニングを自動化する
イベントベースの再トレーニングトリガーを定義する

試験 DP-100: Azure でのデータ サイエンス ソリューションの設計と実装の学習ガイド

このドキュメントの目的

試験の更新

注

注

2024 年 4 月 15 日時点の評価されるスキル

視聴者プロフィール

スキルの概要

機械学習ソリューションの設計と準備 (20 - 25%)

機械学習ソリューションを設計する

Azure Machine Learning ワークスペースの管理

Azure Machine Learning ワークスペースのデータを管理する

Azure Machine Learning で実験用のコンピューティングを管理する

データの探索とモデルのトレーニング (35 - 40%)

データ資産とデータ ストアを使用してデータを探す

Azure Machine Learning デザイナーを使用してモデルを作成する

自動機械学習を使用して最適なモデルを探す

カスタム モデル トレーニングにノートブックを使用する

Azure Machine Learning でハイパーパラメーターを調整する

デプロイ用のモデルを準備する (20 - 25%)

モデル トレーニング スクリプトを実行する

トレーニング パイプラインを実装する

Azure Machine Learning でモデルを管理する

モデルのデプロイと再トレーニング (10 - 15%)

モデルをデプロイする

機械学習の運用 (MLOps) のプラクティスを適用する

学習リソース

ログの変更

2024 年 4 月 15 日より前の評価されるスキル

視聴者プロフィール

スキルの概要

機械学習ソリューションの設計と準備 (20 - 25%)

機械学習ソリューションを設計する

Azure Machine Learning ワークスペースの管理

Azure Machine Learning ワークスペースのデータを管理する

Azure Machine Learning で実験用のコンピューティングを管理する

データの探索とモデルのトレーニング (35 - 40%)

データ資産とデータ ストアを使用してデータを探す

Azure Machine Learning デザイナーを使用してモデルを作成する

自動機械学習を使用して最適なモデルを探す

カスタム モデル トレーニングにノートブックを使用する

Azure Machine Learning でハイパーパラメーターを調整する

デプロイ用のモデルを準備する (20 - 25%)

モデル トレーニング スクリプトを実行する

トレーニング パイプラインを実装する

Azure Machine Learning でモデルを管理する

モデルのデプロイと再トレーニング (10 - 15%)

モデルをデプロイする

機械学習の運用 (MLOps) のプラクティスを適用する

その他のリソース

試験 DP-100: Azure でのデータサイエンスソリューションの設計と実装の学習ガイド

データ資産とデータストアを使用してデータを探す

カスタムモデルトレーニングにノートブックを使用する

モデルトレーニングスクリプトを実行する

トレーニングパイプラインを実装する

データ資産とデータストアを使用してデータを探す

カスタムモデルトレーニングにノートブックを使用する

モデルトレーニングスクリプトを実行する

トレーニングパイプラインを実装する