試験 DP-100: Azure でのデータ サイエンス ソリューションの設計と実装の学習ガイド
このドキュメントの目的
この学習ガイドは、この試験で想定される内容を理解するのに役立つもので、試験に出る可能性のあるトピックの概要と、その他のリソースへのリンクが掲載されています。 このドキュメントの情報と資料は、試験の準備を進めるときに学習の焦点を合わせるのに役立ちます。
便利なリンク | 説明 |
---|---|
2024 年 7 月 17 日時点の評価されるスキルを確認する | この一覧は、指定された日付以降の評価されるスキルを示しています。 この日付以降に受験する予定であれば、この一覧を確認してください。 |
2024 年 7 月 17 日より前の評価されるスキルを確認する | 指定された日付より前に受験する予定であれば、この一覧を確認してください。 |
ログの変更 | 指定された日付に行われた変更を確認する場合、変更ログに直接進むことができます。 |
認定資格の取得方法 | 1 つの試験に合格するだけで取得できる認定資格もありますが、それ以外は、複数の試験に合格する必要があります。 |
認定資格の更新 | Microsoft のアソシエイト、エキスパート、専門の認定資格は、毎年有効期限が切れます。 Microsoft Learn で無料のオンライン評価に合格すると、更新できます。 |
Microsoft Learn プロファイル | 認定プロファイルを Microsoft Learn に接続すると、試験のスケジュール設定と更新、および証明書の共有と印刷を行うことができます。 |
試験スコアとスコアレポート | 合格するには、700 以上のスコアが必要です。 |
試験サンドボックス | 試験サンドボックスにアクセスして、試験の環境を確認できます。 |
便宜を要求する | 支援機器を使用する場合、時間延長が必要な場合、または試験エクスペリエンスのいずれかの部分を変更する必要がある場合は、便宜を図るよう要求できます。 |
無料の練習用評価を受ける | 試験対策用の練習問題で実力を試すことができます。 |
試験の更新
試験は、ロールを実行するために必要なスキルを反映するように定期的に更新されます。 試験を受けるタイミングに応じて、2 つのバージョンの評価されるスキルの目標が含まれています。
常に、英語版の試験が最初に更新されます。 一部の試験は他の言語にローカライズされており、英語版が更新されてから約 8 週間後に更新されます。 Microsoft では、前述のようにローカライズ版を更新するためにあらゆる努力を行いますが、場合によっては、予定どおりに試験のローカライズ版が更新されないことがあります。 その他の利用可能な言語は、試験の詳細 Web ページの「試験のスケジュール設定」セクションに表示されます。 試験が希望する言語で実施されていない場合、試験完了までの時間を 30 分延長するように要求できます。
注
評価される各スキルの後に続く箇条書きは、そのスキルをどのようにして評価するかを説明することを目的としています。 関連するトピックが試験に出題される可能性があります。
注
ほとんどの問題は一般提供 (GA) の機能について出題されます。 プレビュー機能が一般的に使用されている場合は、これらの機能に関する問題が試験に含まれることがあります。
2024 年 7 月 17 日時点の評価されるスキル
視聴者プロフィール
この試験の受験者は、データ サイエンスと機械学習を応用して Azure で機械学習ワークロードを実装して実行するための、対象分野の専門知識を持っている必要があります。
このロールの責任には、以下が含まれます。
データ サイエンス ワークロードに適した作業環境の設計と作成。
データの探索。
機械学習モデルのトレーニング。
パイプラインの実装。
運用環境を準備するためのジョブの実行。
スケーラブルな機械学習ソリューションの管理、デプロイ、監視。
この試験の受験者には、以下を使用したデータ サイエンスの知識と経験が必要です。
Azure Machine Learning
MLflow
スキルの概要
機械学習ソリューションの設計と準備 (20 - 25%)
データの探索とモデルのトレーニング (35 - 40%)
デプロイ用のモデルを準備する (20 - 25%)
モデルのデプロイと再トレーニング (10 - 15%)
機械学習ソリューションの設計と準備 (20 - 25%)
機械学習ソリューションを設計する
トレーニング ワークロードに適したコンピューティング仕様を決定する
モデル デプロイの要件について説明する
モデルの構築またはトレーニングに使用する開発アプローチを選択する
Azure Machine Learning ワークスペースの管理
Azure Machine Learning ワークスペースを作成する
ワークスペース操作用の開発者ツールを使用してワークスペースを管理する
ソース管理用に Git 統合を設定する
レジストリを作成して管理する
Azure Machine Learning ワークスペースのデータを管理する
Azure Storage のリソースを選択する
データストアの登録と維持
データ資産の作成と管理
Azure Machine Learning で実験用のコンピューティングを管理する
実験とトレーニングのコンピューティング先を作成する
機械学習ユース ケースの環境を選択する
Azure Synapse Spark プールやサーバーレス Spark コンピューティングを含む、アタッチされたコンピューティング リソースを構成する
コンピューティングの使用状況を監視する
データの探索とモデルのトレーニング (35 - 40%)
データ資産とデータ ストアを使用してデータを探す
対話型開発におけるデータへのアクセスとラングリング
Synapse Spark プールとサーバーレス Spark コンピューティングがアタッチされた対話型データをラングルする
Azure Machine Learning デザイナーを使用してモデルを作成する
トレーニング パイプラインを作成する
デザイナーからデータ資産を使用する
デザイナーでカスタム コード コンポーネントを使用する
責任ある AI のガイドラインを含むモデルを評価する
自動機械学習を使用して最適なモデルを探す
表形式データに自動機械学習を使用する
Computer Vision に自動機械学習を使用する
自然言語処理に自動機械学習を使用する
前処理やアルゴリズムを含む、トレーニング オプションの選択と理解
責任ある AI のガイドラインを含む、自動機械学習の実行を評価する
カスタム モデル トレーニングにノートブックを使用する
コンピューティング インスタンスを使用してコードを開発する
MLflow を使用してモデル トレーニングを追跡する
モデルを評価する
Python SDK v2 を使用してモデルをトレーニングする
ターミナルを使用してコンピューティング インスタンスを構成する
Azure Machine Learning でハイパーパラメーターを調整する
サンプリング方法を選択する
検索空間を定義する
プライマリ メトリックを定義する
早期終了オプションを定義する
デプロイ用のモデルを準備する (20 - 25%)
モデル トレーニング スクリプトを実行する
スクリプトのジョブ実行設定を構成する
ジョブ実行のコンピューティングを構成する
ジョブ内のデータ資産からデータを使用する
Azure Machine Learning を使用してスクリプトをジョブとして実行する
MLflow を使用してジョブ実行からメトリックをログする
ログを使用してジョブ実行エラーのトラブルシューティングを行う
ジョブ実行の環境を構成する
ジョブのパラメーターを定義する
トレーニング パイプラインを実装する
パイプラインを作成する
パイプライン内のステップ間でデータを渡す
パイプラインの実行とスケジュール設定
パイプラインの実行を監視する
カスタム コンポーネントを作成する
コンポーネントベースのパイプラインを使用する
Azure Machine Learning でモデルを管理する
MLflow モデルの出力について説明する
モデルをパッケージ化するための適切なフレームワークを特定する
責任ある AI の原則を使用してモデルを評価する
モデルのデプロイと再トレーニング (10 - 15%)
モデルをデプロイする
オンライン デプロイの設定を構成する
バッチ デプロイ用にコンピューティングを構成する
モデルをオンライン エンドポイントにデプロイする
バッチ エンドポイントにモデルをデプロイする
オンラインでデプロイされたサービスをテストする
バッチ エンドポイントを呼び出してバッチ スコアリング ジョブを開始する
機械学習の運用 (MLOps) のプラクティスを適用する
Azure DevOps または GitHub を含む、Azure Machine Learning ジョブをトリガーする
新しいデータの追加またはデータの変更に基づいてモデルの再トレーニングを自動化する
イベントベースの再トレーニング トリガーを定義する
学習リソース
試験を受ける前に、トレーニングを行い、実践的な経験を積むことをお勧めします。 自己学習のオプションとクラスルーム トレーニングのほか、ドキュメント、コミュニティ サイト、ビデオへのリンクも提供しています。
学習リソース | ラーニングおよびドキュメントへのリンク |
---|---|
トレーニングを受けよう | マイペースで進められるラーニング パスとモジュールを選択するか、講師による指導付きコースを受講する |
ドキュメントの検索 | Azure Databricks Azure Machine Learning Azure Synapse Analytics MLflow と Azure Machine Learning |
質問をする | Microsoft Q&A | Microsoft Docs |
コミュニティ サポートを受ける | AI - Machine Learning - Microsoft Tech Community AI - Machine Learning ブログ - Microsoft Tech Community |
Microsoft Learn をフォローする | Microsoft Learn - Microsoft Tech Community |
ビデオを見つける | Microsoft Learn ショー |
ログの変更
表を理解するための鍵: トピック グループ (機能グループとも呼ばれます) は太字の書体で、その後に各グループ内の目的が続きます。 表は、この試験で評価されるスキルの 2 つのバージョンを比較したもので、3 番目の列は変更の程度を示しています。
2024 年 7 月 17 日より前のスキル領域 | 2024 年 7 月 17 日時点のスキル領域 | Change |
---|---|---|
受講者のプロファイル | 変更なし | |
機械学習ソリューションの設計と準備 | 機械学習ソリューションの設計と準備 | 変更なし |
機械学習ソリューションを設計する | 機械学習ソリューションを設計する | 変更なし |
Azure Machine Learning ワークスペースの管理 | Azure Machine Learning ワークスペースの管理 | 変更なし |
Azure Machine Learning ワークスペースのデータを管理する | Azure Machine Learning ワークスペースのデータを管理する | 変更なし |
Azure Machine Learning で実験用のコンピューティングを管理する | Azure Machine Learning で実験用のコンピューティングを管理する | Minor |
データの探索とモデルのトレーニング | データの探索とモデルのトレーニング | 変更なし |
データ資産とデータ ストアを使用してデータを探す | データ資産とデータ ストアを使用してデータを探す | Minor |
Azure Machine Learning デザイナーを使用してモデルを作成する | Azure Machine Learning デザイナーを使用してモデルを作成する | 変更なし |
自動機械学習を使用して最適なモデルを探す | 自動機械学習を使用して最適なモデルを探す | 変更なし |
カスタム モデル トレーニングにノートブックを使用する | カスタム モデル トレーニングにノートブックを使用する | 変更なし |
Azure Machine Learning でハイパーパラメーターを調整する | Azure Machine Learning でハイパーパラメーターを調整する | 変更なし |
モデルをデプロイできるよう準備する | モデルをデプロイできるよう準備する | 変更なし |
モデル トレーニング スクリプトを実行する | モデル トレーニング スクリプトを実行する | 変更なし |
トレーニング パイプラインを実装する | トレーニング パイプラインを実装する | 変更なし |
Azure Machine Learning でモデルを管理する | Azure Machine Learning でモデルを管理する | 変更なし |
モデルのデプロイと再トレーニング | モデルのデプロイと再トレーニング | 変更なし |
モデルをデプロイする | モデルをデプロイする | 変更なし |
機械学習の運用 (MLOps) のプラクティスを適用する | 機械学習の運用 (MLOps) のプラクティスを適用する | 変更なし |
2024 年 7 月 17 日より前の評価されるスキル
視聴者プロフィール
この試験の受験者は、データ サイエンスと機械学習を応用して Azure で機械学習ワークロードを実装して実行するための、対象分野の専門知識を持っている必要があります。
このロールの責任には、以下が含まれます。
データ サイエンス ワークロードに適した作業環境の設計と作成。
データの探索。
機械学習モデルのトレーニング。
パイプラインの実装。
運用環境を準備するためのジョブの実行。
スケーラブルな機械学習ソリューションの管理、デプロイ、監視。
この試験の受験者には、以下を使用したデータ サイエンスの知識と経験が必要です。
Azure Machine Learning
MLflow
スキルの概要
機械学習ソリューションの設計と準備 (20 - 25%)
データの探索とモデルのトレーニング (35 - 40%)
デプロイ用のモデルを準備する (20 - 25%)
モデルのデプロイと再トレーニング (10 - 15%)
機械学習ソリューションの設計と準備 (20 - 25%)
機械学習ソリューションを設計する
トレーニング ワークロードに適したコンピューティング仕様を決定する
モデル デプロイの要件について説明する
モデルの構築またはトレーニングに使用する開発アプローチを選択する
Azure Machine Learning ワークスペースの管理
Azure Machine Learning ワークスペースを作成する
ワークスペース操作用の開発者ツールを使用してワークスペースを管理する
ソース管理用に Git 統合を設定する
レジストリを作成して管理する
Azure Machine Learning ワークスペースのデータを管理する
Azure Storage のリソースを選択する
データストアの登録と維持
データ資産の作成と管理
Azure Machine Learning で実験用のコンピューティングを管理する
実験とトレーニングのコンピューティング先を作成する
機械学習ユース ケースの環境を選択する
Apache Spark プールを含む、アタッチされたコンピューティング リソースを構成する
コンピューティングの使用状況を監視する
データの探索とモデルのトレーニング (35 - 40%)
データ資産とデータ ストアを使用してデータを探す
対話型開発におけるデータへのアクセスとラングリング
Apache Spark を使用した対話型データのラングリング
Azure Machine Learning デザイナーを使用してモデルを作成する
トレーニング パイプラインを作成する
デザイナーからデータ資産を使用する
デザイナーでカスタム コード コンポーネントを使用する
責任ある AI のガイドラインを含むモデルを評価する
自動機械学習を使用して最適なモデルを探す
表形式データに自動機械学習を使用する
Computer Vision に自動機械学習を使用する
自然言語処理に自動機械学習を使用する
前処理やアルゴリズムを含む、トレーニング オプションの選択と理解
責任ある AI のガイドラインを含む、自動機械学習の実行を評価する
カスタム モデル トレーニングにノートブックを使用する
コンピューティング インスタンスを使用してコードを開発する
MLflow を使用してモデル トレーニングを追跡する
モデルを評価する
Python SDK v2 を使用してモデルをトレーニングする
ターミナルを使用してコンピューティング インスタンスを構成する
Azure Machine Learning でハイパーパラメーターを調整する
サンプリング方法を選択する
検索空間を定義する
プライマリ メトリックを定義する
早期終了オプションを定義する
デプロイ用のモデルを準備する (20 - 25%)
モデル トレーニング スクリプトを実行する
スクリプトのジョブ実行設定を構成する
ジョブ実行のコンピューティングを構成する
ジョブ内のデータ資産からデータを使用する
Azure Machine Learning を使用してスクリプトをジョブとして実行する
MLflow を使用してジョブ実行からメトリックをログする
ログを使用してジョブ実行エラーのトラブルシューティングを行う
ジョブ実行の環境を構成する
ジョブのパラメーターを定義する
トレーニング パイプラインを実装する
パイプラインを作成する
パイプライン内のステップ間でデータを渡す
パイプラインの実行とスケジュール設定
パイプラインの実行を監視する
カスタム コンポーネントを作成する
コンポーネントベースのパイプラインを使用する
Azure Machine Learning でモデルを管理する
MLflow モデルの出力について説明する
モデルをパッケージ化するための適切なフレームワークを特定する
責任ある AI の原則を使用してモデルを評価する
モデルのデプロイと再トレーニング (10 - 15%)
モデルをデプロイする
オンライン デプロイの設定を構成する
バッチ デプロイ用にコンピューティングを構成する
モデルをオンライン エンドポイントにデプロイする
バッチ エンドポイントにモデルをデプロイする
オンラインでデプロイされたサービスをテストする
バッチ エンドポイントを呼び出してバッチ スコアリング ジョブを開始する
機械学習の運用 (MLOps) のプラクティスを適用する
Azure DevOps または GitHub を含む、Azure Machine Learning ジョブをトリガーする
新しいデータの追加またはデータの変更に基づいてモデルの再トレーニングを自動化する
イベントベースの再トレーニング トリガーを定義する