Azure Databricks を使用してデータ エンジニアリング ソリューションを実装する
クラウドで大規模な Data Engineering ワークロードを実行するために、Azure Databricks プラットフォームで実行されている Apache Spark と強力なクラスターの機能の活用方法について説明します。
前提条件
なし
実績コード
実績コードを要求しますか?
このラーニング パス内のモジュール
Spark 構造化ストリーミングを使用した増分処理を理解し、操作するためのさまざまな機能やツールについて説明します。
Azure Databricks Delta Live Tables でアーキテクチャ パターンを開発するのに役立つさまざまな機能やツールを探索します。
Azure Databricks で Spark および Delta Live Tables を使用してパフォーマンスを最適化する方法について学習します。
Azure Databricks で CI/CD ワークフローを実装して、コード変更の統合と配信を自動化する方法について説明します。
Azure Databricks Jobs を使用してデータ ワークフローのオーケストレーションとスケジューリングを行う方法を学習します。 複雑なパイプラインを定義して監視し、Azure Data Factory や Azure DevOps などのツールとの統合を行い、手動による介入を減らすことで、効率の改善、分析の高速化、ビジネス ニーズへの適応を実現します。
このモジュールでは、Unity Catalog などのツールを使用して Azure Databricks 内のデータをセキュリティで保護して管理するのに役立つさまざまな機能とアプローチについて確認します。
Azure Databricks には、データ アナリストが使い慣れたリレーショナル SQL クエリを使用してデータを操作できる SQL Warehouse が用意されています。
Azure Data Factory のパイプラインを使用して Azure Databricks でノートブックを実行すると、クラウド規模でデータ エンジニアリング プロセスを自動化できます。