Databricks Data Engineering

Databricks Data Engineering の機能は、データ サイエンティスト、データ エンジニア、データ アナリスト間のコラボレーションを実現するための堅牢な環境です。 Data Engineering のタスクは、Databricks 機械学習ソリューションのバックボーンでもあります。

注意

主に SQL クエリと BI ツールを使用するデータ アナリストの場合、Databricks SQL を使用することをお勧めします。

名前 使用目的
Delta Live Tables Databricks Delta Live Tables を使用してインジェストと変換用のデータ パイプラインを構築する方法について説明します。
構造化ストリーミング Databricks での構造化ストリーミングを利用した、ストリーミング、増分、リアルタイムのワークロードについて説明します。
Apache Spark Databricks と Databricks プラットフォームで Apache Spark がどのように動作するかについて説明します。
Compute Databricks のクラスターと、それらを作成および管理する方法について説明します。
Notebook Databricks ノートブックとは何か、およびノートブックを使用してデータを処理、分析、視覚化する方法について説明します。
ワークフロー Databricks プラットフォームでデータ処理、機械学習、データ分析のワークフローを調整する方法について説明します。
ライブラリ ライブラリを使用して Databricks でサード パーティまたはカスタムのコードを使用できるようにする方法について説明します。 Databricks にライブラリをインストールするためのさまざまなモードについて説明します。
Git フォルダー Databricks で開発するために、Git を使用して、ノートブックやその他のファイルのバージョン管理を行う方法について説明します。
DBFS Databricks File System (DBFS) (Databricks ワークスペースにマウントされ、Databricks クラスター上で使用できる分散ファイル システム) について説明します。
ファイル Databricks 上のファイルを操作するためのオプションについて説明します。
移行 ETL ジョブ、エンタープライズ データ ウェアハウス、ML、データ サイエンス、分析などのデータ アプリケーションを Databricks に移行する方法について説明します。
最適化とパフォーマンス Databricks の最適化とパフォーマンスに関する推奨事項について説明します。