Databricks Data Engineering

[アーティクル]
03/18/2024

Databricks Data Engineering の機能は、データサイエンティスト、データエンジニア、データアナリスト間のコラボレーションを実現するための堅牢な環境です。 Data Engineering のタスクは、Databricks 機械学習ソリューションのバックボーンでもあります。

注意

主に SQL クエリと BI ツールを使用するデータアナリストの場合、Databricks SQL を使用することをお勧めします。

名前	使用目的
Delta Live Tables	Databricks Delta Live Tables を使用してインジェストと変換用のデータパイプラインを構築する方法について説明します。
構造化ストリーミング	Databricks での構造化ストリーミングを利用した、ストリーミング、増分、リアルタイムのワークロードについて説明します。
Apache Spark	Databricks と Databricks プラットフォームで Apache Spark がどのように動作するかについて説明します。
Compute	Databricks のクラスターと、それらを作成および管理する方法について説明します。
Notebook	Databricks ノートブックとは何か、およびノートブックを使用してデータを処理、分析、視覚化する方法について説明します。
ワークフロー	Databricks プラットフォームでデータ処理、機械学習、データ分析のワークフローを調整する方法について説明します。
ライブラリ	ライブラリを使用して Databricks でサードパーティまたはカスタムのコードを使用できるようにする方法について説明します。 Databricks にライブラリをインストールするためのさまざまなモードについて説明します。
Git フォルダー	Databricks で開発するために、Git を使用して、ノートブックやその他のファイルのバージョン管理を行う方法について説明します。
DBFS	Databricks File System (DBFS) (Databricks ワークスペースにマウントされ、Databricks クラスター上で使用できる分散ファイルシステム) について説明します。
ファイル	Databricks 上のファイルを操作するためのオプションについて説明します。
移行	ETL ジョブ、エンタープライズデータウェアハウス、ML、データサイエンス、分析などのデータアプリケーションを Databricks に移行する方法について説明します。
最適化とパフォーマンス	Databricks の最適化とパフォーマンスに関する推奨事項について説明します。