Databricks Data Engineering
Databricks Data Engineering の機能は、データ サイエンティスト、データ エンジニア、データ アナリスト間のコラボレーションを実現するための堅牢な環境です。 Data Engineering のタスクは、Databricks 機械学習ソリューションのバックボーンでもあります。
注意
主に SQL クエリと BI ツールを使用するデータ アナリストの場合、Databricks SQL を使用することをお勧めします。
名前 | 使用目的 |
---|---|
Delta Live Tables | Databricks Delta Live Tables を使用してインジェストと変換用のデータ パイプラインを構築する方法について説明します。 |
構造化ストリーミング | Databricks での構造化ストリーミングを利用した、ストリーミング、増分、リアルタイムのワークロードについて説明します。 |
Apache Spark | Databricks と Databricks プラットフォームで Apache Spark がどのように動作するかについて説明します。 |
Compute | Databricks のクラスターと、それらを作成および管理する方法について説明します。 |
Notebook | Databricks ノートブックとは何か、およびノートブックを使用してデータを処理、分析、視覚化する方法について説明します。 |
ワークフロー | Databricks プラットフォームでデータ処理、機械学習、データ分析のワークフローを調整する方法について説明します。 |
ライブラリ | ライブラリを使用して Databricks でサード パーティまたはカスタムのコードを使用できるようにする方法について説明します。 Databricks にライブラリをインストールするためのさまざまなモードについて説明します。 |
Git フォルダー | Databricks で開発するために、Git を使用して、ノートブックやその他のファイルのバージョン管理を行う方法について説明します。 |
DBFS | Databricks File System (DBFS) (Databricks ワークスペースにマウントされ、Databricks クラスター上で使用できる分散ファイル システム) について説明します。 |
ファイル | Databricks 上のファイルを操作するためのオプションについて説明します。 |
移行 | ETL ジョブ、エンタープライズ データ ウェアハウス、ML、データ サイエンス、分析などのデータ アプリケーションを Databricks に移行する方法について説明します。 |
最適化とパフォーマンス | Databricks の最適化とパフォーマンスに関する推奨事項について説明します。 |