Azure Databricks ワークロードを特定する

完了

Azure Databricks には、Machine Learning と大規模言語モデル (LLM)、Data Science、Data Engineering、BI とデータ ウェアハウス、ストリーミング処理など、さまざまなワークロード向けの機能が用意されています。

Data Engineering

Azure Databricks には、複雑なデータ処理タスクで共同作業を行う必要があるデータ サイエンティストやエンジニア向けの機能が用意されています。 データ レイクハウスでのビッグ データ処理用に Apache Spark と統合された環境を提供し、Python、R、Scala、SQL などの複数の言語をサポートします。 このプラットフォームにより、データの探索、視覚化、およびデータ パイプラインの開発が容易になります。

Databricks のデータ インジェストとデータ ソースの画面の図。

Machine Learning

Azure Databricks では、大規模な機械学習モデルの構築、トレーニング、デプロイがサポートされています。 これには、実験、再現性、デプロイなど、ML ライフサイクルを管理するためのオープンソース プラットフォームである MLflow が含まれています。 また、TensorFlow、PyTorch、Scikit-learn などのさまざまな ML フレームワークもサポートされているため、さまざまな ML タスクに対応できます。

Databricks Machine Learning 画面の図。

SQL

主に SQL を介してデータを操作するデータ アナリストは、Azure Databricks の SQL ウェアハウスを使用できます。 Azure Databricks ワークスペース UI には、Azure Databricks 内で直接データを分析および視覚化するための使い慣れた SQL エディター、ダッシュボード、自動視覚化ツールが用意されています。 このワークロードは、クイック アドホック クエリを実行したり、大規模なデータセットからレポートを作成したりするのに最適です。

DatabricksSQL エディター画面の図。

SQL ウェアハウスは、Premium (またはそれ以上) レベルに含まれています。 Standard ワークスペースでは、SQL ウェアハウスは提供されません。