Identifiera Azure Databricks-arbetsbelastningar

Fullbordad

Azure Databricks erbjuder funktioner för olika arbetsbelastningar som maskininlärning och stora språkmodeller (LLM), datavetenskap, dataingenjöring, Business Intelligence (BI) och datalagring samt strömningsbearbetning.

Datateknik

Azure Databricks tillhandahåller funktioner för dataforskare och tekniker som behöver samarbeta om komplexa databehandlingsuppgifter. Den tillhandahåller en integrerad miljö med Apache Spark för stordatabearbetning i ett datasjöhus och har stöd för flera språk, inklusive Python, R, Scala och SQL. Plattformen underlättar datautforskning, visualisering och utveckling av datapipelines.

Diagram över skärmen Databricks-datainmatning och datakällor.

Machine Learning

Azure Databricks har stöd för att skapa, träna och distribuera maskininlärningsmodeller i stor skala. Den innehåller MLflow, en plattform med öppen källkod för att hantera ML-livscykeln, inklusive experimentering, reproducerbarhet och distribution. Det stöder också olika ML-ramverk som TensorFlow, PyTorch och Scikit-learn, vilket gör det mångsidigt för olika ML-uppgifter.

Diagram över Databricks Machine Learning-skärmen.

SQL

Dataanalytiker som främst interagerar med data via SQL kan använda SQL-lager i Azure Databricks. Användargränssnittet för Azure Databricks-arbetsytan innehåller en välbekant SQL-redigerare, instrumentpaneler och automatiska visualiseringsverktyg för att analysera och visualisera data direkt i Azure Databricks. Den här arbetsbelastningen är perfekt för att köra snabba ad hoc-frågor och skapa rapporter från stora datauppsättningar.

Diagram över skärmen DatabricksSQL-redigerare.

Anmärkning

SQL-lager ingår på premiumnivån (eller högre). Standardarbetsytan tillhandahåller inte SQL-lager.