Identificer Azure Databricks-arbejdsbelastninger
Azure Databricks tilbyder funktioner til forskellige arbejdsbelastninger, herunder Machine Learning og LLM (Large Language Models), Data Science, Data Engineering, BI og Data Warehousing og Streaming Processing.
Data Engineering
Azure Databricks indeholder funktioner til dataspecialister og -teknikere, der har brug for at samarbejde om komplekse databehandlingsopgaver. Det giver et integreret miljø med Apache Spark til big data-behandling i et data lakehouse og understøtter flere sprog, herunder Python, R, Scala og SQL. Platformen faciliterer dataudforskning, visualisering og udvikling af datapipelines.
Machine Learning
Azure Databricks understøtter bygning, oplæring og udrulning af modeller til maskinel indlæring i stor skala. Det omfatter MLflow, en platform med åben kildekode til administration af ML-livscyklussen, herunder eksperimentering, reproducerbarhed og udrulning. Den understøtter også forskellige ML-strukturer som TensorFlow, PyTorch og Scikit-learn, hvilket gør den alsidig til forskellige ML-opgaver.
SQL
Dataanalytikere, der primært interagerer med data via SQL, kan bruge SQL-lagre i Azure Databricks. Brugergrænsefladen til Azure Databricks Workspace indeholder en velkendt SQL-editor, dashboards og automatiske visualiseringsværktøjer til analyse og visualisering af data direkte i Azure Databricks. Denne arbejdsbelastning er ideel til at køre hurtige ad hoc-forespørgsler og oprette rapporter ud fra store datasæt.
Notat
SQL-lagersteder er inkluderet i Premium-niveauet (eller højere). Standardarbejdsområdet indeholder ikke SQL-lagersteder.