Azure Databricks-workloads identificeren

Voltooid

Azure Databricks is een uitgebreid platform dat veel mogelijkheden voor gegevensverwerking biedt. Hoewel u de service kunt gebruiken ter ondersteuning van elke workload waarvoor schaalbare gegevensverwerking is vereist, ondersteunt Azure Databricks met name de volgende typen gegevensworkloads:

  • Datawetenschap en engineering
  • Machine Learning
  • SQL*

*SQL-workloads zijn alleen beschikbaar in werkruimten in de Premium-laag.

Datawetenschap en engineering

Azure Databricks biedt op Apache Spark gebaseerde opname, verwerking en analyse van grote hoeveelheden gegevens in een Data Lakehouse. Data engineers, gegevenswetenschappers en gegevensanalisten kunnen interactieve notebooks gebruiken om code uit te voeren in Python, Scala, SparkSQL of andere talen om gegevens op te schonen, transformeren, aggregeren en analyseren.

Een schermopname van de Azure Databricks-portal voor data science en engineering.

Machine Learning

Azure Databricks biedt ondersteuning voor machine learning-workloads die betrekking hebben op het verkennen en voorbereiden van gegevens, het trainen en evalueren van machine learning-modellen en het leveren van modellen voor het genereren van voorspellingen voor toepassingen en analyses. Gegevenswetenschappers en ML-technici kunnen AutoML gebruiken om snel voorspellende modellen te trainen of hun vaardigheden toe te passen met algemene machine learning-frameworks zoals SparkML, Scikit-Learn, PyTorch en Tensorflow. Ze kunnen ook de end-to-end levenscyclus van machine learning beheren met MLFlow.

Een schermopname van de Azure Databricks-portal voor machine learning.

Datawarehousing

Azure Databricks ondersteunt query's op basis van SQL voor gegevens die zijn opgeslagen in tabellen in een SQL Warehouse. Met deze mogelijkheid kunnen gegevensanalisten gegevens opvragen, aggregeren, samenvatten en visualiseren met behulp van vertrouwde SQL-syntaxis en een breed scala aan hulpprogramma's voor gegevensanalyse en visualisatie op basis van SQL.

Een schermopname van de Azure Databricks-portal voor SQL.

Notitie

SQL Warehouses zijn alleen beschikbaar in premium Azure Databricks-werkruimten.