Identyfikowanie obciążeń usługi Azure Databricks
Azure Databricks to kompleksowa platforma, która oferuje wiele możliwości przetwarzania danych. Usługę można używać do obsługi dowolnego obciążenia wymagającego skalowalnego przetwarzania danych, jednak usługa Azure Databricks obsługuje szczególnie następujące typy obciążeń danych:
- Nauka o danych i inżynieria
- Usługa Machine Learning
- SQL*
*Obciążenia SQL są dostępne tylko w obszarach roboczych warstwy Premium.
Nauka o danych i inżynieria
Usługa Azure Databricks zapewnia oparte na platformie Apache Spark pozyskiwanie, przetwarzanie i analizę dużych ilości danych w magazynie typu data lakehouse. Inżynierowie danych, analitycy danych i analitycy danych mogą używać notesów interaktywnych do uruchamiania kodu w języku Python, Scala, SparkSQL lub innych językach w celu czyszczenia, przekształcania, agregowania i analizowania danych.
Usługa Machine Learning
Usługa Azure Databricks obsługuje obciążenia uczenia maszynowego, które obejmują eksplorowanie i przygotowywanie danych, trenowanie i ocenianie modeli uczenia maszynowego oraz obsługę modeli w celu generowania przewidywań dla aplikacji i analiz. Analitycy danych i inżynierowie uczenia maszynowego mogą używać rozwiązania AutoML do szybkiego trenowania modeli predykcyjnych lub stosować swoje umiejętności przy użyciu typowych struktur uczenia maszynowego, takich jak SparkML, Scikit-Learn, PyTorch i Tensorflow. Mogą również zarządzać całym cyklem życia uczenia maszynowego za pomocą rozwiązania MLFlow.
Magazynowanie danych
Usługa Azure Databricks obsługuje wykonywanie zapytań opartych na języku SQL dla danych przechowywanych w tabelach w usłudze SQL Warehouse. Ta funkcja umożliwia analitykom danych wykonywanie zapytań, agregowanie, podsumowywanie i wizualizowanie danych przy użyciu znanej składni SQL oraz szerokiej gamy narzędzi do analizy danych i wizualizacji opartych na języku SQL.
Uwaga
Usługi SQL Warehouse są dostępne tylko w obszarach roboczych usługi Azure Databricks w warstwie Premium .