Identifikace úloh Azure Databricks
Azure Databricks nabízí možnosti pro různé úlohy, včetně strojového učení a modely velkého jazyka (LLM), data science, datové inženýrství, BI, datové sklady a streamování.
Datové Inženýrství
Azure Databricks poskytuje možnosti pro datové vědce a techniky, kteří potřebují spolupracovat na složitých úlohách zpracování dat. Poskytuje integrované prostředí s Apache Sparkem pro zpracování velkých objemů dat v datovém jezeře a podporuje více jazyků, včetně Pythonu, R, Scaly a SQL. Platforma usnadňuje zkoumání, vizualizaci dat a vývoj datových kanálů.
Machine Learning
Azure Databricks podporuje vytváření, trénování a nasazování modelů strojového učení ve velkém měřítku. Zahrnuje MLflow, opensourcovou platformu pro správu životního cyklu ML, včetně experimentování, reprodukovatelnosti a nasazení. Podporuje také různé architektury ML, jako jsou TensorFlow, PyTorch a Scikit-learn, díky čemuž je univerzální pro různé úlohy ML.
SQL
Datoví analytici, kteří primárně pracují s daty prostřednictvím SQL, můžou používat SQL Warehouse v Azure Databricks. Uživatelské rozhraní pracovního prostoru Azure Databricks poskytuje známý editor SQL, řídicí panely a nástroje pro automatické vizualizace pro analýzu a vizualizaci dat přímo v Azure Databricks. Tato úloha je ideální pro spouštění rychlých ad hoc dotazů a vytváření sestav z velkých datových sad.
Poznámka:
Sklady SQL jsou součástí úrovně Premium (nebo vyšší). Pracovní prostor Standard neposkytuje sklady SQL.