Az Azure Databricks számítási feladatainak azonosítása
Az Azure Databricks különböző számítási feladatokhoz kínál képességeket, beleértve a machine learning és a nagy nyelvi modelleket (LLM), a Adattudomány, a adatmérnök inget, a BI-t és a Adattárolás, valamint a streamfeldolgozást.
adattervezés
Az Azure Databricks olyan adattudósok és mérnökök számára nyújt képességeket, akiknek összetett adatfeldolgozási feladatokon kell együttműködnie. Integrált környezetet biztosít az Apache Sparkkal a big data-feldolgozáshoz egy data lakehouse-ban, és több nyelvet is támogat, például a Pythont, az R-t, a Scalát és az SQL-t. A platform elősegíti az adatfeltárást, a vizualizációt és az adatfolyamok fejlesztését.
Gépi tanulás
Az Azure Databricks támogatja a gépi tanulási modellek nagy méretekben történő kiépítését, betanítását és üzembe helyezését. Ez magában foglalja az MLflow-t, egy nyílt forráskódú platformot az ML életciklusának kezeléséhez, beleértve a kísérletezést, a reprodukálhatóságot és az üzembe helyezést. Emellett támogatja a különböző ML-keretrendszereket, például a TensorFlow-t, a PyTorch-t és a Scikit-learn-t, így sokoldalúan használható a különböző ML-feladatokhoz.
SQL
Azok az adatelemzők, akik elsősorban sql-en keresztül kommunikálnak az adatokkal, sql-raktárakat használhatnak az Azure Databricksben. Az Azure Databricks Workspace felhasználói felülete ismerős SQL-szerkesztőt, irányítópultokat és automatikus vizualizációs eszközöket biztosít az adatok közvetlenül az Azure Databricksben való elemzéséhez és vizualizációjához. Ez a számítási feladat ideális gyors alkalmi lekérdezések futtatásához és nagy adatkészletekből származó jelentések létrehozásához.
Megjegyzés:
Az SQL-raktárak a Prémium (vagy magasabb) szint részét képezik. A standard munkaterület nem biztosít SQL-raktárakat.