Bevezetés az Azure Databricks használatába
Az Azure Databricks egy felhőalapú adatelemzési platform, amely egységes környezetet biztosít az adatelemzéshez, a gépi tanuláshoz és az elemzéshez. Az Azure Databrickset a Databrickskel együttműködve tervezték, amelynek vezetősége létrehozta az Apache Sparkot. Az Azure Databricks gyors, egyszerű és együttműködésen alapuló Apache Spark-alapú elemzési szolgáltatást kínál. Ez a platform mélyen integrálható az Azure egyéb szolgáltatásaival, így zökkenőmentes felhasználói élményt nyújt a fokozott biztonság, teljesítmény és skálázhatóság terén. Lehetővé teszi az adatvezérelt feladatokat, például az adat-előkészítést, a gépi tanulást és az adatelemzési munkafolyamatokat, így sokoldalú eszközként szolgál a big dataok erejét kihasználni kívánó szervezetek számára.
Az Azure Databricks fő funkciói közé tartozik a Microsoft Entra ID-val való natív integrációja, valamint más Azure-szolgáltatások, például az Azure Storage, az Azure Data Lake Storage és az Azure Cosmos DB használatára való képessége. A platform egy interaktív munkaterületet is kínál, amely elősegíti az adattudósok, az adatmérnökök és az üzleti elemzők közötti együttműködést. Ez az együttműködésen alapuló környezeti támogatás különböző programozási nyelveket, például a Pythont, a Scalát, az R-t és az SQL-t, így a csapatok hatékonyan fejleszthetik és iterálhatják adatmodelljeiket. Az Azure Databricks emellett úgy lett kialakítva, hogy egyszerűen méretezhető legyen, és kezelje a gépi tanulási algoritmusok számítási igényeit és a nagy adathalmazok feldolgozási igényeit.
Azure Databricks-munkaterület létrehozása
Az Azure Databricks használatához létre kell hoznia egy Azure Databricks-munkaterületet az Azure-előfizetésében. Ezt a következő módon teheti meg:
- Az Azure Portal felhasználói felületének használata
- Azure Resource Manager-sablon (ARM) vagy Bicep-sablon használata
- A New-AzDatabricksWorkspace Azure PowerShell-parancsmag használata
- Az az databricks-munkaterület használatával hozza létre az Azure parancssori felületének (CLI) parancsát
Munkaterület létrehozásakor meg kell adnia az alábbi tarifacsomagok egyikét.
- Standard – Core Apache Spark-képességek a Microsoft Entra ID-integrációval.
- Prémium – Szerepköralapú hozzáférés-vezérlők és más vállalati szintű funkciók.
- Próbaverzió – Prémium szintű munkaterület 14 napos ingyenes próbaverziója
Az Azure Databricks Portál használata
Miután kiépített egy Azure Databricks-munkaterületet, az Azure Databricks portál használatával dolgozhat adatokkal és számítási erőforrásokkal. Az Azure Databricks portál egy webes felhasználói felület, ahol létrehozhat és kezelhet munkaterületi erőforrásokat, például Spark-fürtöket, és jegyzetfüzetek és lekérdezések használatával dolgozhat fájlokban és táblákban tárolt adatokkal.