Bevezetés az Azure Databricks használatába

Befejeződött

Az Azure Databricks egy felhőalapú adatelemzési platform, amely egységes környezetet biztosít az adatelemzéshez, a gépi tanuláshoz és az elemzéshez. Az Azure Databrickset a Databrickskel együttműködve tervezték, amelynek vezetősége létrehozta az Apache Sparkot. Az Azure Databricks gyors, egyszerű és együttműködésen alapuló Apache Spark-alapú elemzési szolgáltatást kínál. Ez a platform mélyen integrálható az Azure egyéb szolgáltatásaival, így zökkenőmentes felhasználói élményt nyújt a fokozott biztonság, teljesítmény és skálázhatóság terén. Lehetővé teszi az adatvezérelt feladatokat, például az adat-előkészítést, a gépi tanulást és az adatelemzési munkafolyamatokat, így sokoldalú eszközként szolgál a big dataok erejét kihasználni kívánó szervezetek számára.

Az Azure Databricks fő funkciói közé tartozik a Microsoft Entra ID-val való natív integrációja, valamint más Azure-szolgáltatások, például az Azure Storage, az Azure Data Lake Storage és az Azure Cosmos DB használatára való képessége. A platform egy interaktív munkaterületet is kínál, amely elősegíti az adattudósok, az adatmérnökök és az üzleti elemzők közötti együttműködést. Ez az együttműködésen alapuló környezeti támogatás különböző programozási nyelveket, például a Pythont, a Scalát, az R-t és az SQL-t, így a csapatok hatékonyan fejleszthetik és iterálhatják adatmodelljeiket. Az Azure Databricks emellett úgy lett kialakítva, hogy egyszerűen méretezhető legyen, és kezelje a gépi tanulási algoritmusok számítási igényeit és a nagy adathalmazok feldolgozási igényeit.

Azure Databricks-munkaterület létrehozása

Az Azure Databricks használatához létre kell hoznia egy Azure Databricks-munkaterületet az Azure-előfizetésében. Ezt a következő módon teheti meg:

  • Az Azure Portal felhasználói felületének használata
  • Azure Resource Manager-sablon (ARM) vagy Bicep-sablon használata
  • A New-AzDatabricksWorkspace Azure PowerShell-parancsmag használata
  • Az az databricks-munkaterület használatával hozza létre az Azure parancssori felületének (CLI) parancsát

Munkaterület létrehozásakor meg kell adnia az alábbi tarifacsomagok egyikét.

  • Standard – Core Apache Spark-képességek a Microsoft Entra ID-integrációval.
  • Prémium – Szerepköralapú hozzáférés-vezérlők és más vállalati szintű funkciók.
  • Próbaverzió – Prémium szintű munkaterület 14 napos ingyenes próbaverziója

Azure Databricks

Az Azure Databricks Portál használata

Miután kiépített egy Azure Databricks-munkaterületet, az Azure Databricks portál használatával dolgozhat adatokkal és számítási erőforrásokkal. Az Azure Databricks portál egy webes felhasználói felület, ahol létrehozhat és kezelhet munkaterületi erőforrásokat, például Spark-fürtöket, és jegyzetfüzetek és lekérdezések használatával dolgozhat fájlokban és táblákban tárolt adatokkal.

Azure Databricks portál