Použití Sparku v poznámkových blocích

6 min

Ve Sparku můžete spustit mnoho různých druhů aplikací, včetně kódu ve skriptech Pythonu nebo Scala, kódu Java zkompilovaného jako Java Archive (JAR) a dalších. Spark se běžně používá ve dvou typech úloh:

Úlohy dávkového zpracování nebo zpracování datových proudů za účelem ingestování, čištění a transformace dat – často běží jako součást automatizovaného kanálu.
Interaktivní analytické relace pro zkoumání, analýzu a vizualizaci dat

Spouštění kódu Sparku v poznámkových blocích

Azure Databricks obsahuje integrované rozhraní poznámkového bloku pro práci se Sparkem. Poznámkové bloky poskytují intuitivní způsob kombinování kódu s poznámkami Markdownu, které běžně používají datoví vědci a datoví analytici. Vzhled a chování integrovaného prostředí poznámkového bloku v Azure Databricks je podobné jako u poznámkových bloků Jupyter – oblíbené opensourcové platformy poznámkových bloků.

Snímek obrazovky s poznámkovým blokem v Azure Databricks

Poznámkové bloky se skládají z jedné nebo více buněk, z nichž každá obsahuje kód nebo markdown. Buňky kódu v poznámkových blocích mají některé funkce, které vám můžou pomoct zvýšit produktivitu, včetně těchto:

Podpora zvýrazňování syntaxe a chyb
Automatické dokončování kódu
Interaktivní vizualizace dat
Možnost exportu výsledků

Tip

Další informace o práci s poznámkovými bloky v Azure Databricks najdete v článku Poznámkové bloky v dokumentaci k Azure Databricks.

Pokračovat

Použití Sparku v poznámkových blocích

Spouštění kódu Sparku v poznámkových blocích

Váš názor