Spark használata jegyzetfüzetekben
Számos különböző alkalmazást futtathat a Sparkban, beleértve a Python- vagy Scala-szkriptekben lévő kódot, a Java-archívumként (JAR) lefordított Java-kódot és másokat. A Sparkot általában kétféle számítási feladatban használják:
- Kötegelt vagy streamelési feladatok az adatok betöltésére, tisztítására és átalakítására – gyakran automatizált folyamat részeként futnak.
- Interaktív elemzési munkamenetek az adatok feltárásához, elemzéséhez és vizualizációihoz.
Spark-kód futtatása jegyzetfüzetekben
Az Azure Databricks beépített notebook-felületet tartalmaz a Spark használatához. A jegyzetfüzetek intuitív módon kombinálják a kódot Markdown-jegyzetekkel, amelyeket gyakran használnak adattudósok és adatelemzők. Az Azure Databricks integrált jegyzetfüzet-felületének megjelenése és hangulata hasonló a Jupyter notebookok megjelenéséhez – ez egy népszerű nyílt forráskód notebookplatform.
A jegyzetfüzetek egy vagy több cellából állnak, amelyek mindegyike kódból vagy markdownból áll. A jegyzetfüzetek kódcellái olyan funkciókkal rendelkeznek, amelyek segíthetnek a hatékonyabb munkavégzésben, például:
- Szintaxiskiemelés és hibatámogatás.
- Kód automatikus kitöltése.
- Interaktív adatvizualizációk.
- Az eredmények exportálásának képessége.
Tipp.
A jegyzetfüzetek Azure Databricksben való használatával kapcsolatos további információkért tekintse meg az Azure Databricks dokumentációjának Jegyzetfüzetek című cikkét.