Spark használata jegyzetfüzetekben

Befejeződött

Számos különböző alkalmazást futtathat a Sparkban, beleértve a Python- vagy Scala-szkriptekben lévő kódot, a Java-archívumként (JAR) lefordított Java-kódot és másokat. A Sparkot általában kétféle számítási feladatban használják:

  • Kötegelt vagy streamelési feladatok az adatok betöltésére, tisztítására és átalakítására – gyakran automatizált folyamat részeként futnak.
  • Interaktív elemzési munkamenetek az adatok feltárásához, elemzéséhez és vizualizációihoz.

Spark-kód futtatása jegyzetfüzetekben

Az Azure Databricks beépített notebook-felületet tartalmaz a Spark használatához. A jegyzetfüzetek intuitív módon kombinálják a kódot Markdown-jegyzetekkel, amelyeket gyakran használnak adattudósok és adatelemzők. Az Azure Databricks integrált jegyzetfüzet-felületének megjelenése és hangulata hasonló a Jupyter notebookok megjelenéséhez – ez egy népszerű nyílt forráskód notebookplatform.

Képernyőkép egy jegyzetfüzetről az Azure Databricksben.

A jegyzetfüzetek egy vagy több cellából állnak, amelyek mindegyike kódból vagy markdownból áll. A jegyzetfüzetek kódcellái olyan funkciókkal rendelkeznek, amelyek segíthetnek a hatékonyabb munkavégzésben, például:

  • Szintaxiskiemelés és hibatámogatás.
  • Kód automatikus kitöltése.
  • Interaktív adatvizualizációk.
  • Az eredmények exportálásának képessége.

Tipp.

A jegyzetfüzetek Azure Databricksben való használatával kapcsolatos további információkért tekintse meg az Azure Databricks dokumentációjának Jegyzetfüzetek című cikkét.