Not defterlerinde Spark kullanma

Tamamlandı

Python veya Scala betiklerindeki kod, Java Arşivi (JAR) olarak derlenmiş Java kodu ve diğerleri dahil olmak üzere Spark üzerinde birçok farklı türde uygulama çalıştırabilirsiniz. Spark genellikle iki tür iş yükünde kullanılır:

  • Genellikle otomatik bir işlem hattının parçası olarak çalışan verileri almak, temizlemek ve dönüştürmek için toplu iş veya akış işleme işleri.
  • Verileri keşfetmek, analiz etmek ve görselleştirmek için etkileşimli analiz oturumları.

Spark kodunu not defterlerinde çalıştırma

Azure Databricks, Spark ile çalışmaya yönelik tümleşik bir not defteri arabirimi içerir. Not defterleri, kodu veri bilimcileri ve veri analistleri tarafından yaygın olarak kullanılan Markdown notlarıyla birleştirmek için sezgisel bir yol sağlar. Azure Databricks'te tümleşik not defteri deneyiminin genel görünümü, popüler bir açık kaynak not defteri platformu olan Jupyter not defterlerine benzer.

Azure Databricks'teki bir not defterinin ekran görüntüsü.

Not defterleri, her biri kod veya markdown içeren bir veya daha fazla hücreden oluşur. Not defterlerindeki kod hücreleri, daha üretken olmanıza yardımcı olabilecek bazı özelliklere sahiptir:

  • Söz dizimi vurgulama ve hata desteği.
  • Kod otomatik tamamlama.
  • Etkileşimli veri görselleştirmeleri.
  • Sonuçları dışarı aktarma özelliği.

İpucu

Azure Databricks'te not defterleriyle çalışma hakkında daha fazla bilgi edinmek için Azure Databricks belgelerindeki Not Defterleri makalesine bakın.