Bagikan melalui


Streaming di Azure Databricks

Anda dapat menggunakan Azure Databricks untuk penyerapan data hampir real time, pemrosesan, pembelajaran mesin, dan AI untuk data streaming.

Azure Databricks menawarkan banyak pengoptimalan untuk streaming dan pemrosesan bertahap, termasuk yang berikut ini:

Delta Lake menyediakan lapisan penyimpanan untuk integrasi ini. Lihat Pembacaan dan penulisan streaming tabel Delta.

Untuk penyajian model real time, lihat Penyajian model dengan Azure Databricks.

  • Tutorial

    Pelajari dasar-dasar pemrosesan mendekati real-time dan inkremental dengan Streaming Terstruktur di Azure Databricks.

  • Konsep

    Pelajari konsep inti untuk mengonfigurasi beban kerja inkremental dan hampir real-time dengan Streaming Terstruktur.

  • Streaming stateful

    Mengelola informasi status menengah dari kueri Streaming Terstruktur stateful dapat membantu mencegah latensi dan masalah produksi yang tidak terduga.

  • Pertimbangan produksi

    Artikel ini berisi rekomendasi untuk mengonfigurasikan beban kerja pemrosesan inkremental produksi dengan Streaming Terstruktur di Azure Databricks guna memenuhi persyaratan latensi dan biaya untuk aplikasi real time atau batch.

  • Memantau aliran

    Pelajari cara memantau aplikasi Streaming Terstruktur di Azure Databricks.

  • Integrasi Katalog Unity

    Pelajari cara memanfaatkan Katalog Unity bersama dengan Streaming Terstruktur di Azure Databricks.

  • Streaming dengan Delta

    Pelajari cara menggunakan tabel Delta Lake sebagai sumber streaming dan sink.

  • Contoh

    Lihat contoh menggunakan Streaming Terstruktur Spark dengan Cassandra, Azure Synapse Analytics, buku catatan Python, dan buku catatan Scala di Azure Databricks.

Azure Databricks memiliki fitur khusus untuk bekerja dengan bidang data semi terstruktur yang terkandung dalam Avro, buffer protokol, dan payload data JSON. Untuk mempelajari selengkapnya, lihat:

Sumber Daya Tambahan:

Apache Spark menyediakan Panduan Pemrograman Streaming Terstruktur yang memiliki informasi lebih lanjut tentang Streaming Terstruktur.

Untuk informasi referensi tentang Streaming Terstruktur, Databricks merekomendasikan referensi API Apache Spark berikut: