Bagikan melalui


Menyerap data ke dalam databricks lakehouse

Azure Databricks menawarkan berbagai cara untuk menyerap data dari berbagai sumber ke lakehouse yang didukung oleh Delta Lake. Artikel ini mencantumkan sumber data dan menyediakan tautan ke langkah-langkah untuk menyerap data dari setiap jenis sumber.

Penyimpanan objek cloud

Untuk mempelajari tentang cara mengonfigurasi penyerapan inkremental dari penyimpanan objek cloud, lihat Menyerap data dari penyimpanan objek cloud.

LakeFlow Connect

Databricks LakeFlow Connect menawarkan konektor asli untuk penyerapan dari aplikasi dan database perusahaan. Alur penyerapan yang dihasilkan diatur oleh Unity Catalog dan didukung oleh komputasi tanpa server dan Tabel Langsung Delta.

LakeFlow Connect memanfaatkan pembacaan dan penulisan inkremental yang efisien untuk membuat penyerapan data lebih cepat, lebih dapat diskalakan, dan lebih hemat biaya, sementara data Anda tetap segar untuk konsumsi hilir.

Sumber streaming

Azure Databricks dapat diintegrasikan dengan layanan olahpesan aliran untuk penyerapan data hampir real time ke lakehouse. Lihat Streaming dan penyerapan inkremental.

File data lokal

Anda dapat mengunggah file data lokal dengan aman atau mengunduh file dari URL publik. Lihat Mengunggah file ke Azure Databricks.

Memigrasikan data ke Delta Lake

Untuk mempelajari cara memigrasikan data yang ada ke Delta Lake, lihat Memigrasikan data ke Delta Lake.