Menyerap data ke dalam databricks lakehouse
Azure Databricks menawarkan berbagai cara untuk menyerap data dari berbagai sumber ke lakehouse yang didukung oleh Delta Lake. Artikel ini mencantumkan sumber data dan menyediakan tautan ke langkah-langkah untuk menyerap data dari setiap jenis sumber.
Penyimpanan objek cloud
Untuk mempelajari tentang cara mengonfigurasi penyerapan inkremental dari penyimpanan objek cloud, lihat Menyerap data dari penyimpanan objek cloud.
LakeFlow Connect
Databricks LakeFlow Connect menawarkan konektor asli untuk penyerapan dari aplikasi dan database perusahaan. Alur penyerapan yang dihasilkan diatur oleh Unity Catalog dan didukung oleh komputasi tanpa server dan Tabel Langsung Delta.
LakeFlow Connect memanfaatkan pembacaan dan penulisan inkremental yang efisien untuk membuat penyerapan data lebih cepat, lebih dapat diskalakan, dan lebih hemat biaya, sementara data Anda tetap segar untuk konsumsi hilir.
Sumber streaming
Azure Databricks dapat diintegrasikan dengan layanan olahpesan aliran untuk penyerapan data hampir real time ke lakehouse. Lihat Streaming dan penyerapan inkremental.
File data lokal
Anda dapat mengunggah file data lokal dengan aman atau mengunduh file dari URL publik. Lihat Mengunggah file ke Azure Databricks.
Memigrasikan data ke Delta Lake
Untuk mempelajari cara memigrasikan data yang ada ke Delta Lake, lihat Memigrasikan data ke Delta Lake.