Opsi konfigurasi lanjutan di Azure Synapse Link

Artikel
12/11/2024

Azure Synapse Link menawarkan beberapa cara untuk menulis dan membaca data Anda agar sesuai dengan berbagai skenario analitik. Bergantung pada skenario analitik Anda, Anda dapat memilih konfigurasi tertentu dari opsi di bawah ini.

Skenario	Berlaku untuk	Opsi konfigurasi yang tersedia
Pelaporan operasional	Dataverse tabel, tabel dan entitas keuangan dan operasi	Synapse Analytics dengan opsi Delta lake memberikan waktu respons kueri yang lebih baik terutama yang berlaku untuk mengkueri data dalam jumlah besar. Informasi lebih lanjut: Synapse tautkan dengan opsi danau Delta
Pelaporan operasional	Dataverse Tabel saja	Synapse tautkan dengan opsi konfigurasi "Pembaruan di tempat" menyediakan file CSV di danau data Anda yang diperbarui hampir secara real time Ini adalah opsi warisan yang tersedia untuk Dataverse tabel. Opsi ini tidak didukung untuk tabel dari aplikasi keuangan dan operasi
Integrasi Data	Dataverse tabel dan tabel dan entitas keuangan dan operasi	"Opsi hanya tambahkan menyediakan file CSV yang berisi data tambahan. Anda dapat membangun alur yang menggunakan data inkremental dan mengisi sistem hilir Fitur partisi data yang ditentukan pengguna memungkinkan memilih strategi partisi data kustom khusus untuk Dataverse tabel. Data tabel keuangan dan operasi dipartisi oleh sistem berdasarkan strategi partisi yang sesuai. Opsi ini tidak tersedia untuk aplikasi keuangan dan operasi

Catatan

Azure Synapse Link for Dataverse sebelumnya dikenal sebagai Ekspor ke Data Lake. Layanan ini berganti nama efektif Mei 2021 dan akan terus mengekspor data ke Azure Data Lake Storage as. Azure Synapse Analytics Mulai September-2023, Azure Synapse Link juga memungkinkan Anda untuk memilih data dari aplikasi keuangan dan operasi Dynamics 365. Tidak semua pola integrasi didukung dengan aplikasi keuangan dan operasi. Untuk panduan tentang transisi dari fitur Ekspor ke Data Lake di aplikasi keuangan dan operasi ke Synapse tautkan, buka Panduan transisi.

Artikel ini membahas pengaturan konfigurasi lanjutan yang tersedia untuk Dataverse tabel. Opsi ini tidak tersedia untuk aplikasi keuangan dan operasi.

Pembaruan di Tempat vs. Penulisan Hanya Lampirkan
Sekat data yang Ditentukan Pengguna.

Pembaruan di Tempat vs. Penulisan Hanya Lampirkan

Saat menulis Dataverse data tabel ke data lake Azure, berdasarkan createdOn nilai, yang merupakan tanggal dan waktu saat rekaman dibuat, ada dua pengaturan berbeda untuk dipilih. Mereka adalah, Pembaruan di tempat dan Tambahkan saja.

Pengaturan default (untuk tabel yang tersedia createdOn ) adalah melakukan pembaruan di tempat atau upsert (memperbarui atau menyisipkan) data inkremental di tujuan. Jika perubahan adalah baru dan baris yang sesuai tidak ada di lake, dalam kasus pembuatan, file tujuan akan dipindai, dan perubahan dimasukkan ke dalam partisi file yang terkait di lake. Jika perubahan merupakan pembaruan dan baris ada di lake, maka file yang terkait di lake akan diperbarui, dan bukan dimasukkan dengan data tambahan. Dengan kata lain, pengaturan default untuk semua perubahan CUD (buat, perbarui, hapus) dalam Dataverse tabel, jika createdOn tersedia, adalah melakukan pembaruan di tempat di tujuan, di danau data Azure.

Anda dapat mengalihkan perilaku default pembaruan di tempat dengan menggunakan setelan opsional yang disebut Hanya Tambahkan Tambahan. Alih-alih pembaruan Di tempat, dalam mode Tambahkan saja , data tambahan dari Dataverse tabel ditambahkan ke partisi file yang sesuai di lake. Ini adalah pengaturan per tabel dan tersedia sebagai kotak centang di bawah Pengaturan konfigurasi> lanjutan Tampilkan Lanjutan. Untuk Dataverse tabel dengan Tambahkan saja diaktifkan, semua perubahan CUD ditambahkan secara bertahap ke file tujuan yang sesuai di danau. Saat Anda memilih opsi ini, strategi partisi default ke Tahun dan ketika data ditulis ke data lake, data akan dipartisi setiap tahun. Tambahkan saja juga merupakan pengaturan default untuk Dataverse tabel yang tidak memiliki createdOn nilai.

Tabel ini menjelaskan bagaimana baris ditangani di danau terhadap peristiwa CUD untuk setiap opsi penulisan data.

Aktivitas	Pembaruan di tempat	Khusus lampirkan
Buat	Baris disisipkan dalam file partisi dan didasarkan pada `createdOn` nilai pada baris.	Baris ditambahkan ke akhir file partisi dan didasarkan pada `createdOn` nilai rekaman.
Update	Jika baris ada dalam file partisi, maka baris akan menggantikan atau diperbarui dengan data yang diperbarui. Jika tidak ada, maka file akan disisipkan ke dalam file.	Baris, bersama dengan versi yang diperbarui, ditambahkan ke akhir file partisi.
Delete	Jika baris ada dalam file partisi, maka baris akan dihilangkan dari file.	Baris ditambahkan ke akhir file partisi dengan `IsDelete column = True`.

Catatan

Untuk Dataverse tabel yang Tambahkan saja diaktifkan, menghapus baris di sumber tidak akan menghapus atau membuang baris di danau. Sebaliknya, baris yang dihapus ditambahkan sebagai baris baru di danau dan kolom isDeleted diatur ke Benar.

Pembacaan kotor (ALLOW_INCONSISTENT_READS) untuk tanpa server diaktifkan untuk mode penambahan saja. ALLOW_INCONSISTENT_READS berarti bahwa pengguna dapat membaca file yang dapat terus-menerus dimodifikasi saat SELECT kueri sedang berjalan. Hasilnya akan konsisten dan setara dengan pembacaan snapshot dari file tersebut. (Ini tidak setara dengan isolasi basis data snapshot karena waktu pembuatan snapshot yang berbeda.)

Tidak semua perubahan CUD akan ditangkap dalam tambahkan saja: Synapse tautkan memproses perubahan dalam data dalam kelompok atau "batch" sebelum menerbitkannya ke danau data. Akibatnya, jika pengguna membuat perubahan dalam interval waktu yang singkat, tidak semua perubahan CUD akan tercatat dalam data lake.

Berikut adalah beberapa rincian lainnya mengenai waktu penggunaan salah satu pilihan.

Pembaruan di tempat: Opsi ini adalah pengaturan default dan direkomendasikan hanya jika Anda ingin terhubung langsung ke data di lake dan memerlukan status terkini (bukan riwayat atau perubahan tambahan). File berisi file himpunan data dan dapat dimanfaatkan melalui Power BI atau dengan menyalin seluruh rangkaian data untuk alur ETL (Ekstrak, Transfer, Beban).
Tambahkan saja: Pilih opsi ini jika Anda tidak terhubung langsung ke data di lake dan ingin menyalin data secara bertahap ke target lain menggunakan jalur ETL. Pilihan ini memberikan riwayat perubahan untuk mengaktifkan skenario AI dan ML.

Anda dapat mengaktifkan Tampilkan pengaturan konfigurasi lanjutan di bawah Lanjutan di Azure Synapse Link for Dataverse untuk menyesuaikan strategi partisi data Anda dan memilih opsi untuk menulis ke danau data Azure.

Tampilkan konfigurasi lanjutan.

Pemartisian data

Saat Anda menulis Dataverse data tabel ke penyimpanan data lake Azure menggunakan Azure Synapse Link, tabel dipartisi (bukan file tunggal) di lake berdasarkan createdOn nilai pada setiap baris di sumber. Strategi partisi default berdasarkan bulan dan data dipartisi dalam Azure data Lake secara bulanan.

Berdasarkan volume tabel Dataverse dan distribusi data, Anda dapat memilih untuk mem-partisi data berdasarkan tahun. Dengan opsi ini, saat Dataverse data tabel ditulis ke danau data Azure, data tersebut akan dipartisi setiap tahun berdasarkan createdOn nilai pada setiap baris di sumber. Untuk tabel tanpa kolom createdOn , baris data dipartisi ke dalam file baru setiap 5,000,000 record. Ini adalah pengaturan per tabel dan tersedia sebagai kotak centang di bawah Lanjutan>Tampilkan pengaturan konfigurasi lanjutan.

Rincian lainnya dengan contoh cara penanganan data di lake dengan strategi partisi tahunan atau bulanan:

Strategi Partisi.

Bagikan melalui

Opsi konfigurasi lanjutan di Azure Synapse Link

Pembaruan di Tempat vs. Penulisan Hanya Lampirkan

Pemartisian data

Baca juga

Saran dan Komentar

Sumber Daya Tambahan: