Buat Azure Synapse Link for Dataverse dengan Azure Data Lake

Anda dapat menggunakan Azure Synapse Link untuk menghubungkan data Microsoft Dataverse Anda ke Azure Data Lake Storage Gen2 untuk mengaktifkan berbagai skenario analitik. Artikel ini menunjukkan bagaimana Anda akan melakukan tugas-tugas berikut:

  1. Sambungkan data Dataverse Anda ke akun Azure Data Lake Storage Gen2 dengan layanan Azure Synapse Link.
  2. Mengelola tabel Dataverse yang tercakup di Azure Synapse Link.
  3. Pantau Azure Synapse Link Anda.
  4. Batalkan tautan Azure Synapse Link.
  5. Tautkan ulang Azure Synapse Link.
  6. Lihat data Anda di Azure Data Lake dan pahami struktur file.

Catatan

Azure Synapse Link for Dataverse untuk sebelumnya dikenal sebagai Ekspor ke data lake. Layanan berganti nama menjadi efektif Mei 2021 dan akan terus mengekspor data ke Azure Data Lake dan Azure Synapse Analytics.

Prasyarat

  • Azure Data Lake Storage Gen2: Anda harus memiliki akun Azure Data Lake Storage Gen2 dan akses peran Pemilik dan kontributor data Blob Penyimpanan. Akun penyimpanan Anda harus mengaktifkan hierarki namespace layanan untuk penyiapan awal dan sinkronisasi delta. Izinkan akses kunci akun penyimpanan hanya diperlukan untuk penyiapan awal.

Catatan

  • Akun penyimpanan harus dibuat di penyewa yang sama Microsoft Entra dengan penyewa Anda Power Apps .
  • Untuk mengatur Diaktifkan dari jaringan virtual dan alamat IP yang dipilih untuk akun penyimpanan tertaut guna memberikan akses dari alamat IP yang dipilih, Anda harus membuat dengan Azure Synapse Link identitas terkelola.Gunakan identitas terkelola untuk Azure dengan penyimpanan data lake Azure Anda (tanpa penyiapan identitas terkelola, Anda harus mengaktifkan akses jaringan publik untuk sumber daya Azure untuk penyiapan awal dan sinkronisasi delta.)
  • Anda harus memiliki akses peran Pembaca ke grup sumber daya dengan akun penyimpanan.
  • Untuk menghubungkan lingkungan ke Azure Data Lake Storage Gen2, Anda harus memiliki peran keamanan administrator sistem Dataverse.
  • Hanya tabel yang telah mengaktifkan pelacakan perubahan dapat diekspor.
  • Pembuatan Azure Synapse Link profil di bawah satu Dataverse lingkungan dibatasi hingga maksimal 10.

Menghubungkan Dataverse ke Azure Data Lake Storage Gen2

  1. Masuk ke Power Apps dan pilih lingkungan yang diinginkan.

  2. Di panel navigasi kiri, pilih Azure Synapse Link. Jika Azure Synapse Link tidak terlihat di panel panel samping, pilih ... Lainnya dan pilih Temukan semua. Azure Synapse Link ada di bagian Manajemen Data.

  3. Pada bilah perintah, pilih + Tautan baru ke data lake.

  4. Pilih langganan, Grup sumber daya Akun penyimpanan. Pastikan akun penyimpanan memenuhi persyaratan yang ditentukan di bagian Prasyarat. Pilih Selanjutnya.

    Catatan

    Sebagai bagian dari menghubungkan lingkungan dengan data lake, Anda memberikan akses layanan Azure Synapse Link ke akun penyimpanan Anda. Pastikan anda mengikuti prasyarat pembuatan dan konfigurasi akun Azure Data Lake Storage, dan pemberian peran pemilik pada akun penyimpanan. Selain itu, Anda memberikan akses layanan aliran data Power Platform ke akun penyimpanan Anda. Informasi lebih lanjut: Persiapan data layanan mandiri dengan aliran data.

  5. Tambahkan tabel yang ingin Anda ekspor, lalu pilih Simpan. Hanya tabel yang telah mengaktifkan pelacakan perubahanlah yang dapat diekspor. Informasi selengkapnya: Mengaktifkan pelacakan perubahan.

    Pilih tabel untuk diekspor.

Anda dapat mengikuti langkah-langkah dalam artikel ini untuk membuat tautan dari satu lingkungan ke beberapa danau data Azure di langganan Azure Anda. Demikian pula, Anda dapat membuat tautan dari beberapa lingkungan ke Azure Data Lake yang sama, Semua dalam penyewa yang sama.

Catatan

Layanan Azure Synapse Link for Dataverse ini terintegrasi dengan mulus ke dalam Power Platform sebagai fitur out-of-the-box. Ini memenuhi standar keamanan dan tata kelola yang ditetapkan untuk penyimpanan dan tata kelola data Power Platform . Informasi selengkapnya: Penyimpanan dan tata kelola data

Data yang diekspor oleh Azure Synapse Link layanan dienkripsi saat transit menggunakan Transport Layer Security (TLS) 1.2 atau yang lebih tinggi dan dienkripsi saat tidak aktif di Azure Data Lake Storage Gen2. Selain itu, data sementara di penyimpanan Blob juga dienkripsi saat istirahat. Enkripsi di Azure Data Lake Storage Gen2 akan membantu Anda melindungi data, menerapkan kebijakan keamanan perusahaan, dan memenuhi persyaratan kepatuhan terhadap peraturan. Informasi lebih lanjut: enkripsi data Azure saat istirahat

Mengelola data tabel ke data lake

Setelah menyiapkan Azure Synapse Link, Anda dapat mengelola tabel yang diekspor dengan salah satu dari dua cara:

  • Pada area Azure Synapse Link portal pembuat Power Apps, pilih Kelola tabel pada bilah perintah untuk menambahkan atau menghilangkan satu atau beberapa tabel tertaut.

  • Di area tabel pembuat portal Power Apps, pilih ... Di sebelah tabel, lalu pilih data lake tertaut yang akan mengekspor data tabel.

    Pilih tabel untuk diekspor.

Setelah Anda mengatur Azure Synapse Link, Anda dapat memantau di Azure Synapse Link bawah tab Tabel .

Azure Synapse Link Pemantauan

  • Akan ada daftar tabel yang merupakan bagian dari Azure Synapse Link yang dipilih.
  • Ada berbagai tahapan yang dilalui status sinkronisasi. NotStarted menunjukkan bahwa tabel menunggu untuk disinkronisasi. Setelah sinkronisasi awal tabel Selesai, ada tahap pemrosesan pasca di mana pembaruan inkremental tidak akan terjadi. Proses ini mungkin memerlukan waktu beberapa jam, bergantung pada ukuran data Anda. Saat pembaruan inkremental mulai dilakukan, tanggal sinkronisasi terakhir akan diperbarui secara teratur.
  • Kolom Hitung menampilkan baris angka yang ditulis. Bila Lampirkan saja diatur ke Tidak, ini adalah jumlah total rekaman. Bila Lampirkan saja diatur ke Ya, ini adalah jumlah total perubahan.
  • Kolom Lampirkan saja dan Strategi partisi menunjukkan penggunaan konfigurasi lanjutan yang berbeda.
  1. Pilih Azure Synapse Link yang diinginkan untuk membatalkan tautan.

  2. Pilih Batalkan tautan data lake dari bilah perintah.

  3. Untuk menghapus sistem file data lake, pilih hapus sistem file data lake.

  4. Pilih Ya, lalu izinkan beberapa menit hingga semua tautan dilepas dan dihapus.

Jika Anda menghapus sistem file saat membatalkan tautan, ikuti langkah-langkah di atas untuk menautkan ulang data lake yang sama. Jika Anda tidak menghapus sistem file saat memutuskan tautan, Anda harus menghapus data untuk menautkan ulang:

  1. Buka Azure Data Lake.

  2. Hapus wadah Dataverse.

  3. Buka Power Apps, lalu tautkan ulang Data Lake.

Lihat data Anda di Azure Data Lake Storage Gen2

  1. Pilih Azure Synapse Link yang diinginkan, lalu pilih Buka Azure data lake dari panel atas.

  2. Perluas Sistem File, lalu pilih dataverse-environmentName-organizationUniqueName.

File model.json, bersama dengan nama dan versinya, menyediakan daftar tabel yang telah diekspor ke data lake. File model.JSON juga mencakup status sinkronisasi awal dan waktu penyelesaian sinkronisasi.

Folder yang mencakup file snapshot koma (format CSV) ditampilkan untuk setiap tabel yang diekspor ke data lake. data tabel di data lake.

  1. Di bilah alamat browser web, tambahkan ?athena.updateLake=true ke alamat web yang diakhiri dengan exporttodatalake.

  2. Pilih profil yang ada dari area tersebut Azure Synapse Link , lalu pilih opsi yang diperluas.

  3. Pilih Tautkan ke Azure Synapse Analytics Ruang Kerja dan tunggu beberapa menit agar semuanya ditautkan.

Pembaruan snapshot terus-menerus

data Microsoft Dataverse dapat terus berubah terus-menerus melalui membuat, memperbarui, dan menghapus transaksi. Snapshot menyediakan salinan data snapshot hanya baca yang diperbarui pada interval yang teratur, dalam hal ini setiap jam. Hal ini memastikan bahwa pada titik mana pun, konsumen analisis data dapat secara andal mengkonsumsi data di danau.

Pembaruan snapshot terus-menerus.

Bila tabel ditambahkan sebagai bagian dari ekspor awal, data tabel akan ditulis ke file table.csv di dalam folder yang terkait di data lake. Ini adalah interval T1, dengan file baca-saja yang dinamai tabel-T1.csv—misalnya, account-T1.csv atau Contacts-T1.csv—dibuat. Selain itu, file model.JSON diperbarui untuk menunjuk ke file snapshot ini. Membuka model.JSON, Anda dapat melihat rincian snapshot.

Berikut adalah contoh dari file Account.csv yang dipartisi dan folder snapshot data lake.

Snapshot tabel akun.

Perubahan di Dataverse akan terus didorong ke file CSV terkait menggunakan mesin umpan tetesan. Ini adalah interval T2, tempat snapshot lain diambil. tabel-T2.csv—misalnya,Accounts-T2.csv atau Contacts-T2.csv (dengan asumsi ada perubahan untuk tabel) —dan model.json diperbarui ke file snapshot baru. Setiap orang baru yang melihat data snapshot dari T2 dan seterusnya diarahkan ke file snapshot yang lebih baru. Dengan cara ini, penampil snapshot asli dapat terus bekerja pada file T1snapshot lama sementara pemirsa yang lebih baru dapat membaca pembaruan terbaru. Hal ini berguna dalam skenario yang memiliki proses hilir berjalan lebih lama.

Catatan

File snapshot baru dibuat hanya jika ada pembaruan data. Hanya lima file snapshot terbaru yang akan dipertahankan. Data stagnan akan dihapus secara otomatis dari akun Microsoft 2 Anda Azure Data Lake Storage .

Berikut adalah contoh file model.JSON, yang selalu mengarah ke file snapshot akun cap waktu terbaru.

Contoh file snapshot model.JSON.

Apa berikutnya?

Setelah berhasil menggunakan layanan Azure Synapse Link for Dataverse, temukan cara menganalisis dan menggunakan data dengan Discover Hub. Untuk mengakses Discover Hub, buka Power Apps > Azure Synapse Link. Pilih layanan yang ditautkan, lalu pilih tab temukan hub. Di sini Anda dapat menemukan alat yang direkomendasikan dan dokumentasi yang dikurasi untuk membantu Anda mendapatkan nilai maksimal dari data Anda. Temukan hub.

Lihat juga

Analisis data Dataverse di data lake dengan Power BI

Serap data Dataverse di data lake dengan Azure Data Factory

Konfigurasi Tingkat Lanjut Azure Synapse Link for Dataverse

Tanya Jawab Azure Synapse Link

Catatan

Apa bahasa dokumentasi yang Anda inginkan? Lakukan survei singkat. (perlu diketahui bahwa survei ini dalam bahasa Inggris)

Survei akan berlangsung kurang lebih selama tujuh menit. Tidak ada data pribadi yang dikumpulkan (pernyataan privasi).