Menyerap data Dataverse yang diekspor dengan Pabrik Data Azure
Setelah mengekspor data dari Microsoft Dataverse ke Azure Data Lake Storage Gen2 dengan Azure Synapse Link for Dataverse, Anda dapat menggunakan Azure Data Factory untuk membuat aliran data, mentransformasi data, dan menjalankan analisis.
Catatan
Azure Synapse Link for Dataverse untuk sebelumnya dikenal sebagai Ekspor ke data lake. Layanan berganti nama menjadi efektif Mei 2021 dan akan terus mengekspor data ke Azure Data Lake dan Azure Synapse Analytics.
Artikel ini menunjukkan bagaimana Anda akan melakukan tugas-tugas berikut:
Atur penyimpanan akun penyimpanan Data Lake Storage Gen2 dengan data Dataverse sebagai sumber di aliran data Pabrik Data.
Transformasikan data Dataverse di Pabrik Data dengan aliran data.
Atur penyimpanan akun penyimpanan Data Lake Storage Gen2 dengan data Dataverse sebagai sink di aliran data Pabrik Data.
Jalankan aliran data Anda dengan membuat alur.
Prasyarat
Bagian ini menjelaskan prasyarat yang diperlukan untuk menyerap data Dataverse yang diekspor dengan Data Factory.
Peran Azure. Akun pengguna yang digunakan untuk masuk ke Azure harus menjadi anggota peran kontributor atau pemilik, atau administrator langganan Azure. Untuk melihat izin yang Anda miliki dalam langganan, buka portal Azure, pilih nama pengguna di sudut kanan atas, pilih ..., lalu pilih izin saya. Jika Anda memiliki akses ke beberapa langganan, pilih yang sesuai. Untuk membuat dan mengelola sumber daya anak untuk pabrik data di portal Azure—, termasuk himpunan data, layanan tertaut, alur, pemicu, dan integration runtime—Anda harus menjadi bagian dari peran kontributor pabrik data di tingkat grup sumber daya atau di atasnya.
Azure Synapse Link for Dataverse. Panduan ini mengasumsikan bahwa Anda telah mengekspor data Dataverse menggunakan Azure Synapse Link for Dataverse. Pada contoh ini, data tabel akun diekspor ke telaga data.
Pabrik data Azure. Panduan ini mengasumsikan bahwa Anda telah membuat pabrik data dalam langganan dan grup sumber daya yang sama dengan akun penyimpanan yang berisi data Dataverse yang diekspor.
Atur akun penyimpanan Data Lake Storage Gen2 sebagai sumber
Buka Pabrik Data Azure, lalu pilih pabrik data yang memiliki langganan dan grup sumber daya yang sama seperti akun penyimpanan yang berisi data Dataverse Anda yang diekspor. Selanjutnya, pilih Buat alur data dari halaman beranda.
Aktifkan mode debug aliran Data dan pilih waktu yang diinginkan untuk melangsungkan. Proses ini mungkin memerlukan waktu hingga 10 menit, namun Anda dapat melanjutkan dengan langkah berikut.
Pilih Tambah sumber.
Di dalam pengaturan sumber, lakukan langkah berikut:
- Nama aliran output: masukkan nama yang diinginkan.
- Jenis Sumber: Pilih Inline.
- Jenis himpunan data inline: Pilih Common Data Model.
- Layanan tertaut: Pilih akun penyimpanan dari menu drop-down, lalu tautkan layanan baru dengan memberikan rincian langganan Anda dan membiarkan semua konfigurasi default.
- Pengambilan sampel: jika Anda ingin menggunakan semua data, pilih Nonaktifkan.
Di dalam Opsi sumber, lakukan langkah berikut:
Format metadata: Pilih Model.json.
Lokasi root: Masukkan nama wadah di kotak pertama (Wadah) atau Telusuri nama wadah dan pilih OK.
Entitas: Masukkan nama tabel atau Telusuri tabel.
Periksa tab Proyeksi untuk memastikan bahwa skema Anda telah diimpor dengan sukses. Jika Anda tidak melihat kolom, pilih pilihan Skema dan centang pilihan Duga jenis kolom mengambang. Konfigurasikan pilihan pemformatan agar sesuai dengan himpunan data, lalu pilih Terapkan.
Anda dapat melihat data Anda di tab Pratinjau data untuk memastikan pembuatan Sumber telah selesai dan akurat.
Transformasikan data Dataverse Anda
Setelah menetapkan data Dataverse yang diekspor di akun Azure Data Lake Storage Gen2 sebagai sumber dalam aliran data Data Factory, banyak kemungkinan untuk mentransformasi data Anda. Informasi selengkapnya: Azure Data Factory
Ikuti petunjuk ini untuk membuat peringkat untuk setiap baris berdasarkan bidang pendapatan tabel akun.
Pilih + di sudut kanan bawah transformasi sebelumnya, lalu cari dan pilih Peringkat.
Pada tab Pengaturan peringkat, lakukan yang berikut:
Nama aliran output: Masukkan nama yang diinginkan, misalnya Peringkat1.
Aliran masuk: Pilih nama sumber yang diinginkan. Pada kasus ini, nama sumber dari langkah sebelumnya.
Pilihan: Biarkan pilihan tidak dicentang.
Kolom peringkat: Masukkan nama kolom peringkat yang dihasilkan.
Kondisi pengurutan: Pilih kolom pendapatan dan urutkan berdasarkan Urutan menurun.
Anda dapat melihat data Dalam tab pratinjau data, Anda akan menemukan kolom revenueRank baru pada posisi paling kanan.
Atur akun penyimpanan Data Lake Storage Gen2 sebagai sink
Pada akhirnya, Anda harus mengatur Sink untuk aliran data Anda. Ikuti petunjuk ini untuk menempatkan data transformasi Anda sebagai file Teks Dibatasi di Data Lake.
Pilih + di sudut kanan bawah transformasi sebelumnya, lalu cari dan pilih Sink.
Di tab Sink, lakukan langkah berikut:
Nama aliran output: masukkan nama yang diinginkan, seperti Sink1.
Aliran masuk: Pilih nama sumber yang diinginkan. Pada kasus ini, nama sumber dari langkah sebelumnya.
Jenis sink: Pilih DelimitedText.
Layanan tertaut: Pilih wadah penyimpanan Data Lake Storage Gen2 yang memiliki data yang Anda ekspor menggunakan layanan Azure Synapse Link for Dataverse.
Di tab Pengaturan, lakukan langkah berikut:
Jalur folder: Masukkan nama wadah di kotak pertama (Sistem file) atau Telusuri nama wadah dan pilih OK.
Pilihan nama file: Pilih output ke satu file.
Output ke satu file: Masukkan nama file, misalnya ADFOutput
Biarkan semua pengaturan default lainnya.
Pada tab Optimalkan, atur pilihan partisi ke Satu partisi.
Anda dapat melihat data Anda dalam tab pratinjau data.
Jalankan aliran data
Di panel kiri dalam sumber daya pabrik, pilih +, lalu pilih alur.
Dalam aktivitas, pilih Pindahkan & Ubah, lalu tarik aliran data ke ruang kerja.
Pilih gunakan aliran data yang ada, lalu pilih aliran data yang Anda buat pada langkah sebelumnya.
Di baris perintah, pilih Debug.
Biarkan tampilan berjalan hingga tampilan bawah menunjukkan bahwa telah selesai. Ini mungkin memerlukan waktu beberapa menit.
Buka wadah penyimpanan tujuan akhir dan cari file data tabel yang diubah.
Lihat juga
Mengonfigurasi Azure Synapse Link for Dataverse dengan Azure Data Lake
Menganalisis data Dataverse di Azure Data Lake Storage Gen2 dengan Power BI
Catatan
Apa bahasa dokumentasi yang Anda inginkan? Lakukan survei singkat. (perlu diketahui bahwa survei ini dalam bahasa Inggris)
Survei akan berlangsung kurang lebih selama tujuh menit. Tidak ada data pribadi yang dikumpulkan (pernyataan privasi).