Bagikan melalui


Praktik terbaik untuk menggunakan kembali aliran data di seluruh lingkungan dan ruang kerja

Artikel ini membahas kumpulan praktik terbaik untuk menggunakan kembali aliran data secara efektif dan efisien. Baca artikel ini untuk menghindari jebakan desain dan potensi masalah performa saat Anda mengembangkan aliran data untuk digunakan kembali.

Pisahkan aliran data transformasi data dari aliran data penahapan/ekstraksi

Jika aliran data melakukan semua tindakan, sulit untuk menggunakan kembali tabelnya di aliran data lain atau untuk tujuan lain. Aliran data terbaik untuk digunakan kembali adalah aliran data yang hanya melakukan beberapa tindakan. Membuat aliran data yang mengkhususkan diri dalam satu tugas tertentu adalah salah satu cara terbaik untuk menggunakannya kembali. Jika Anda memiliki sekumpulan aliran data yang Anda gunakan sebagai aliran data penahapan, satu-satunya tindakannya adalah mengekstrak data apa adanya dari sistem sumber. Aliran data ini dapat digunakan kembali di beberapa aliran data lainnya.

Jika Anda memiliki aliran data transformasi data, Anda dapat membaginya menjadi aliran data yang melakukan transformasi umum. Setiap aliran data hanya dapat melakukan beberapa tindakan. Beberapa tindakan per aliran data ini memastikan bahwa output aliran data tersebut dapat digunakan kembali oleh aliran data lainnya.

Dataflow doing only a few actions.

Gambar dengan data yang diekstrak dari sumber data ke aliran data penahapan, tempat tabel disimpan di penyimpanan Dataverse atau Azure Data Lake. Kemudian data dipindahkan ke aliran data transformasi tempat data diubah dan dikonversi ke struktur gudang data. Terakhir, data dimuat ke model semantik Power BI.

Menggunakan beberapa ruang kerja

Setiap ruang kerja (atau lingkungan) hanya tersedia untuk anggota ruang kerja tersebut. Jika Anda membuat semua aliran data di satu ruang kerja, Anda meminimalkan penggunaan kembali aliran data Anda. Anda dapat memiliki beberapa ruang kerja generik untuk aliran data yang memproses tabel di seluruh perusahaan. Anda juga dapat memiliki beberapa ruang kerja untuk aliran data untuk memproses tabel di beberapa departemen. Dan Anda juga dapat memiliki beberapa ruang kerja untuk aliran data yang hanya digunakan di departemen tertentu.

Image showing the separate workspaces.

Mengatur tingkat akses yang benar pada ruang kerja

Untuk memberikan akses ke aliran data di ruang kerja lain untuk menggunakan output aliran data di ruang kerja, Anda hanya perlu memberinya Akses tampilan di ruang kerja. Untuk mempelajari selengkapnya tentang peran lain di ruang kerja Power BI, buka Peran di ruang kerja baru.

Screenshot showing how to access to the Power BI workspace.

Dukungan pada aliran data di Power BI

Mungkin ada banyak aliran data yang dibuat di organisasi penyewa, dan mungkin sulit bagi pengguna untuk mengetahui aliran data mana yang paling dapat diandalkan. Penulis aliran data, atau pengguna yang memiliki akses edit ke dalamnya, dapat mendukung aliran data pada tiga tingkat: tidak ada dukungan, dipromosikan, atau disertifikasi.

Tingkat dukungan ini membantu pengguna menemukan aliran data yang andal lebih mudah dan lebih cepat. Aliran data dengan tingkat dukungan yang lebih tinggi muncul terlebih dahulu. Administrator Power BI dapat mendelegasikan kemampuan untuk mendukung aliran data ke tingkat bersertifikat kepada orang lain. Informasi selengkapnya: Dukungan - Mempromosikan dan mensertifikasi konten Power BI

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

Pisahkan tabel dalam beberapa aliran data

Anda dapat memiliki beberapa tabel dalam satu aliran data. Salah satu alasan Anda dapat membagi tabel dalam beberapa aliran data adalah apa yang Anda pelajari sebelumnya dalam artikel ini tentang memisahkan aliran data penyerapan dan transformasi data. Alasan bagus lainnya untuk memiliki tabel dalam beberapa aliran data adalah ketika Anda menginginkan jadwal refresh yang berbeda dari tabel lain.

Dalam contoh yang ditunjukkan pada gambar berikut, tabel penjualan perlu di-refresh setiap empat jam. Tabel tanggal perlu disegarkan hanya sekali sehari untuk menjaga catatan tanggal saat ini diperbarui. Dan tabel pemetaan produk hanya perlu di-refresh seminggu sekali. Jika Anda memiliki semua tabel ini dalam satu aliran data, Anda hanya memiliki satu opsi refresh untuk semuanya. Namun, jika Anda membagi tabel ini menjadi beberapa aliran data, Anda dapat menjadwalkan refresh setiap aliran data secara terpisah.

Image showing dataflows with different schedules for the refresh.

Kandidat tabel yang baik untuk tabel aliran data

Saat Anda mengembangkan solusi menggunakan Power Query di alat desktop, Anda mungkin bertanya pada diri sendiri; manakah dari tabel ini yang merupakan kandidat yang baik untuk dipindahkan ke aliran data? Tabel terbaik yang akan dipindahkan ke aliran data adalah tabel yang perlu digunakan dalam lebih dari satu solusi, atau lebih dari satu lingkungan atau layanan. Misalnya, tabel Tanggal yang diperlihatkan dalam gambar berikut ini perlu digunakan dalam dua file Power BI terpisah. Alih-alih menduplikasi tabel tersebut di setiap file, Anda bisa membuat tabel dalam aliran data sebagai tabel, dan menggunakannya kembali dalam file Power BI tersebut.

Image showing a shared table used in a dataflow.