Bagikan melalui


Skenario tabel komputasi dan kasus penggunaan

Ada manfaat menggunakan tabel komputasi dalam aliran data. Artikel ini menjelaskan kasus penggunaan untuk tabel komputasi dan menjelaskan cara kerjanya di belakang layar.

Apa itu tabel komputasi?

Tabel mewakili output data kueri yang dibuat dalam aliran data, setelah aliran data disegarkan. Ini mewakili data dari sumber dan, secara opsional, transformasi yang diterapkan padanya. Terkadang, Anda mungkin ingin membuat tabel baru yang merupakan fungsi dari tabel yang diserap sebelumnya.

Meskipun dimungkinkan untuk mengulangi kueri yang membuat tabel dan menerapkan transformasi baru padanya, pendekatan ini memiliki kelemahan: data diserap dua kali, dan beban pada sumber data digandakan.

Tabel komputasi menyelesaikan kedua masalah. Tabel komputasi mirip dengan tabel lain karena mereka mendapatkan data dari sumber dan Anda dapat menerapkan transformasi lebih lanjut untuk membuatnya. Tetapi data mereka berasal dari aliran data penyimpanan yang digunakan, dan bukan sumber data asli. Artinya, mereka sebelumnya dibuat oleh aliran data dan kemudian digunakan kembali.

Tabel komputasi dapat dibuat dengan mereferensikan tabel dalam aliran data yang sama atau dengan mereferensikan tabel yang dibuat dalam aliran data yang berbeda.

Cuplikan layar menekankan tabel komputasi.

Mengapa menggunakan tabel komputasi?

Melakukan semua langkah transformasi dalam satu tabel bisa lambat. Mungkin ada banyak alasan untuk perlambatan ini—sumber data mungkin lambat, atau transformasi yang Anda lakukan mungkin perlu direplikasi dalam dua kueri atau lebih. Mungkin menguntungkan untuk terlebih dahulu menyerap data dari sumber dan kemudian menggunakannya kembali dalam satu atau beberapa tabel. Dalam kasus seperti itu, Anda dapat memilih untuk membuat dua tabel: tabel yang mendapatkan data dari sumber data, dan yang lain—tabel terkomputasi—yang menerapkan lebih banyak transformasi ke data yang sudah ditulis ke dalam data lake yang digunakan oleh aliran data. Perubahan ini dapat meningkatkan performa dan penggunaan kembali data, menghemat waktu dan sumber daya.

Misalnya, jika dua tabel berbagi bahkan bagian dari logika transformasinya, tanpa tabel komputasi, transformasi harus dilakukan dua kali.

Gambar memperlihatkan transformasi data yang terjadi dua kali.

Namun, jika tabel komputasi digunakan, maka bagian umum (bersama) dari transformasi diproses sekali dan disimpan di Azure Data Lake Storage. Transformasi yang tersisa kemudian diproses dari output transformasi umum. Secara keseluruhan, pemrosesan ini jauh lebih cepat.

Gambar memperlihatkan transformasi umum yang dilakukan sekali dalam tabel komputasi, dan disimpan di data lake, dan transformasi unik yang tersisa terjadi nanti.

Tabel komputasi menyediakan satu tempat sebagai kode sumber untuk transformasi dan mempercepat transformasi karena hanya perlu dilakukan sekali alih-alih beberapa kali. Beban pada sumber data juga berkurang.

Contoh skenario untuk menggunakan tabel komputasi

Jika Anda membangun tabel agregat di Power BI untuk mempercepat model data, Anda bisa membuat tabel agregat dengan merujuk tabel asli dan menerapkan lebih banyak transformasi ke tabel tersebut. Dengan menggunakan pendekatan ini, Anda tidak perlu mereplikasi transformasi Anda dari sumber (bagian yang berasal dari tabel asli).

Misalnya, gambar berikut menunjukkan tabel Pesanan.

Cuplikan layar tabel Pesanan.

Dengan menggunakan referensi dari tabel ini, Anda dapat membuat tabel komputasi.

Membuat tabel komputasi.

Cuplikan layar memperlihatkan cara membuat tabel komputasi dari tabel Pesanan. Pertama klik kanan tabel Pesanan di panel Kueri, pilih opsi Referensi dari menu drop-down. Tindakan ini membuat tabel komputasi, yang diganti namanya di sini menjadi Agregat Pesanan.

Tabel komputasi dapat memiliki transformasi lebih lanjut. Misalnya, Anda dapat menggunakan Grup Menurut untuk mengagregasi data di tingkat pelanggan.

Cuplikan layar tabel agregat Pesanan dengan kolom Pelanggan ditekankan.

Ini berarti bahwa tabel Agregat Pesanan mendapatkan data dari tabel Pesanan, dan bukan dari sumber data lagi. Karena beberapa transformasi yang perlu dilakukan telah dilakukan dalam tabel Pesanan, performa lebih baik dan transformasi data lebih cepat.

Tabel terkomputasi dalam aliran data lain

Anda juga dapat membuat tabel komputasi di aliran data lainnya. Ini dapat dibuat dengan mendapatkan data dari aliran data dengan konektor aliran data Microsoft Power Platform.

Mendapatkan data dari aliran data Power Platform.

Gambar menekankan konektor aliran data Power Platform dari jendela sumber data yang dipilih Power Query. Juga disertakan adalah deskripsi yang menyatakan bahwa satu tabel aliran data dapat dibangun di atas data dari tabel aliran data lain, yang sudah disimpan dalam penyimpanan.

Konsep tabel komputasi adalah memiliki tabel yang bertahan di penyimpanan, dan tabel lain yang bersumber darinya, sehingga Anda dapat mengurangi waktu baca dari sumber data dan berbagi beberapa transformasi umum. Pengurangan ini dapat dicapai dengan mendapatkan data dari aliran data lain melalui konektor aliran data atau mereferensikan kueri lain dalam aliran data yang sama.

Tabel komputasi: Dengan transformasi, atau tanpa?

Sekarang setelah Anda tahu tabel komputasi sangat bagus untuk meningkatkan performa transformasi data, pertanyaan yang baik untuk ditanyakan adalah apakah transformasi harus selalu ditangguhkan ke tabel komputasi atau apakah mereka harus diterapkan ke tabel sumber. Artinya, haruskah data selalu diserap ke dalam satu tabel dan kemudian diubah dalam tabel komputasi? Apa pro dan kontranya?

Memuat data tanpa transformasi untuk file Teks/CSV

Saat sumber data tidak mendukung pelipatan kueri (seperti file Teks/CSV), ada sedikit manfaat dalam menerapkan transformasi saat mendapatkan data dari sumber, terutama jika volume data besar. Tabel sumber hanya boleh memuat data dari file Teks/CSV tanpa menerapkan transformasi apa pun. Kemudian, tabel komputasi bisa mendapatkan data dari tabel sumber dan melakukan transformasi di atas data yang diserap.

Anda mungkin bertanya, apa nilai pembuatan tabel sumber yang hanya menyerap data? Tabel seperti itu masih dapat berguna, karena jika data dari sumber digunakan dalam lebih dari satu tabel, tabel tersebut mengurangi beban pada sumber data. Selain itu, data sekarang dapat digunakan kembali oleh orang lain dan aliran data. Tabel komputasi sangat berguna dalam skenario di mana volume data besar, atau ketika sumber data diakses melalui gateway data lokal, karena mereka mengurangi lalu lintas dari gateway dan beban pada sumber data di belakangnya.

Melakukan beberapa transformasi umum untuk tabel SQL

Jika sumber data Anda mendukung pelipatan kueri, ada baiknya untuk melakukan beberapa transformasi dalam tabel sumber karena kueri dilipat ke sumber data, dan hanya data yang diubah yang diambil darinya. Perubahan ini meningkatkan performa keseluruhan. Kumpulan transformasi yang umum dalam tabel komputasi hilir harus diterapkan dalam tabel sumber, sehingga dapat dilipat ke sumber. Transformasi lain yang hanya berlaku untuk tabel hilir harus dilakukan dalam tabel komputasi.