Menggunakan alat pembuatan profil data

Alat pembuatan profil data menyediakan cara baru dan intuitif untuk membersihkan, mengubah, dan memahami data dalam Editor Power Query. Meliputi:

  • Kualitas kolom

  • Distribusi kolom

  • Profil kolom

Untuk mengaktifkan alat pembuatan profil data, buka tab Tampilan pada pita. Di Power Query Desktop, aktifkan opsi yang Anda inginkan di grup Pratinjau data, seperti yang diperlihatkan dalam gambar berikut ini.

Alat pembuatan profil data.

Di Power Query Online, pilih Tampilan data, lalu aktifkan opsi yang Anda inginkan di daftar drop-down.

<teks alternatif>

Setelah mengaktifkan opsi, Anda akan melihat sesuatu seperti gambar berikut di Editor Power Query.

Alat pembuatan profil data diaktifkan.

Catatan

Secara default, Power Query melakukan pembuatan profil data ini di atas 1.000 baris pertama data Anda. Untuk mengoperasikannya di seluruh himpunan data, pilih pembuatan profil Kolom berdasarkan pesan 1000 baris teratas di sudut kiri bawah jendela editor Anda untuk mengubah pembuatan profil kolom ke Pembuatan profil Kolom berdasarkan seluruh himpunan data.

Kualitas kolom

Fitur kualitas kolom melabeli nilai dalam baris dalam lima kategori:

  • Valid, ditampilkan dalam warna hijau.

  • Kesalahan, ditampilkan dalam warna merah.

  • Kosong, ditampilkan dalam warna abu-abu gelap.

  • Tidak diketahui, ditampilkan dalam warna hijau putus-putus. Menunjukkan ketika ada kesalahan dalam kolom, kualitas data yang tersisa tidak diketahui.

  • Kesalahan tak terduga, ditampilkan dalam warna merah putus-putus.

Indikator ini ditampilkan langsung di bawah nama kolom sebagai bagian dari bagan batang kecil, seperti yang ditunjukkan pada gambar berikut.

Tampilan bagan batang yang disempurnakan dengan indikator kualitas data dan label di atas setiap kolom dalam tabel.

Jumlah rekaman di setiap kategori kualitas kolom juga ditampilkan sebagai persentase.

Dengan mengarahkan mouse ke salah satu kolom, Anda disajikan dengan distribusi numerik kualitas nilai di seluruh kolom. Selain itu, memilih tombol elipsis (...) membuka beberapa tombol tindakan cepat untuk operasi pada nilai.

Distribusi kolom nama dengan 701 nama valid (100 persen), nol kesalahan dan nol kosong, dengan perintah tindakan cepat ditampilkan.

Distribusi kolom

Fitur ini menyediakan sekumpulan visual di bawah nama kolom yang menampilkan frekuensi dan distribusi nilai di setiap kolom. Data dalam visualisasi ini diurutkan dalam urutan turun dari nilai dengan frekuensi tertinggi.

Distribusi kolom.

Dengan mengarahkan mouse ke atas data distribusi di salah satu kolom, Anda mendapatkan informasi tentang data keseluruhan di kolom (dengan jumlah yang berbeda dan nilai unik). Anda juga dapat memilih tombol elipsis dan memilih dari menu operasi yang tersedia.

Opsi distribusi kolom.

Profil kolom

Fitur ini memberikan tampilan yang lebih mendalam pada data dalam kolom. Selain bagan distribusi kolom, bagan tersebut berisi bagan statistik kolom. Informasi ini ditampilkan di bawah bagian pratinjau data, seperti yang ditunjukkan pada gambar berikut.

Profil kolom.

Filter menurut nilai

Anda dapat berinteraksi dengan bagan distribusi nilai di sisi kanan dan memilih salah satu bilah dengan mengarahkan mouse ke atas bagian bagan.

Arahkan mouse ke atas batang dalam bagan batang distribusi nilai, yang memperlihatkan data individual untuk bilah tersebut.

Klik kanan untuk menampilkan sekumpulan transformasi yang tersedia untuk nilai tersebut.

Menampilkan menu pintasan dengan tranformasi yang tersedia untuk satu bilah dalam bagan batang distribusi nilai.

Salin data

Di sudut kanan atas statistik kolom dan bagian distribusi nilai, Anda dapat memilih tombol elipsis (...) untuk menampilkan menu Salin pintasan. Pilih untuk menyalin data yang ditampilkan di salah satu bagian ke clipboard.

Salin statistik kolom.

Kelompokkan menurut nilai

Saat Anda memilih tombol elipsis (...) di sudut kanan atas bagan distribusi nilai, selain Salin , Anda dapat memilih Kelompokkan menurut. Fitur ini mengelompokkan nilai dalam bagan Anda menurut sekumpulan opsi yang tersedia.

Mengelompokkan menurut distribusi nilai.

Gambar di bawah ini memperlihatkan kolom nama produk yang telah dikelompokkan menurut panjang teks. Setelah nilai dikelompokkan dalam bagan, Anda bisa berinteraksi dengan nilai individual dalam bagan seperti yang dijelaskan dalam Filter menurut nilai.

Bagan batang baru memperlihatkan distribusi panjang teks nama penyimpanan di kolom Nama tabel.