Cara mempercepat persiapan data dengan Data Wrangler di Microsoft Fabric

Data Wrangler adalah alat berbasis notebook yang memberi pengguna pengalaman imersif untuk melakukan analisis data eksploratif. Fitur ini menggabungkan tampilan data seperti kisi dengan statistik ringkasan dinamis, visualisasi bawaan, dan pustaka operasi pembersihan data umum. Setiap operasi dapat diterapkan dalam hitungan klik, memperbarui tampilan data secara real time dan menghasilkan kode yang dapat disimpan kembali ke notebook sebagai fungsi yang dapat digunakan kembali.

Penting

Microsoft Fabric saat ini dalam PRATINJAU. Informasi ini berkaitan dengan produk prarilis yang mungkin dimodifikasi secara substansial sebelum dirilis. Microsoft tidak memberikan jaminan, tersurat maupun tersirat, sehubungan dengan informasi yang diberikan di sini.

Prasyarat

  • Langganan Power BI Premium. Jika Anda tidak memilikinya, lihat Cara membeli Power BI Premium.

  • Ruang kerja Power BI dengan kapasitas Premium yang ditetapkan. Jika Anda tidak memiliki ruang kerja, gunakan langkah-langkah dalam Membuat ruang kerja untuk membuatnya dan menetapkannya ke kapasitas Premium.

  • Masuk ke Microsoft Fabric.

Batasan

  • Data Wrangler saat ini hanya mendukung Pandas DataFrames. Dukungan untuk Spark DataFrames sedang berlangsung.
  • Tampilan Data Wrangler berfungsi lebih baik pada monitor besar, meskipun bagian antarmuka yang berbeda dapat diminimalkan atau disembunyikan untuk mengakomodasi layar yang lebih kecil.

Luncurkan Pembungkus Data

Pengguna dapat meluncurkan Data Wrangler langsung dari notebook Microsoft Fabric untuk menjelajahi dan mengubah DataFrame Pandas apa pun. Cuplikan kode ini menunjukkan cara membaca data sampel ke dalam Pandas DataFrame:

import pandas as pd

# Read a CSV into a Pandas DataFrame from e.g. a public blob store
df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/titanic.csv")

Di bawah tab "Data" pita buku catatan, gunakan perintah dropdown Data Wrangler untuk menelusuri DataFrame Pandas aktif yang tersedia untuk pengeditan. Pilih salah satu yang ingin Anda buka di Data Wrangler.

Tip

Data Wrangler tidak dapat dibuka saat kernel notebook sibuk. Sel yang dieksekusi harus menyelesaikan eksekusinya sebelum Data Wrangler dapat diluncurkan.

Cuplikan layar memperlihatkan notebook Fabric dengan perintah dropdown Data Wrangler.

Menampilkan statistik ringkasan

Saat Data Wrangler diluncurkan, Data Wrangler menghasilkan gambaran umum deskriptif dari DataFrame yang ditampilkan di panel Ringkasan. Gambaran umum ini mencakup informasi tentang dimensi DataFrame, nilai yang hilang, dan banyak lagi. Memilih kolom apa pun di kisi Data Wrangler meminta panel Ringkasan untuk memperbarui dan menampilkan statistik deskriptif tentang kolom tertentu tersebut. Wawasan cepat tentang setiap kolom juga tersedia di header-nya.

Tip

Statistik dan visual khusus kolom (di panel Ringkasan dan di header kolom) bergantung pada jenis data kolom. Misalnya, histogram terikat dari kolom numerik akan muncul di header kolom hanya jika kolom ditransmisikan sebagai jenis numerik. Gunakan panel Operasi untuk memprakirakan ulang jenis kolom untuk tampilan yang paling akurat.

Cuplikan layar memperlihatkan kisi tampilan Data Wrangler dan panel Ringkasan.

Menelusuri operasi pembersihan data

Daftar langkah-langkah pembersihan data yang dapat dicari dapat ditemukan di panel Operasi. (Anda juga dapat mengakses pilihan operasi yang sama yang lebih kecil di menu kontekstual setiap kolom.) Dari panel Operasi, memilih langkah pembersihan data meminta Anda untuk memilih kolom atau kolom target, bersama dengan parameter yang diperlukan untuk menyelesaikan langkah tersebut. Misalnya, permintaan untuk menskalakan kolom secara numerik memerlukan rentang nilai baru.

Cuplikan layar memperlihatkan panel Operasi Perselisihan Data.

Mempratinjau dan menerapkan operasi

Hasil operasi yang dipilih akan dipratinjau secara otomatis di kisi tampilan Data Wrangler, dan kode yang sesuai akan secara otomatis muncul di panel di bawah kisi. Untuk menerapkan kode yang dipratinjau, pilih "Terapkan" di salah satu tempat. Untuk menghilangkan kode yang dipratinjau dan mencoba operasi baru, pilih "Buang."

Cuplikan layar memperlihatkan operasi Data Wrangler sedang berlangsung.

Setelah operasi diterapkan, kisi tampilan Data Wrangler dan pembaruan statistik ringkasan untuk mencerminkan hasilnya. Kode yang dipratinjau muncul dalam daftar operasi yang sedang berjalan, yang terletak di panel Langkah pembersihan.

Cuplikan layar memperlihatkan operasi Data Wrangler yang diterapkan.

Tip

Anda selalu dapat membatalkan langkah yang terakhir diterapkan dengan ikon sampah di sampingnya, yang muncul jika Anda mengarahkan kursor ke langkah tersebut di panel Langkah pembersihan.

Cuplikan layar memperlihatkan operasi Data Wrangler yang dapat dibatalkan.

Tabel berikut ini meringkas operasi yang saat ini didukung Oleh Data Wrangler:

Operasi Deskripsi
urutkan Mengurutkan kolom dalam urutan naik atau turun
Filter Memfilter baris berdasarkan satu atau beberapa kondisi
Pengodean satu panas Buat kolom baru untuk setiap nilai unik di kolom yang sudah ada, yang menunjukkan ada atau tidak adanya nilai tersebut per baris
Pengodean satu panas dengan pemisah Memisahkan dan mengodekan data kategoris satu panas menggunakan pemisah
Ubah jenis kolom Mengubah tipe data kolom
Jatuhkan kolom Menghapus satu atau beberapa kolom
Pilih kolom Pilih satu atau beberapa kolom untuk disimpan, dan hapus sisanya
Ganti nama kolom Mengganti nama kolom
Hilangkan nilai yang hilang Menghapus baris dengan nilai yang hilang
Jatuhkan baris duplikat Jatuhkan semua baris yang memiliki nilai duplikat dalam satu atau beberapa kolom
Isi nilai yang hilang Ganti sel dengan nilai yang hilang dengan nilai baru
Cari dan ganti Ganti sel dengan pola pencocokan yang tepat
Mengelompokkan menurut kolom dan agregat Mengelompokkan menurut nilai kolom dan hasil agregat
Spasi kosong strip Menghapus spasi kosong dari awal dan akhir teks
Pisahkan teks Memisahkan kolom menjadi beberapa kolom berdasarkan pemisah yang ditentukan pengguna
Mengonversi teks menjadi huruf kecil Mengonversi teks menjadi huruf kecil
Mengonversi teks menjadi huruf besar Mengonversi teks menjadi HURUF BESAR
Menskalakan nilai min/maks Menskalakan kolom numerik antara nilai minimum dan maksimum
Isian Cepat Membuat kolom baru secara otomatis berdasarkan contoh yang berasal dari kolom yang sudah ada

Menyimpan dan mengekspor kode

Toolbar di atas kisi tampilan Data Wrangler menyediakan opsi untuk menyimpan kode yang dihasilkan alat. Anda bisa menyalin kode ke clipboard atau mengekspornya ke buku catatan sebagai fungsi. Mengekspor kode menutup Data Wrangler dan menambahkan fungsi baru ke sel kode di buku catatan. Anda juga dapat mengunduh DataFrame yang dibersihkan, yang tercermin dalam kisi tampilan Data Wrangler yang diperbarui, sebagai file csv.

Tip

Kode yang dihasilkan oleh Data Wrangler tidak akan diterapkan sampai Anda menjalankan sel baru secara manual, dan tidak akan menimpa DataFrame asli Anda.

Cuplikan layar memperlihatkan opsi untuk mengekspor kode di Data Wrangler.

Cuplikan layar memperlihatkan kode yang dihasilkan oleh Data Wrangler kembali di buku catatan.

Langkah berikutnya