Menggabungkan file CSV
Di Power Query, Anda bisa menggabungkan beberapa file dari sumber data tertentu. Artikel ini menjelaskan cara kerja pengalaman saat file yang ingin Anda gabungkan adalah file CSV. Informasi selengkapnya: Gabungkan gambaran umum file
Tip
Anda dapat mengikuti contoh ini dengan mengunduh file sampel yang digunakan dalam artikel ini dari tautan unduhan ini. Anda dapat menempatkan file tersebut di sumber data pilihan Anda, seperti folder lokal, folder SharePoint, penyimpanan Azure Blob, Azure Data Lake Storage, atau sumber data lain yang menyediakan tampilan sistem file.
Untuk kesederhanaan, contoh dalam artikel ini menggunakan konektor Folder. Informasi selengkapnya: Folder
Untuk menggabungkan file, sangat penting bahwa semuanya memiliki struktur yang sama dan ekstensi yang sama. Semua file yang digunakan dalam contoh ini memiliki struktur dan ekstensi yang sama (.csv).
Ada 12 file CSV, satu untuk setiap bulan tahun kalender 2019. Gambar berikut menunjukkan 15 baris pertama file untuk bulan Januari.
Jumlah baris bervariasi dari file ke file, tetapi semua file memiliki bagian header di empat baris pertama. Mereka memiliki header kolom di baris kelima, dan data untuk tabel dimulai di baris keenam dan berlanjut melalui semua baris berikutnya.
Tujuannya adalah untuk menggabungkan semua 12 file ke dalam satu tabel. Tabel gabungan ini berisi baris header di bagian atas tabel, dan menyertakan nama sumber, tanggal, negara, unit, dan data pendapatan untuk seluruh tahun dalam kolom terpisah setelah baris header.
Saat menyambungkan ke folder yang menghosting file yang ingin Anda gabungkan—dalam contoh ini, nama folder tersebut adalah File CSV—Anda akan menampilkan kotak dialog pratinjau tabel, yang menampilkan jalur folder Anda di sudut kiri atas. Pratinjau data memperlihatkan tampilan sistem file.
Untuk contoh ini, pilih Gabungkan.
Catatan
Dalam situasi yang berbeda, Anda dapat memilih Ubah data untuk memfilter dan mengubah data Anda lebih lanjut sebelum menggabungkan file. Memilih Gabungkan hanya disarankan saat Anda yakin bahwa folder hanya berisi file yang ingin Anda gabungkan.
Setelah Anda memilih Gabungkan dalam pratinjau tabel, kotak dialog Gabungkan file muncul.
Catatan
Power Query secara otomatis mendeteksi konektor apa yang akan digunakan berdasarkan file pertama yang ditemukan dalam daftar. Untuk mempelajari selengkapnya tentang konektor CSV, buka Teks/CSV.
Untuk contoh ini, biarkan semua pengaturan default (Contoh file diatur ke File pertama, dan nilai default untuk deteksi Asal file, Pemisah, dan Jenis data).
Sekarang pilih Ubah data di sudut kanan bawah untuk masuk ke kueri output.
Setelah memilih Transformasi data dalam kotak dialog Gabungkan file, Anda akan dibawa kembali ke Editor Power Query dalam kueri yang awalnya Anda buat dari koneksi ke folder lokal. Kueri output sekarang berisi nama file sumber di kolom paling kiri, bersama dengan data dari setiap file sumber di kolom yang tersisa.
Namun, data tidak dalam bentuk yang benar. Anda perlu menghapus empat baris teratas dari setiap file sebelum menggabungkannya. Untuk membuat perubahan ini di setiap file sebelum Anda menggabungkannya, pilih kueri File Sampel Transformasi di panel Kueri di sisi kiri layar Anda.
Dalam kueri file Sampel Transformasi ini, nilai dalam kolom Tanggal menunjukkan bahwa data adalah untuk bulan April, yang memiliki format hari sebulan (YYYY-MM-DD). April 2019.csv adalah file pertama yang ditampilkan dalam pratinjau tabel.
Anda sekarang perlu menerapkan serangkaian transformasi baru untuk membersihkan data. Setiap transformasi akan secara otomatis dikonversi ke fungsi di dalam grup kueri Helper yang akan diterapkan ke setiap file di folder sebelum menggabungkan data dari setiap file.
Transformasi yang perlu ditambahkan ke kueri file Sampel Transformasi adalah:
Hapus baris atas: Untuk melakukan operasi ini, pilih menu ikon tabel di sudut kiri atas tabel, lalu pilih Hapus baris atas.
Dalam kotak dialog Hapus baris atas, masukkan 4, lalu pilih OK.
Setelah memilih OK, tabel Anda tidak akan lagi memiliki empat baris teratas.
Gunakan baris pertama sebagai header: Pilih ikon tabel lagi, lalu pilih Gunakan baris pertama sebagai header.
Hasil operasi tersebut akan mempromosikan baris pertama tabel ke header kolom baru.
Setelah operasi ini selesai, Power Query secara default akan mencoba mendeteksi tipe data kolom secara otomatis dan menambahkan langkah tipe kolom yang diubah baru.
Saat Anda kembali ke kueri File CSV, Anda akan melihat bahwa langkah terakhir memberi Anda kesalahan yang berbunyi "Kolom 'Kolom1' tabel tidak ditemukan." Alasan di balik kesalahan ini adalah bahwa status kueri sebelumnya adalah melakukan operasi terhadap kolom bernama Column1. Tetapi karena perubahan yang dilakukan pada kueri file Sampel Transformasi, kolom ini tidak lagi ada. Informasi selengkapnya: Menangani kesalahan di Power Query
Anda bisa menghapus langkah terakhir kueri ini dari panel Langkah yang diterapkan dengan memilih ikon hapus X di sisi kiri nama langkah. Setelah menghapus langkah ini, kueri Anda akan menampilkan hasil yang benar.
Namun, perhatikan bahwa tidak ada kolom yang berasal dari file (Tanggal, Negara, Unit, Pendapatan) yang memiliki jenis data tertentu yang ditetapkan untuk mereka. Tetapkan tipe data yang benar ke setiap kolom dengan menggunakan tabel berikut.
Nama kolom | Jenis Data |
---|---|
Date | Date |
Negara | Teks |
Unit-unit | Bilangan bulat |
Pendapatan | Mata Uang |
Setelah menentukan jenis data untuk setiap kolom, Anda akan siap untuk memuat tabel.
Catatan
Untuk mempelajari cara menentukan atau mengubah jenis data kolom, buka Jenis data.
Untuk memvalidasi bahwa semua file telah digabungkan, Anda dapat memilih ikon filter pada judul kolom Source.Name , yang akan menampilkan semua nama file yang telah digabungkan. Jika Anda mendapatkan peringatan "Daftar mungkin tidak lengkap", pilih Muat selengkapnya di bagian bawah menu untuk menampilkan nilai yang lebih tersedia di kolom.
Setelah Anda memilih Muat lebih banyak, semua nama file yang tersedia akan ditampilkan.