Latihan - Menggunakan data manipulasi Azure Data Factory

Selesai

Fitur Power Query dalam Azure Data Factory memungkinkan Anda untuk bekerja dengan dan manipulasi data. Ini adalah objek yang dapat ditambahkan ke desainer kanvas sebagai aktivitas dalam alur Azure Data Factory untuk melakukan persiapan data bebas kode. Ini memungkinkan individu yang tidak fasih dengan teknologi persiapan data tradisional seperti Spark atau SQL Server, dan bahasa seperti Python dan T-SQL untuk menyiapkan data pada skala cloud secara iteratif.

Fitur Power Query menggunakan antarmuka tipe kisi untuk persiapan data dasar yang seperti estetika Excel, yang dikenal sebagai Penyunting Mashup Online. Editor juga memungkinkan pengguna yang lebih mahir untuk melakukan persiapan data yang lebih kompleks menggunakan rumus. Anda harus terlebih dahulu membuat layanan yang tertaut ke sumber data terlebih dahulu sebelum Anda dapat mengakses data

Online Mashup Editor

Rumus bekerja dengan Power Query Online dan membuat fungsi Power Query M tersedia untuk pengguna pabrik data. Power Query kemudian menerjemahkan bahasa pemrogram M yang dihasilkan oleh Penyunting Mashup Online ke dalam kode spark untuk eksekusi skala cloud.

Kemampuan ini memungkinkan teknisi data dan analis data untuk mengeksplorasi dan menyiapkan kumpulan data secara interaktif. Selain itu, mereka dapat secara interaktif bekerja dengan bahasa M dan mempratinjau hasilnya sebelum melihatnya dalam konteks alur yang lebih luas.

Untuk menambahkan aktivitas Power Query di Azure Data Factory, klik ikon plus dan pilih Power Query di panel sumber daya Factory.

Create a Power Query activity

Tambahkan Himpunan data sumber untuk alur manipulasi data Anda, dan pilih himpunan data sink. Sumber data berikut didukung.

Konektor Format data Jenis autentikasi
Penyimpanan Blob Azure CSV, Parquet Kunci akun
Azure Data Lake Storage Gen1 CSV Perwakilan Layanan
Azure Data Lake Storage Gen2 CSV, Parquet Kunci Akun, Perwakilan Layanan
Database Azure SQL Autentikasi SQL
Azure Synapse Analytics Autentikasi SQL

Setelah Anda memilih sumber, lalu klik buat.

Adding source datasets to wrangling data flow

Ini membuka Online Mashup Editor.

Navigating the wrangling data flow

Ini terdiri dari komponen berikut:

  1. Daftar himpunan data.

    Ini akan memberikan himpunan data yang telah ditetapkan sebagai sumber untuk Manipulasi Data.

  2. Toolbar Fungsi Manipulasi.

    Toolbar berisi berbagai fungsi manipulasi data yang dapat diakses pengguna untuk memanipulasi data termasuk:

    • Mengelola kolom.
    • Mengubah tabel.
    • Mengurangi baris.
    • Menambahkan kolom.
    • Menggabungkan tabel.

    Setiap item yang sensitif terhadap konteks dan berisi sub fungsi khusus untuk item tersebut.

  3. Judul kolom.

    Selain memiliki kemampuan untuk mengganti nama kolom, mengklik kanan kolom akan memunculkan item yang sensitif terhadap konteks untuk mengelola kolom.

  4. Pengaturan.

    Ini memungkinkan Anda untuk menambahkan atau mengedit sumber data dan sink data, dan memodifikasi pengaturan untuk tugas manipulasi data.

  5. Jendela langkah.

    Jendela ini menunjukkan langkah-langkah yang telah diterapkan pada manipulasi output. Dalam contoh dalam grafik, langkah bernama "Source" telah diterapkan manipulasi output bernama "UserQuery".

  6. Daftar output Power Query.

    Mencantumkan output manipulasi data yang telah ditentukan.

  7. Terbitkan tombol.

    Memungkinkan Anda menerbitkan pekerjaan yang telah dibuat.

Tugas Power Query dapat ditambahkan di desainer kanvas seperti tugas Aktivitas Salin, atau tugas Pemetaan Alur Data dan dapat dikelola dan dipantau dengan cara yang sama.

completing the wrangling data flow