Bagikan melalui


Menggunakan aktivitas perintah Azure Data Factory untuk menjalankan perintah manajemen Azure Data Explorer

Azure Data Factory (ADF) adalah layanan integrasi data berbasis cloud yang memungkinkan Anda melakukan kombinasi aktivitas pada data. Gunakan ADF untuk membuat alur kerja berbasis data untuk mengatur dan mengotomatiskan pergerakan data dan transformasi data. Aktivitas Azure Data Explorer Command di Azure Data Factory memungkinkan Anda menjalankan perintah manajemen Azure Data Explorer dalam alur kerja ADF. Artikel ini mengajarkan cara membuat alur dengan aktivitas pencarian dan aktivitas ForEach yang berisi aktivitas perintah Azure Data Explorer.

Prasyarat

Buat alur baru

  1. Pilih alat pensil Penulis .

  2. Buat alur baru dengan memilih + lalu pilih Alur dari menu drop-down.

    buat alur baru.

Membuat aktivitas Pencarian

Aktivitas pencarian dapat mengambil himpunan data dari sumber data yang didukung Azure Data Factory. Output dari aktivitas Pencarian dapat digunakan dalam ForEach atau aktivitas lainnya.

  1. Di panel Aktivitas , di bawah Umum, pilih aktivitas Pencarian . Seret dan letakkan ke kanvas utama di sebelah kanan.

    pilih aktivitas pencarian.

  2. Kanvas sekarang berisi aktivitas Pencarian yang Anda buat. Gunakan tab di bawah kanvas untuk mengubah parameter yang relevan. Secara umum, ganti nama aktivitas.

    edit aktivitas pencarian.

    Tip

    Klik area kanvas kosong untuk melihat properti alur. Gunakan tab Umum untuk mengganti nama alur. Alur kami diberi nama pipeline-4-docs.

Membuat himpunan data Azure Data Explorer dalam aktivitas pencarian

  1. Di Pengaturan, pilih himpunan data Azure Data Explorer Source yang telah dibuat sebelumnya, atau pilih + Baru untuk membuat himpunan data baru.

    tambahkan himpunan data di pengaturan pencarian.

  2. Pilih himpunan data Azure Data Explorer (Kusto) dari jendela Himpunan Data Baru. Pilih Lanjutkan untuk menambahkan himpunan data baru.

    pilih himpunan data baru.

  3. Parameter himpunan data Azure Data Explorer baru terlihat di Pengaturan. Untuk memperbarui parameter, pilih Edit.

    pengaturan pencarian dengan himpunan data Azure Data Explorer.

  4. Tab baru AzureDataExplorerTable terbuka di kanvas utama.

    • Pilih Umum dan edit nama himpunan data.
    • Pilih Koneksi untuk mengedit properti himpunan data.
    • Pilih layanan Tertaut dari menu drop-down, atau pilih + Baru untuk membuat layanan tertaut baru.

    Edit properti himpunan data Azure Data Explorer.

  5. Saat membuat layanan tertaut baru, halaman Layanan Tertaut Baru (Azure Data Explorer) terbuka:

    Azure Data Explorer layanan tertaut baru.

    • Pilih Nama untuk layanan tertaut azure Data Explorer. Tambahkan Deskripsi jika diperlukan.
    • Di Sambungkan melalui runtime integrasi, ubah pengaturan saat ini, jika diperlukan.
    • Dalam Metode pemilihan akun pilih kluster Anda menggunakan salah satu dari dua metode:
      • Pilih tombol radio Dari langganan Azure dan pilih akun langganan Azure Anda. Kemudian, pilih Kluster Anda. Perhatikan bahwa drop-down hanya akan mencantumkan kluster milik pengguna.
      • Sebagai gantinya, pilih tombol radio Masukkan secara manual dan masukkan Titik Akhir (URL kluster) Anda.
    • Tentukan Penyewa.
    • Masukkan ID perwakilan layanan. Nilai ini dapat ditemukan di portal Azure di bawah ID AplikasiGambaran Umum>Pendaftaran> Aplikasi(klien). Prinsipal harus memiliki izin yang memadai, sesuai dengan tingkat izin yang diperlukan oleh perintah yang digunakan.
    • Pilih tombol Kunci perwakilan layanan dan masukkan Kunci Perwakilan Layanan.
    • Pilih Database Anda dari menu dropdown. Atau, pilih kotak centang Edit dan masukkan nama database Anda.
    • Pilih Uji Koneksi untuk menguji koneksi layanan tertaut yang Anda buat. Jika Anda bisa menyambungkan ke penyiapan Anda, tanda centang hijau Koneksi berhasil akan muncul.
    • Pilih Selesai untuk menyelesaikan pembuatan layanan tertaut.
  6. Setelah Anda menyiapkan layanan tertaut, Di Koneksi AzureDataExplorerTable>, tambahkan Nama tabel. Pilih Pratinjau data, untuk memastikan bahwa data disajikan dengan benar.

    Himpunan data Anda sekarang siap, dan Anda dapat terus mengedit alur Anda.

Menambahkan kueri ke aktivitas pencarian Anda

  1. Di alur-4-dokumen>Pengaturan tambahkan kueri di kotak teks Kueri , misalnya:

    ClusterQueries
    | where Database !in ("KustoMonitoringPersistentDatabase", "$systemdb")
    | summarize count() by Database
    
  2. Ubah properti Batas waktu kueri atau Tidak ada pemotongan dan Baris pertama saja , sesuai kebutuhan. Dalam alur ini, kami mempertahankan batas waktu Kueri default dan menghapus centang pada kotak centang.

    Pengaturan akhir aktivitas pencarian.

Membuat aktivitas For-Each

Aktivitas For-Each digunakan untuk mengulangi koleksi dan menjalankan aktivitas tertentu dalam perulangan.

  1. Sekarang Anda menambahkan aktivitas For-Each ke alur. Aktivitas ini akan memproses data yang dikembalikan dari aktivitas Pencarian.

    • Di panel Aktivitas , di bawah Perulangan & Kondisional, pilih aktivitas ForEach dan seret dan letakkan ke kanvas.

    • Gambar garis antara output aktivitas Pencarian dan input aktivitas ForEach di kanvas untuk menghubungkannya.

      Aktivitas ForEach.

  2. Pilih aktivitas ForEach di kanvas. Di tab Pengaturan di bawah ini:

    • Centang kotak centang Berurutan untuk pemrosesan berurutan dari hasil Pencarian, atau biarkan tidak dicentang untuk membuat pemrosesan paralel.

    • Atur jumlah Batch.

    • Di Item, berikan referensi berikut ke nilai output: @activity('Lookup1').output.value

      Pengaturan aktivitas ForEach.

Membuat aktivitas Perintah Azure Data Explorer dalam aktivitas ForEach

  1. Klik dua kali aktivitas ForEach di kanvas untuk membukanya di kanvas baru untuk menentukan aktivitas dalam ForEach.

  2. Di panel Aktivitas, di bawah Azure Data Explorer, pilih aktivitas Azure Data Explorer Command dan seret dan letakkan ke kanvas.

    Aktivitas perintah Azure Data Explorer.

  3. Di tab Koneksi , pilih Layanan Tertaut yang sama yang sebelumnya dibuat.

    tab koneksi aktivitas perintah azure data explorer.

  4. Di tab Perintah , berikan perintah berikut ini:

    .export
    async compressed
    into csv h"http://<storageName>.blob.core.windows.net/data/ClusterQueries;<storageKey>" with (
    sizeLimit=100000,
    namePrefix=export
    )
    <| ClusterQueries | where Database == "@{item().Database}"
    

    Perintah menginstruksikan Azure Data Explorer untuk mengekspor hasil kueri tertentu ke dalam penyimpanan blob, dalam format terkompresi. Ini berjalan secara asinkron (menggunakan pengubah asinkron). Kueri membahas kolom database dari setiap baris dalam hasil aktivitas Pencarian. Batas waktu Perintah dapat dibiarkan tidak berubah.

    aktivitas perintah.

    Catatan

    Aktivitas perintah memiliki batasan berikut:

    • Batas ukuran: Ukuran respons 1 MB
    • Batas waktu: 20 menit (default), 1 jam (maksimum).
    • Jika diperlukan, Anda dapat menambahkan kueri ke hasil menggunakan AdminThenQuery, untuk mengurangi ukuran/waktu yang dihasilkan.
  5. Sekarang alur sudah siap. Anda dapat kembali ke tampilan alur utama dengan mengklik nama alur.

    Alur perintah Azure Data Explorer.

  6. Pilih Debug sebelum menerbitkan alur. Kemajuan alur dapat dipantau di tab Output .

    output aktivitas perintah penjelajah data azure.

  7. Anda dapat Menerbitkan Semua lalu Menambahkan pemicu untuk menjalankan alur.

Output perintah manajemen

Struktur output aktivitas perintah dirinci di bawah ini. Output ini dapat digunakan oleh aktivitas berikutnya dalam alur.

Nilai yang dikembalikan dari perintah manajemen non-asinkron

Dalam perintah manajemen non-asinkron, struktur nilai yang dikembalikan mirip dengan struktur hasil aktivitas Pencarian. Bidang count menunjukkan jumlah rekaman yang dikembalikan. Bidang value array tetap berisi daftar rekaman.

{ 
    "count": "2", 
    "value": [ 
        { 
            "ExtentId": "1b9977fe-e6cf-4cda-84f3-4a7c61f28ecd", 
            "ExtentSize": 1214.0, 
            "CompressedSize": 520.0 
        }, 
        { 
            "ExtentId": "b897f5a3-62b0-441d-95ca-bf7a88952974", 
            "ExtentSize": 1114.0, 
            "CompressedSize": 504.0 
        } 
    ] 
} 

Nilai yang dikembalikan dari perintah manajemen asinkron

Dalam perintah manajemen asinkron, aktivitas melakukan polling tabel operasi di belakang layar, hingga operasi asinkron selesai atau waktu habis. Oleh karena itu, nilai yang dikembalikan akan berisi hasil untuk .show operations OperationId properti OperationId yang diberikan. Periksa nilai properti Status dan Status , untuk memverifikasi keberhasilan penyelesaian operasi.

{ 
    "count": "1", 
    "value": [ 
        { 
            "OperationId": "910deeae-dd79-44a4-a3a2-087a90d4bb42", 
            "Operation": "TableSetOrAppend", 
            "NodeId": "", 
            "StartedOn": "2019-06-23T10:12:44.0371419Z", 
            "LastUpdatedOn": "2019-06-23T10:12:46.7871468Z", 
            "Duration": "00:00:02.7500049", 
            "State": "Completed", 
            "Status": "", 
            "RootActivityId": "f7c5aaaf-197b-4593-8ba0-e864c94c3c6f", 
            "ShouldRetry": false, 
            "Database": "MyDatabase", 
            "Principal": "<some principal id>", 
            "User": "<some User id>" 
        } 
    ] 
}