Mulai menggunakan Azure Data Factory

Azure Data Factory Azure Synapse Analytics

Tip

Data Factory di Microsoft Fabric adalah generasi Azure Data Factory berikutnya, dengan arsitektur yang lebih sederhana, AI bawaan, dan fitur baru. Jika Anda baru menggunakan integrasi data, mulailah dengan Fabric Data Factory. Beban kerja ADF yang ada dapat ditingkatkan ke Fabric untuk mengakses kemampuan baru di seluruh ilmu data, analitik real time, dan pelaporan.

Selamat datang di Azure Data Factory! Artikel ini membantu Anda membuat pabrik data dan alur pertama Anda dalam waktu lima menit.

Templat Azure Resource Manager (templat ARM) dalam artikel ini membuat dan mengonfigurasi semua yang Anda butuhkan. Kemudian Anda dapat membuka pabrik data demo dan memicu alur, yang memindahkan beberapa data sampel dari satu folder Azure Blob Storage ke folder lain.

Prasyarat

Jika Anda tidak memiliki langganan Azure, buat akun free sebelum Memulai.

Ringkasan video

Video berikut ini menyediakan pemaparan langkah demi langkah dari sampel dalam artikel ini.

Langkah 1: Gunakan demo untuk membuat sumber daya

Dalam skenario demo ini, Anda menggunakan aktivitas copy di pabrik data untuk menyalin blob bernama moviesDB2.csv dari folder input di Azure Blob Storage ke folder output. Dalam skenario dunia nyata, operasi penyalinan ini bisa dilakukan antara berbagai sumber dan tujuan data yang didukung yang tersedia dalam layanan. Ini juga dapat melibatkan transformasi dalam data.

  1. Pilih tombol berikut.

     Coba demo pabrik data pertama Anda

    Memilih tombol membuat sumber daya Azure berikut:

    • Akun Azure Data Factory
    • Pabrik data yang berisi sebuah pipeline dengan satu aktivitas penyalinan
    • Akun Azure Blob Storage dengan moviesDB2.csv diunggah ke folder input sebagai sumber
    • Layanan tertaut untuk menyambungkan pabrik data ke Blob Storage
  2. Anda diarahkan ke halaman konfigurasi untuk menyebarkan templat. Pada halaman ini:

    1. Untuk Grup sumber daya, pilih Buat baru untuk membuat grup sumber daya. Anda dapat membiarkan semua pengaturan lain sebagai defaultnya.

    2. Pilih Tinjau + buat, lalu pilih Buat untuk menyebarkan sumber daya.

    Cuplikan layar halaman untuk menyebarkan templat untuk pembuatan sumber daya.

Catatan

Pengguna yang menerapkan templat perlu menetapkan peran ke identitas terkelola. Langkah ini memerlukan izin yang dapat diberikan melalui peran Pemilik, Administrator Akses Pengguna, atau Operator Identitas Terkelola.

Semua sumber daya dalam demo ini dibuat di grup sumber daya baru, sehingga Anda dapat dengan mudah membersihkannya nanti.

Langkah 2: Meninjau sumber daya yang disebarkan

  1. Dalam pesan yang menunjukkan keberhasilan penyelesaian penyebaran Anda, pilih Buka grup sumber daya.

    Screenshot halaman portal Azure yang menunjukkan keberhasilan penyebaran templat demo.

  2. Grup sumber daya mencakup data factory baru, akun Blob Storage, dan identitas terkelola yang dibuat oleh penyebaran. Pilih pabrik data di grup sumber daya untuk melihatnya.

    Cuplikan layar konten grup sumber daya yang dibuat untuk demo, dengan pabrik data disorot.

  3. Pilih tombol Luncurkan studio .

    Cuplikan layar portal Azure yang menampilkan detail untuk pabrik data yang baru saja dibuat, dengan tombol untuk membuka studio Azure Data Factory disorot.

  4. Di Azure Data Factory Studio:

    1. Pilih tab Penulis.
    2. Pilih alur yang dibuat templat.
    3. Periksa data sumber dengan memilih Buka.

    Screenshot Azure Data Factory Studio yang memperlihatkan alur yang dibuat oleh template.

  5. Di himpunan data sumber, pilih Telusuri untuk melihat file input yang dibuat untuk demo.

    Cuplikan layar himpunan data sumber, dengan tombol Telusuri disorot.

    Perhatikan file moviesDB2.csv, yang sudah diunggah ke folder input.

    Cuplikan layar konten folder input, memperlihatkan file input yang digunakan dalam demo.

Langkah 3: Memicu alur demo agar berfungsi

  1. Pilih Tambahkan pemicu, lalu pilih Picu sekarang.

    Cuplikan layar tombol untuk memicu alur demo berjalan.

  2. Pada panel di sebelah kanan, di bawah Jalankan Alur, pilih OK.

Monitor saluran pipa

  1. Pilih tab MonitorTab Monitor . Tab ini memberikan ikhtisar tentang jalannya pipeline Anda, termasuk waktu mulai dan status.

    Tangkapan layar tab untuk memantau proses pipeline di fabrik data.

  2. Dalam pengenalan cepat ini, alur hanya memiliki satu jenis aktivitas: Penyalinan data. Pilih nama alur untuk melihat detail hasil eksekusi aktivitas salin.

    Cuplikan layar hasil eksekusi aktivitas salin pada tab untuk memantau pabrik data.

  3. Pilih ikon Detail untuk menampilkan proses penyalinan terperinci. Dalam hasilnya, ukuran Data dibaca dan Data ditulis sama, dan satu file dibaca dan ditulis. Informasi ini membuktikan bahwa semua data berhasil disalin ke tujuan.

    Cuplikan layar hasil eksekusi terperinci untuk aktivitas salin.

Membersihkan sumber daya

Anda dapat membersihkan semua sumber daya yang Anda buat dalam artikel ini dengan salah satu dari dua cara:

  • Anda dapat menghapus seluruh grup sumber daya Azure, yang mencakup semua sumber daya yang dibuat di dalamnya.

  • Jika Anda ingin mempertahankan beberapa sumber daya tetap utuh, buka grup sumber daya dan hapus hanya sumber daya tertentu yang ingin Anda hapus.

    Misalnya, jika Anda menggunakan templat ini untuk membuat pabrik data untuk digunakan dalam tutorial lain, Anda dapat menghapus sumber daya lain tetapi hanya menyimpan pabrik data.

Dalam artikel ini, Anda membuat pabrik data yang berisi rangkaian alur dengan aktivitas penyalinan. Untuk mempelajari selengkapnya tentang Azure Data Factory, lanjutkan ke artikel dan modul pelatihan berikut: