Salin dari Azure Blob Storage ke Lakehouse

Dalam tutorial ini, Anda akan membangun alur data untuk memindahkan file CSV dari folder input sumber Azure Blob Storage ke tujuan Lakehouse.

Prasyarat

Untuk memulai, Anda harus menyelesaikan prasyarat berikut:

  • Pastikan Anda memiliki Ruang Kerja yang diaktifkan Project Microsoft Fabric: Membuat ruang kerja.

  • Pilih tombol Coba sekarang! untuk menyiapkan sumber data Azure Blob Storage dari Salin. Buat grup sumber daya baru untuk Azure Blob Storage ini dan pilih Tinjau + Buat>.

    Try your first data factory demo

    Screenshot of Project details screen.

    Kemudian Azure Blob Storage akan dibuat dan moviesDB2.csv akan diunggah ke folder input Azure Blob Storage yang dibuat.

    Screenshot showing where new storage appears in folder.

Membuat alur data

  1. Beralih ke Pabrik data di halaman app.powerbi.com.

    Screenshot of menu in which Data factory option appears.

  2. Buat ruang kerja baru untuk demo ini.

    Screenshot of Workspace screen.

  3. Pilih Baru, lalu pilih Alur Data.

    Screenshot of the New menu.

Menyalin data menggunakan Asisten Salin

Dalam sesi ini, Anda akan mulai membuat alur data dengan menggunakan langkah-langkah berikut. Langkah-langkah ini menyalin file CSV dari folder input Azure Blob Storage ke tujuan Lakehouse menggunakan asisten salin.

Langkah 1: Mulailah dengan asisten salin

  1. Pilih Salin data di kanvas untuk membuka alat asisten salin untuk memulai. Atau Pilih Gunakan asisten salin dari daftar turun bawah Salin data di bawah tab Aktivitas pada pita.

    Screenshot of two options to select copy assistant.

Langkah 2: Mengonfigurasi sumber Anda

  1. Pilih Azure Blob Storage, lalu pilih Berikutnya.

    Screenshot showing where to choose Azure Blob Storage as data source.

  2. Buat koneksi ke sumber data Anda dengan memilih Koneksi baru.

    Screenshot showing where to select New connection.

    1. Setelah memilih Buat koneksi baru, Anda hanya perlu mengisi Nama akun atau URL, dan Jenis autentikasi. Jika Anda memasukkan Nama akun atau URL menggunakan nama akun Azure Blob Storage Anda, koneksi akan diisi secara otomatis. Dalam demo ini, kami akan memilih Kunci akun tetapi Anda dapat memilih jenis Autentikasi lainnya mengenai preferensi Anda. Setelah memilih Masuk, Anda hanya perlu masuk ke satu akun yang memiliki izin penyimpanan blob ini.

      Screenshot showing the Connect to data source screen of the copy data assistant.

    2. Setelah koneksi berhasil dibuat, Anda hanya perlu memilih Berikutnya untuk Koneksi ke sumber data.

  3. Pilih file moviesDB2.csv dalam konfigurasi sumber untuk dipratinjau, lalu pilih Berikutnya.

    Screenshot showing how to choose data source.

Langkah 3: Mengonfigurasi tujuan Anda

  1. Pilih Lakehouse lalu Berikutnya.

    Screenshot showing the Choose data destination dialog with Lakehouse selected.

  2. Buat Lakehouse baru dan masukkan nama Lakehouse. Kemudian pilih Berikutnya.

    Screenshot showing the Choose data destination dialog with the new lakehouse option selected.

  3. Konfigurasikan dan petakan data sumber Anda ke tujuan Anda; lalu pilih Berikutnya untuk menyelesaikan konfigurasi tujuan Anda.

    Screenshot showing the Connect to data destination dialog in the copy data assistant with the table name MoviesDB filled in.

Langkah 4: Tinjau dan buat aktivitas salin Anda

  1. Tinjau pengaturan aktivitas salin Anda di langkah-langkah sebelumnya dan pilih OK untuk menyelesaikannya. Atau Anda dapat kembali ke langkah-langkah sebelumnya untuk mengedit pengaturan Anda jika diperlukan di alat.

    Screenshot showing the Review + create screen in the Copy data assistant dialog.

  2. Setelah selesai, aktivitas salin kemudian akan ditambahkan ke kanvas alur data Anda. Semua pengaturan termasuk pengaturan tingkat lanjut untuk aktivitas salin ini tersedia di bawah tab di bawah ini ketika dipilih.

    Screenshot showing the finished Copy activity.

Menjalankan dan menjadwalkan alur data Anda

  1. Beralih ke tab Beranda dan pilih Jalankan. Lalu pilih Simpan dan Jalankan.

    Screenshot showing the Copy activity's Run button on the Home tab.

    Screenshot showing the Save and run dialog for the Copy activity.

  2. Pilih tombol Detail untuk memantau kemajuan dan memeriksa hasil eksekusi.

    Screenshot showing the run Details button.

  3. Dialog Salin detail data menampilkan hasil eksekusi termasuk status, volume data yang dibaca dan ditulis, waktu mulai dan berhenti, dan durasi.

    Screenshot showing the Copy data details dialog.

  4. Anda juga dapat menjadwalkan alur untuk dijalankan dengan frekuensi tertentu sesuai kebutuhan. Di bawah ini adalah sampel untuk menjadwalkan alur untuk berjalan setiap 15 menit.

    Screenshot showing the schedule configuration dialog.

    Screenshot showing a pipeline with a configured schedule to run every 15 minutes.

Alur dalam sampel ini menunjukkan kepada Anda cara menyalin data dari Azure Blob Storage ke Lakehouse. Anda mempelajari cara untuk:

  • Membuat alur data.
  • Salin data dengan Asisten Salin.
  • Jalankan dan jadwalkan alur data Anda.

Selanjutnya, lanjutkan untuk mempelajari selengkapnya tentang memantau eksekusi alur Anda.