Modul 1: Membuat alur dengan Data Factory

Modul ini membutuhkan waktu 10 menit, menyerap data mentah dari penyimpanan sumber ke dalam tabel Perunggu data Lakehouse menggunakan aktivitas Salin dalam alur.

Langkah-langkah tingkat tinggi dalam modul 1 adalah sebagai berikut:

  1. Membuat alur data.
  2. Gunakan Aktivitas Salin di alur untuk memuat data sampel ke dalam data Lakehouse.

Penting

Microsoft Fabric saat ini dalam PRATINJAU. Informasi ini berkaitan dengan produk prarilis yang mungkin dimodifikasi secara substansial sebelum dirilis. Microsoft tidak memberikan jaminan, tersurat maupun tersirat, sehubungan dengan informasi yang diberikan di sini. Lihat dokumentasi Azure Data Factory untuk layanan di Azure.

Membuat alur data

  1. Akun penyewa Microsoft Fabric dengan langganan aktif diperlukan. Buat akun gratis.

  2. Pastikan Anda memiliki Ruang Kerja yang diaktifkan Microsoft Fabric: Membuat ruang kerja.

  3. Masuk ke Power BI.

  4. Pilih ikon Power BI default di kiri bawah layar, dan beralihlah ke pengalaman Data Factory .

    Cuplikan layar memperlihatkan pilihan pengalaman Data Factory.

  5. Pilih Alur data dan berikan nama alur. Kemudian pilih Buat.

    Cuplikan layar halaman mulai Data Factory dengan tombol untuk membuat alur data baru yang dipilih.

    Cuplikan layar memperlihatkan dialog untuk memberi nama alur baru.

Menggunakan aktivitas Salin di alur untuk memuat data sampel ke data Lakehouse

Langkah 1: Buat aktivitas Salin di alur baru Anda.

Pilih Tambahkan aktivitas alur, lalu pilih Salin data dari daftar aktivitas yang ditampilkan.

Cuplikan layar memperlihatkan pilihan aktivitas Salin data dari halaman mulai alur baru.

Langkah 2: Konfigurasikan pengaturan sumber Anda di aktivitas Salin baru Anda.

  1. Pilih tab Sumber di area properti di bawah kanvas alur, lalu pilih + Baru untuk membuat sumber data baru. (Jika Anda tidak melihat tab Sumber , Anda mungkin perlu terlebih dahulu memilih aktivitas Salin data di area kanvas alur.)

    Cuplikan layar memperlihatkan pengaturan Sumber aktivitas Salin data dengan tombol + Baru disorot.

  2. Pilih Azure Blob Storage, lalu Lanjutkan.

    Cuplikan layar memperlihatkan pilihan jenis data Azure Blob Storage untuk koneksi baru.

  3. Dalam dialog Koneksi baru , berikan detail yang relevan untuk koneksi. Untuk tutorial, kami menggunakan pengaturan berikut untuk data sampel Taksi NYC :

    • Nama akun atau URL - https://nyctaxisample.blob.core.windows.net/sample
    • Koneksi - tidak berubah, meninggalkan Buat koneksi baru dipilih.
    • Nama koneksi - NYC-Taxi-Anonymous
    • Jenis autentikasi - Anonim

    Kemudian pilih Buat.

    Cuplikan layar memperlihatkan dialog Koneksi baru dengan pengaturan koneksi yang akan dikonfigurasi untuk tutorial.

  4. Pada tab Sumber untuk sumber data baru yang Anda buat, pilih opsi Jalur file untuk Jenis jalur file, memasukkan sampel untuk jalur tingkat atas, lalu memilih menu dropdown Telusuri untuk memilih Dari jalur yang ditentukan.

    Cuplikan layar memperlihatkan konfigurasi sumber data pada tab Sumber dengan pengaturan jalur yang ditentukan diterapkan dan dropdown Telusuri dipilih.

  5. Pada dialog Telusuri yang disajikan, pilih NYC-Taxi-Green-2015-01.parquet dan pilih OK.

    Cuplikan layar memperlihatkan dialog Telusuri dengan file NYC-Taxi-Green-20151-01.parquet dipilih dari folder sampel.

  6. Pilih Parquet untuk dropdown Format file , lalu pilih Pratinjau data.

    Cuplikan layar memperlihatkan pemilihan Parquet untuk format File, dengan tombol Pratinjau data disorot.

    Cuplikan layar memperlihatkan data Pratinjau untuk koneksi sumber data NYC-Taxi-Anonim yang dipilih.

Langkah 3: Konfigurasikan pengaturan tujuan untuk aktivitas Salin Anda.

  1. Pilih tab Tujuan untuk aktivitas Salin Anda, lalu pilih + Baru untuk membuat tujuan Lakehouse baru, dan beri nama. Untuk tutorial ini, kami menamai tujuan Perunggu kami. Setelah memberikan nama, pilih Buat.

    Cuplikan layar memperlihatkan konfigurasi tab Tujuan untuk aktivitas Salin.

    Cuplikan layar memperlihatkan dialog New lakehouse dengan nama Bronze yang disediakan dan tombol Buat disorot.

  2. Untuk properti Nama tabel, pilih kotak centang Edit untuk membuat tabel Lakehouse baru tempat data dimuat, dan berikan nama nyc_taxi.

    Cuplikan layar memperlihatkan pilihan kotak centang Edit di pengaturan Tujuan, dengan nama Tabel nyc_taxi dimasukkan.

Langkah 4: Jalankan dan lihat hasil aktivitas Salin Anda.

  1. Pilih tab Jalankan di editor alur. Lalu pilih tombol Jalankan , lalu Simpan dan jalankan pada perintah, untuk menjalankan aktivitas Salin.

    Cuplikan layar memperlihatkan tab Eksekusi alur dengan tombol Jalankan disorot.

    Cuplikan layar memperlihatkan dialog Simpan dan jalankan dengan tombol Simpan dan jalankan disorot.

  2. Anda dapat memantau eksekusi dan memeriksa hasilnya pada tab Output di bawah kanvas alur. Pilih tombol detail eksekusi (ikon "kacamata" yang muncul saat Anda mengarahkan mouse ke atas eksekusi alur yang sedang berjalan) untuk melihat detail eksekusi.

    Cuplikan layar memperlihatkan tombol detail eksekusi di tab Output alur.

  3. Detail eksekusi menunjukkan 1.508.501 baris dibaca dan ditulis.

    Cuplikan layar detail Salin data untuk eksekusi alur.

  4. Perluas bagian Perincian durasi untuk melihat durasi setiap tahap aktivitas Salin. Setelah meninjau detail salinan, pilih Tutup.

    Cuplikan layar memperlihatkan perincian durasi eksekusi aktivitas Salin.

Langkah berikutnya

Dalam modul pertama ini ke tutorial end-to-end kami untuk integrasi data pertama Anda menggunakan Data Factory di Microsoft Fabric, Anda mempelajari cara:

  • Membuat alur data.
  • Tambahkan aktivitas Salin ke alur Anda.
  • Gunakan data sampel dan buat data Lakehouse untuk menyimpan data ke tabel baru.
  • Jalankan alur dan lihat detail dan perincian durasinya.

Lanjutkan ke bagian berikutnya sekarang untuk membuat aliran data Anda.