Modul 1: Membuat alur dengan Data Factory
Modul ini membutuhkan waktu 10 menit, menyerap data mentah dari penyimpanan sumber ke dalam tabel Perunggu data Lakehouse menggunakan aktivitas Salin dalam alur.
Langkah-langkah tingkat tinggi dalam modul 1 adalah sebagai berikut:
- Membuat alur data.
- Gunakan Aktivitas Salin di alur untuk memuat data sampel ke dalam data Lakehouse.
Penting
Microsoft Fabric saat ini dalam PRATINJAU. Informasi ini berkaitan dengan produk prarilis yang mungkin dimodifikasi secara substansial sebelum dirilis. Microsoft tidak memberikan jaminan, tersurat maupun tersirat, sehubungan dengan informasi yang diberikan di sini. Lihat dokumentasi Azure Data Factory untuk layanan di Azure.
Membuat alur data
Akun penyewa Microsoft Fabric dengan langganan aktif diperlukan. Buat akun gratis.
Pastikan Anda memiliki Ruang Kerja yang diaktifkan Microsoft Fabric: Membuat ruang kerja.
Masuk ke Power BI.
Pilih ikon Power BI default di kiri bawah layar, dan beralihlah ke pengalaman Data Factory .
Pilih Alur data dan berikan nama alur. Kemudian pilih Buat.
Menggunakan aktivitas Salin di alur untuk memuat data sampel ke data Lakehouse
Langkah 1: Buat aktivitas Salin di alur baru Anda.
Pilih Tambahkan aktivitas alur, lalu pilih Salin data dari daftar aktivitas yang ditampilkan.
Langkah 2: Konfigurasikan pengaturan sumber Anda di aktivitas Salin baru Anda.
Pilih tab Sumber di area properti di bawah kanvas alur, lalu pilih + Baru untuk membuat sumber data baru. (Jika Anda tidak melihat tab Sumber , Anda mungkin perlu terlebih dahulu memilih aktivitas Salin data di area kanvas alur.)
Pilih Azure Blob Storage, lalu Lanjutkan.
Dalam dialog Koneksi baru , berikan detail yang relevan untuk koneksi. Untuk tutorial, kami menggunakan pengaturan berikut untuk data sampel Taksi NYC :
- Nama akun atau URL -
https://nyctaxisample.blob.core.windows.net/sample
- Koneksi - tidak berubah, meninggalkan Buat koneksi baru dipilih.
- Nama koneksi - NYC-Taxi-Anonymous
- Jenis autentikasi - Anonim
Kemudian pilih Buat.
- Nama akun atau URL -
Pada tab Sumber untuk sumber data baru yang Anda buat, pilih opsi Jalur file untuk Jenis jalur file, memasukkan sampel untuk jalur tingkat atas, lalu memilih menu dropdown Telusuri untuk memilih Dari jalur yang ditentukan.
Pada dialog Telusuri yang disajikan, pilih NYC-Taxi-Green-2015-01.parquet dan pilih OK.
Pilih Parquet untuk dropdown Format file , lalu pilih Pratinjau data.
Langkah 3: Konfigurasikan pengaturan tujuan untuk aktivitas Salin Anda.
Pilih tab Tujuan untuk aktivitas Salin Anda, lalu pilih + Baru untuk membuat tujuan Lakehouse baru, dan beri nama. Untuk tutorial ini, kami menamai tujuan Perunggu kami. Setelah memberikan nama, pilih Buat.
Untuk properti Nama tabel, pilih kotak centang Edit untuk membuat tabel Lakehouse baru tempat data dimuat, dan berikan nama nyc_taxi.
Langkah 4: Jalankan dan lihat hasil aktivitas Salin Anda.
Pilih tab Jalankan di editor alur. Lalu pilih tombol Jalankan , lalu Simpan dan jalankan pada perintah, untuk menjalankan aktivitas Salin.
Anda dapat memantau eksekusi dan memeriksa hasilnya pada tab Output di bawah kanvas alur. Pilih tombol detail eksekusi (ikon "kacamata" yang muncul saat Anda mengarahkan mouse ke atas eksekusi alur yang sedang berjalan) untuk melihat detail eksekusi.
Detail eksekusi menunjukkan 1.508.501 baris dibaca dan ditulis.
Perluas bagian Perincian durasi untuk melihat durasi setiap tahap aktivitas Salin. Setelah meninjau detail salinan, pilih Tutup.
Langkah berikutnya
Dalam modul pertama ini ke tutorial end-to-end kami untuk integrasi data pertama Anda menggunakan Data Factory di Microsoft Fabric, Anda mempelajari cara:
- Membuat alur data.
- Tambahkan aktivitas Salin ke alur Anda.
- Gunakan data sampel dan buat data Lakehouse untuk menyimpan data ke tabel baru.
- Jalankan alur dan lihat detail dan perincian durasinya.
Lanjutkan ke bagian berikutnya sekarang untuk membuat aliran data Anda.