Menyerap data ke Gudang Anda menggunakan alur data
Berlaku untuk: Gudang di Microsoft Fabric
Alur data menawarkan alternatif untuk menggunakan perintah COPY melalui antarmuka pengguna grafis. Alur data adalah pengelompokan logis aktivitas yang bersama-sama melakukan tugas penyerapan data. Alur memungkinkan Anda mengelola aktivitas ekstraksi, transformasi, dan pemuatan (ETL) alih-alih mengelola masing-masing satu per satu.
Dalam tutorial ini, Anda akan membuat alur baru yang memuat data sampel ke gudang di Microsoft Fabric.
Catatan
Beberapa fitur dari Azure Data Factory tidak tersedia di Microsoft Fabric, tetapi konsepnya dapat dipertukarkan. Anda dapat mempelajari selengkapnya tentang Azure Data Factory dan Alur pada Alur dan aktivitas di Azure Data Factory dan Azure Synapse Analytics. Untuk mulai cepat, kunjungi Mulai Cepat: Membuat alur pertama Anda untuk menyalin data.
Membuat alur data
Untuk membuat alur baru, navigasikan ke ruang kerja Anda, pilih tombol +Baru , dan pilih Alur data.
Dalam dialog Alur baru, berikan nama untuk alur baru Anda dan pilih Buat.
Anda akan mendarat di area kanvas alur, tempat Anda melihat tiga opsi untuk memulai: Menambahkan aktivitas alur, Menyalin data, dan Memilih tugas untuk memulai.
Masing-masing opsi ini menawarkan alternatif yang berbeda untuk membuat alur:
- Tambahkan aktivitas alur: opsi ini meluncurkan editor alur, tempat Anda dapat membuat alur baru dari awal dengan menggunakan aktivitas alur.
- Salin data: opsi ini meluncurkan asisten langkah demi langkah yang membantu Anda memilih sumber data, tujuan, dan mengonfigurasi opsi beban data seperti pemetaan kolom. Setelah selesai, ini membuat aktivitas alur baru dengan tugas Salin Data yang sudah dikonfigurasi untuk Anda.
- Pilih tugas untuk memulai: opsi ini meluncurkan sekumpulan templat yang telah ditentukan sebelumnya untuk membantu Anda memulai alur berdasarkan skenario yang berbeda.
Pilih opsi Salin data untuk meluncurkan asisten Salin.
Halaman pertama asisten Salin data membantu Anda memilih data Anda sendiri dari berbagai sumber data, atau memilih dari salah satu sampel yang disediakan untuk memulai. Untuk tutorial ini, kita akan menggunakan sampel Data Lake COVID-19. Pilih opsi ini dan pilih Berikutnya.
Di halaman berikutnya, Anda dapat memilih himpunan data, format file sumber, dan mempratinjau himpunan data yang dipilih. Pilih Bing COVID-19, format CSV , dan pilih Berikutnya.
Halaman berikutnya, Tujuan data, memungkinkan Anda mengonfigurasi jenis ruang kerja tujuan. Kami akan memuat data ke gudang di ruang kerja kami, jadi pilih tab Gudang , dan opsi Gudang Data. Pilih Selanjutnya.
Sekarang saatnya untuk memilih gudang untuk memuat data. Pilih gudang yang Anda inginkan di daftar dropdown dan pilih Berikutnya.
Langkah terakhir untuk mengonfigurasi tujuan adalah memberikan nama ke tabel tujuan dan mengonfigurasi pemetaan kolom. Di sini Anda dapat memilih untuk memuat data ke tabel baru atau ke tabel yang sudah ada, menyediakan nama skema dan tabel, mengubah nama kolom, menghapus kolom, atau mengubah pemetaannya. Anda dapat menerima default, atau menyesuaikan pengaturan dengan preferensi Anda.
Setelah selesai meninjau opsi, pilih Berikutnya.
Halaman berikutnya memberi Anda opsi untuk menggunakan penahapan, atau menyediakan opsi tingkat lanjut untuk operasi penyalinan data (yang menggunakan perintah T-SQL COPY). Tinjau opsi tanpa mengubahnya dan pilih Berikutnya.
Halaman terakhir di asisten menawarkan ringkasan aktivitas salin. Pilih opsi Segera mulai transfer data dan pilih Simpan + Jalankan.
Anda diarahkan ke area kanvas alur, tempat aktivitas Salin Data baru sudah dikonfigurasi untuk Anda. Alur mulai berjalan secara otomatis. Anda dapat memantau status alur Anda di panel Output :
Setelah beberapa detik, alur Anda berhasil diselesaikan. Menavigasi kembali ke gudang Anda, Anda dapat memilih tabel Anda untuk mempratinjau data dan mengonfirmasi bahwa operasi salin disimpulkan.
Untuk informasi selengkapnya tentang penyerapan data ke gudang Anda di Microsoft Fabric, kunjungi:
- Menyerap data ke gudang
- Menyerap data ke gudang Anda menggunakan pernyataan COPY
- Menyerap data ke Gudang Anda menggunakan Transact-SQL
Langkah selanjutnya
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk