Mulai cepat: Membuat aliran data pertama Anda untuk mendapatkan dan mengubah data

Aliran data adalah teknologi persiapan data berbasis cloud, layanan mandiri. Dalam artikel ini, Anda membuat aliran data pertama, mendapatkan data untuk aliran data Anda, lalu mengubah data dan menerbitkan aliran data.

Prasyarat

Prasyarat berikut diperlukan sebelum Anda memulai:

  • Akun penyewa Microsoft Fabric dengan langganan aktif. Buat akun gratis.
  • Pastikan Anda memiliki Ruang Kerja yang diaktifkan Microsoft Fabric: Membuat ruang kerja.

Membuat aliran data

Di bagian ini, Anda membuat aliran data pertama Anda.

  1. Beralih ke pengalaman Pabrik data.

    Screenshot with the data factory experience emphasized.

  2. Navigasi ke ruang kerja Microsoft Fabric Anda.

    Screenshot of the workspaces window where you navigate to your workspace.

  3. Pilih Baru, lalu pilih Aliran Data Gen2.

    Screenshot with the Dataflow Gen2 selection emphasized.

Dapatkan data

Mari kita mendapatkan beberapa data! Dalam contoh ini, Anda mendapatkan data dari layanan OData. Gunakan langkah-langkah berikut untuk mendapatkan data dalam aliran data Anda.

  1. Di editor aliran data, pilih Dapatkan data lalu pilih Lainnya.

    Screenshot with the Get Data option selected and More emphasized in the drop-down box.

  2. Di Pilih sumber data, pilih Tampilkan lainnya.

    Screenshot of Get data source with View more emphasized.

  3. Di Sumber baru, pilih OData Lain>sebagai sumber data.

    Screenshot of Get data source with the Other category and the OData connector emphasized.

  4. Masukkan URL https://services.odata.org/v4/northwind/northwind.svc/, lalu pilih Berikutnya.

    Screenshot of the OData data source where you enter the data URL.

  5. Pilih tabel Pesanan dan Pelanggan , lalu pilih Buat.

    Screenshot of the Power Query navigator with the Customers and Orders tables emphasized.

Anda dapat mempelajari selengkapnya tentang mendapatkan pengalaman dan fungsionalitas data di Mendapatkan gambaran umum data.

Menerapkan transformasi dan menerbitkan

Anda sekarang telah memuat data Anda ke dalam aliran data pertama Anda, selamat! Sekarang saatnya untuk menerapkan beberapa transformasi untuk membawa data ini ke dalam bentuk yang diinginkan.

Anda akan melakukan tugas ini dari editor Power Query. Anda bisa menemukan gambaran umum terperinci tentang editor Power Query di antarmuka pengguna Power Query.

Ikuti langkah-langkah ini untuk menerapkan transformasi dan menerbitkan:

  1. Pastikan bahwa alat Pembuatan Profil Data diaktifkan dengan menavigasi ke Opsi Global Opsi>Beranda>.

    Screenshot of Global options with the Column profile selections emphasized.

    Pastikan juga Anda telah mengaktifkan tampilan diagram menggunakan opsi di bawah tab Tampilan di pita editor Power Query, atau dengan memilih ikon tampilan diagram di sisi kanan bawah jendela Power Query.

    Screenshot of the overall look of Power Query diagram view.

  2. Dalam tabel Pesanan, Anda menghitung jumlah total pesanan per pelanggan. Untuk mencapai tujuan ini, pilih kolom CustomerID di pratinjau data lalu pilih Kelompokkan Menurut di bawah tab Transformasi di pita.

    Screenshot showing the Orders table selected, and Group by emphasized in the Transform tab.

  3. Anda melakukan hitungan baris sebagai agregasi dalam Kelompokkan Menurut. Anda dapat mempelajari selengkapnya tentang kemampuan Kelompokkan Menurut di Mengelompokkan atau meringkas baris.

    Screenshot of Group by, with the Count rows operation selected.

  4. Setelah mengelompokkan data dalam tabel Pesanan, kita akan mendapatkan tabel dua kolom dengan CustomerID dan Menghitung sebagai kolom.

    Screenshot of the two column table.

  5. Selanjutnya, Anda ingin menggabungkan data dari tabel Pelanggan dengan Jumlah Pesanan per pelanggan. Untuk menggabungkan data, pilih kueri Pelanggan di Tampilan Diagram dan gunakan menu "⋮" untuk mengakses kueri Gabungkan sebagai transformasi baru .

    Screenshot of the dataflow editor, with the vertical ellipsis of the Customers table and Merge queries as new emphasized.

  6. Konfigurasikan operasi Gabungkan seperti yang ditunjukkan pada cuplikan layar berikut dengan memilih CustomerID sebagai kolom yang cocok di kedua tabel. Lalu pilih Ok.

    Screenshot of the Merge window.

    Cuplikan layar jendela Gabungkan, dengan tabel Kiri untuk digabungkan diatur ke tabel Pelanggan dan tabel Kanan untuk penggabungan diatur ke tabel Pesanan. Kolom CustomerID dipilih untuk tabel Pelanggan dan Pesanan. Selain itu, Jenis Gabungan diatur ke Kiri luar. Semua pilihan lainnya diatur ke nilai defaultnya.

  7. Setelah melakukan operasi Gabungkan kueri sebagai baru , Anda mendapatkan kueri baru dengan semua kolom dari tabel Pelanggan dan satu kolom dengan data berlapis dari tabel Pesanan.

    Screenshot of the dataflows editor with the new Merge query added to the right of the Customers and Orders tables.

  8. Dalam contoh ini, Anda hanya tertarik dengan subkumpulan kolom dalam tabel Pelanggan. Anda memilih kolom tersebut dengan menggunakan tampilan skema. Aktifkan tampilan skema dalam tombol alihkan di sudut kanan bawah editor aliran data.

    Screenshot of the dataflows editor with the schema view button emphasized in the bottom-right corner.

  9. Tampilan skema menyediakan tampilan terfokus ke dalam informasi skema tabel, termasuk nama kolom dan jenis data. Tampilan skema memiliki sekumpulan alat skema yang tersedia melalui tab pita kontekstual. Dalam skenario ini, Anda memilih kolom CustomerID, CompanyName, dan Orders (2), lalu pilih tombol Hapus kolom , lalu pilih Hapus kolom lain di tab Alat skema.

    Screenshot of the schema view showing all of the available column names, with the CustomerID, CompanyName, and Orders (2) columns emphasized.

    Screenshot of the schema tools menu with Remove other columns emphasized.

  10. Kolom Pesanan (2) berisi informasi berlapis yang dihasilkan dari operasi penggabungan yang Anda lakukan beberapa langkah yang lalu. Sekarang, beralih kembali ke tampilan data dengan memilih tombol Tampilkan tampilan data di samping tombol Perlihatkan tampilan skema di sudut kanan bawah UI. Kemudian gunakan transformasi Perluas Kolom di header kolom Pesanan (2) untuk memilih kolom Hitung .

    Screenshot for using data view.

  11. Sebagai operasi akhir, Anda ingin memberi peringkat pelanggan Anda berdasarkan jumlah pesanan mereka. Pilih kolom Hitung lalu pilih tombol Peringkatkan kolom di bawah tab Tambahkan Kolom di pita.

    Screenshot of the dataflows editor with the Count column selected.

  12. Pertahankan pengaturan default di Kolom Peringkat. Lalu pilih OK untuk menerapkan transformasi ini.

    Screenshot of the Rank window with all default settings displayed.

  13. Sekarang ganti nama kueri yang dihasilkan sebagai Pelanggan Berpangkat menggunakan panel Pengaturan kueri di sisi kanan layar.

    Screenshot of the dataflows editor with the Ranked Customers name emphasized under the query settings properties.

  14. Anda telah selesai mengubah dan menggabungkan data Anda. Jadi, Anda sekarang mengonfigurasi pengaturan tujuan outputnya. Pilih Pilih tujuan data di bagian bawah panel Pengaturan kueri.

    Screenshot of the dataflows editor with the location of the Data destination selection emphasized.

  15. Untuk langkah ini, Anda dapat mengonfigurasi output ke lakehouse jika Anda memilikinya, atau melewati langkah ini jika tidak. Dalam pengalaman ini, Anda dapat mengonfigurasi lakehouse dan tabel tujuan untuk hasil kueri Anda, selain metode pembaruan (Tambahkan atau Ganti).

    Screenshot of the Connect to data destination window with lakehouse selected.

    Screenshot of the Choose destination settings window.

  16. Aliran data Anda sekarang siap untuk diterbitkan. Tinjau kueri dalam tampilan diagram, lalu pilih Terbitkan.

    Screenshot of the dataflows editor with the Publish button on the lower-right side emphasized.

    Anda sekarang dikembalikan ke ruang kerja. Ikon spinner di samping nama aliran data Anda menunjukkan penerbitan sedang berlangsung. Setelah penerbitan selesai, aliran data Anda siap untuk di-refresh!

    Penting

    Ketika Dataflow Gen2 pertama dibuat di ruang kerja, item Lakehouse dan Warehouse disediakan bersama dengan titik akhir analitik SQL terkait dan model semantik. Item ini dibagikan oleh semua aliran data di ruang kerja dan diperlukan agar Dataflow Gen2 beroperasi, tidak boleh dihapus, dan tidak dimaksudkan untuk digunakan langsung oleh pengguna. Item adalah detail implementasi Dataflow Gen2. Item tidak terlihat di ruang kerja, tetapi mungkin dapat diakses dalam pengalaman lain seperti pengalaman Notebook, titik akhir analitik SQL, Lakehouse, dan Gudang. Anda dapat mengenali item dengan awalannya dalam nama. Awalan item adalah 'DataflowsStaging'.

  17. Di ruang kerja Anda, pilih ikon Jadwalkan Refresh .

    Screenshot of the workspace with the schedule refresh icon emphasized.

  18. Aktifkan refresh terjadwal, pilih Tambahkan waktu lain, dan konfigurasikan refresh seperti yang ditunjukkan pada cuplikan layar berikut.

    Screenshot showing how to select another time.

    Cuplikan layar opsi refresh terjadwal, dengan refresh terjadwal diaktifkan, frekuensi refresh diatur ke Harian, Zona waktu diatur ke waktu universal terkoordinasi, dan Waktu diatur ke pukul 04.00. Tombol Aktifkan, tambahkan pilihan waktu lain, pemilik aliran data, dan tombol terapkan semuanya ditekankan.

Membersihkan sumber daya

Jika Anda tidak akan terus menggunakan aliran data ini, hapus aliran data menggunakan langkah-langkah berikut:

  1. Navigasi ke ruang kerja Microsoft Fabric Anda.

    Screenshot of the workspaces window where you navigate to your workspace.

  2. Pilih elipsis vertikal di samping nama aliran data Anda lalu pilih Hapus.

    Screenshot with the three vertical dots and the delete option in the drop-down menu emphasized.

  3. Pilih Hapus untuk mengonfirmasi penghapusan aliran data Anda.

    Screenshot of the Delete dataflow window, with the Delete button emphasized.

Aliran data dalam sampel ini menunjukkan kepada Anda cara memuat dan mengubah data di Dataflow Gen2. Anda mempelajari cara untuk:

  • Buat Aliran Data Gen2.
  • Ubah data.
  • Mengonfigurasi pengaturan tujuan untuk data yang diubah.
  • Jalankan dan jadwalkan alur data Anda.

Lanjutkan ke artikel berikutnya untuk mempelajari cara membuat alur data pertama Anda.