Bagikan melalui


Mengambil data yang diubah dari Azure Data Lake Storage Gen2 ke Azure SQL Database dengan menggunakan sumber daya penangkapan data perubahan

BERLAKU UNTUK: Azure Data Factory Azure Synapse Analytics

Tip

Cobalah Data Factory di Microsoft Fabric, solusi analitik all-in-one untuk perusahaan. Microsoft Fabric mencakup semuanya mulai dari pergerakan data hingga ilmu data, analitik real time, kecerdasan bisnis, dan pelaporan. Pelajari cara memulai uji coba baru secara gratis!

Dalam artikel ini, Anda menggunakan antarmuka pengguna Azure Data Factory untuk membuat sumber daya pengambilan data perubahan (CDC). Sumber daya mengambil data yang diubah dari sumber Azure Data Lake Storage Gen2 dan menambahkannya ke Azure SQL Database secara real time.

Dalam artikel ini, Anda akan mempelajari cara:

  • Buat sumber daya CDC.
  • Memantau aktivitas CDC.

Anda dapat mengubah dan memperluas pola konfigurasi dalam artikel ini.

Prasyarat

Sebelum Memulai prosedur dalam artikel ini, pastikan Anda memiliki sumber daya ini:

  • Langganan Azure. Jika Anda tidak memiliki langganan Azure, buat akun Azure gratis.
  • Database SQL. Anda menggunakan Azure SQL Database sebagai penyimpanan data sumber. Jika Anda tidak memiliki database SQL, buat database di portal Azure.
  • Akun penyimpanan. Anda menggunakan Delta Lake yang disimpan di Azure Data Lake Storage Gen2 sebagai penyimpanan data target. Jika Anda tidak memiliki akun penyimpanan, lihat Membuat akun penyimpanan untuk langkah-langkah membuatnya.

Membuat artefak CDC

  1. Buka panel Penulis di pabrik data Anda. Di bawah Alur, artefak tingkat atas baru yang disebut Ubah Penangkapan Data (pratinjau) muncul.

    Cuplikan layar artefak tingkat atas baru untuk mengubah pengambilan data di panel Sumber Daya Pabrik.

  2. Arahkan mouse ke atas Ubah Pengambilan Data (pratinjau) hingga tiga titik muncul. Lalu pilih Ubah Tindakan Pengambilan Data (pratinjau).

    Cuplikan layar tombol untuk mengubah tindakan pengambilan data yang muncul di atas artefak tingkat atas baru.

  3. Pilih CDC Baru (pratinjau). Langkah ini membuka flyout untuk memulai proses terpandu.

    Cuplikan layar daftar tindakan ubah pengambilan data.

  4. Anda diminta untuk memberi nama sumber daya CDC Anda. Secara default, namanya adalah "adfcdc" dengan angka yang bertambah 1. Anda dapat mengganti nama default ini dengan nama yang Anda pilih.

    Cuplikan layar kotak teks untuk memperbarui nama sumber daya.

  5. Gunakan daftar dropdown untuk memilih sumber data Anda. Untuk artikel ini, pilih DelimitedText.

    Cuplikan layar flyout proses terpandu dengan opsi sumber dalam daftar dropdown.

  6. Anda diminta untuk memilih layanan tertaut. Buat layanan tertaut baru atau pilih layanan yang sudah ada.

    Cuplikan layar kotak untuk memilih atau membuat layanan tertaut.

  7. Gunakan area Pengaturan sumber untuk mengatur konfigurasi sumber tingkat lanjut secara opsional, termasuk pemisah kolom dan baris.

    Cuplikan layar pengaturan sumber tingkat lanjut untuk mengatur pemisah.

    Jika Anda tidak mengedit pengaturan sumber ini secara manual, pengaturan tersebut diatur ke default.

  8. Gunakan tombol Telusuri untuk memilih folder data sumber Anda.

    Cuplikan layar ikon folder untuk menelusuri jalur folder.

  9. Setelah Anda memilih jalur folder, pilih Lanjutkan untuk mengatur target data Anda.

    Cuplikan layar tombol Lanjutkan dalam proses terpandu untuk memilih target data.

    Anda dapat memilih untuk menambahkan beberapa folder sumber dengan menggunakan tombol plus (+). Sumber lain juga harus menggunakan layanan tertaut yang sama dengan yang sudah Anda pilih.

  10. Pilih nilai Jenis target dengan menggunakan daftar dropdown. Untuk artikel ini, pilih Azure SQL Database.

    Cuplikan layar menu dropdown dari semua jenis target data.

  11. Anda diminta untuk memilih layanan tertaut. Buat layanan tertaut baru atau pilih layanan yang sudah ada.

    Cuplikan layar kotak untuk memilih atau membuat layanan tertaut ke target data Anda.

  12. Untuk Tabel target, Anda bisa membuat tabel target baru atau memilih tabel yang sudah ada:

    • Untuk membuat tabel target, pilih tab Entitas baru, lalu pilih Edit tabel baru.

      Cuplikan layar tab untuk membuat tabel baru untuk target Anda.

    • Untuk memilih tabel yang sudah ada, pilih tab Entitas yang sudah ada, lalu gunakan kotak centang untuk memilih tabel. Gunakan tombol Pratinjau untuk menampilkan data tabel Anda.

      Cuplikan layar tab untuk memilih tabel untuk target Anda.

    Jika tabel yang ada di target memiliki nama yang cocok, tabel tersebut dipilih secara default di bawah Entitas yang ada. Jika tidak, tabel baru dengan nama yang cocok dibuat di bawah Entitas baru. Selain itu, Anda dapat mengedit tabel baru dengan menggunakan tombol Edit tabel baru.

  13. Anda dapat menggunakan kotak centang untuk memilih beberapa tabel target dari database SQL Anda. Setelah Anda selesai memilih tabel target, pilih Lanjutkan.

    Cuplikan layar tombol Lanjutkan dalam proses terpandu untuk melanjutkan ke langkah berikutnya.

  14. Tab baru untuk menangkap data perubahan muncul. Tab ini adalah studio CDC, tempat Anda dapat mengonfigurasi sumber daya baru Anda.

    Cuplikan layar studio penangkapan data perubahan.

    Pemetaan baru secara otomatis dibuat untuk Anda. Anda dapat memperbarui pilihan Tabel Sumber dan Tabel Target untuk pemetaan Anda dengan menggunakan daftar dropdown.

    Cuplikan layar pemetaan sumber ke target di studio penangkapan data perubahan.

  15. Setelah Anda memilih tabel, kolomnya dipetakan secara default dengan pengalih Peta otomatis diaktifkan. Peta otomatis secara otomatis memetakan kolom berdasarkan nama di sink, mengambil perubahan kolom baru saat skema sumber berkembang, dan mengalirkan informasi ini ke jenis sink yang didukung.

    Jika Anda ingin menggunakan Peta otomatis dan tidak mengubah pemetaan kolom apa pun, langsung buka langkah 18.

    Cuplikan layar pengalih untuk pemetaan otomatis diaktifkan.

    Jika Anda ingin mengaktifkan pemetaan kolom, pilih pemetaan dan nonaktifkan tombol Peta otomatis. Kemudian, pilih tombol Pemetaan kolom untuk melihat pemetaan.

    Cuplikan layar pemetaan pilihan, tombol untuk pemetaan otomatis dinonaktifkan, dan tombol untuk pemetaan kolom.

    Anda dapat beralih kembali ke pemetaan otomatis kapan saja dengan mengaktifkan tombol Peta otomatis.

  16. Menampilkan pemetaan kolom Anda. Gunakan daftar dropdown untuk mengedit pemetaan kolom Anda untuk metode Pemetaan, kolom Sumber, dan kolom Target.

    Cuplikan layar halaman untuk mengedit pemetaan kolom.

    Dari halaman ini, Anda dapat:

    • Tambahkan lebih banyak pemetaan kolom dengan menggunakan tombol Pemetaan baru. Gunakan daftar dropdown untuk membuat pilihan untuk metode Pemetaan, kolom Sumber, dan kolom Target.
    • Pilih kolom Kunci jika Anda ingin melacak operasi penghapusan untuk jenis sink yang didukung.
    • Pilih tombol Refresh di bawah Pratinjau data untuk memvisualisasikan tampilan data pada target.

    Cuplikan layar tombol untuk menambahkan pemetaan kolom, daftar dropdown untuk metode pemetaan, kolom Kunci, dan tombol Refresh.

  17. Saat pemetaan Anda selesai, pilih tombol panah untuk kembali ke kanvas CDC utama.

    Cuplikan layar tombol untuk kembali ke halaman pemetaan tabel.

  18. Anda dapat menambahkan lebih banyak pemetaan sumber ke target dalam satu artefak CDC. Gunakan tombol Edit untuk menambahkan lebih banyak sumber data dan target. Kemudian, pilih Pemetaan baru dan gunakan daftar drop-down untuk mengatur sumber dan target baru. Anda dapat mengaktifkan atau menonaktifkan Peta otomatis untuk setiap pemetaan ini secara independen.

    Cuplikan layar tombol untuk menambahkan sumber baru dan tombol untuk mengatur pemetaan sumber ke target baru.

  19. Setelah pemetaan Anda selesai, atur latensi CDC Anda dengan menggunakan tombol Atur Latensi .

    Cuplikan layar tombol Atur Latensi di bagian atas kanvas.

  20. Pilih latensi CDC Anda, lalu pilih Terapkan untuk membuat perubahan.

    Secara default, latensi diatur ke 15 menit. Contoh dalam artikel ini menggunakan opsi Real-time untuk latensi. Latensi real time terus mengambil perubahan dalam data sumber Anda dalam interval kurang dari 1 menit.

    Untuk latensi lain (misalnya, jika Anda memilih 15 menit), pengambilan data perubahan Anda akan memproses data sumber Anda dan mengambil data yang diubah sejak waktu terakhir diproses.

    Cuplikan layar opsi untuk mengatur latensi.

    Catatan

    Jika dukungan diperluas ke integrasi data streaming (Azure Event Hubs dan sumber data Kafka), latensi akan diatur ke Real-time secara default.

  21. Setelah Selesai mengonfigurasi CDC, pilih Terbitkan semua untuk menerbitkan perubahan Anda.

    Cuplikan layar tombol terbitkan di bagian atas kanvas.

    Catatan

    Jika Anda tidak menerbitkan perubahan, Anda tidak akan dapat memulai sumber daya CDC Anda. Tombol Mulai di langkah berikutnya tidak akan tersedia.

  22. Pilih Mulai untuk mulai menjalankan pengambilan data perubahan Anda.

    Cuplikan layar tombol Mulai di bagian atas kanvas.

Memantau penangkapan data perubahan Anda

  1. Buka panel Monitor dengan menggunakan salah satu metode ini:

    • Pilih Pantau di portal Azure.

      Cuplikan layar tombol Monitor di portal Azure.

    • Pilih ikon pemantauan dari perancang CDC.

      Cuplikan layar ikon pemantauan di bagian atas kanvas CDC.

  2. Pilih Ubah Penangkapan Data (pratinjau) untuk melihat sumber daya CDC Anda.

    Cuplikan layar tombol Ubah Pengambilan Data.

    Panel Ubah Penangkapan Data memperlihatkan informasi Sumber, Target, Status, dan Terakhir diproses untuk pengambilan data perubahan Anda.

    Cuplikan layar gambaran umum halaman pemantauan tangkapan data perubahan.

  3. Pilih nama CDC Anda untuk melihat detail selengkapnya. Anda dapat melihat berapa banyak perubahan (menyisipkan, memperbarui, atau menghapus) yang dibaca dan ditulis, bersama dengan informasi diagnostik lainnya.

    Cuplikan layar pemantauan terperinci dari pengambilan data perubahan yang dipilih.

    Jika Anda menyiapkan beberapa pemetaan dalam pengambilan data perubahan, setiap pemetaan muncul sebagai warna yang berbeda. Pilih bilah untuk melihat detail tertentu untuk setiap pemetaan, atau gunakan informasi diagnostik di bagian bawah panel.

    Cuplikan layar informasi pemantauan terperinci untuk pengambilan data perubahan dengan beberapa pemetaan sumber ke target.

    Cuplikan layar perincian terperinci dari setiap pemetaan dalam artefak pengambilan data perubahan.