Acara
31 Mar, 23 - 2 Apr, 23
Peristiwa pembelajaran Fabric, Power BI, dan SQL terbesar. 31 Maret – 2 April. Gunakan kode FABINSIDER untuk menyimpan $400.
Daftar hari iniBrowser ini sudah tidak didukung.
Mutakhirkan ke Microsoft Edge untuk memanfaatkan fitur, pembaruan keamanan, dan dukungan teknis terkini.
BERLAKU UNTUK: Azure Data Factory
Azure Synapse Analytics
Tip
Cobalah Data Factory di Microsoft Fabric, solusi analitik all-in-one untuk perusahaan. Microsoft Fabric mencakup semuanya mulai dari pergerakan data hingga ilmu data, analitik real time, kecerdasan bisnis, dan pelaporan. Pelajari cara memulai uji coba baru secara gratis!
Artikel ini menjelaskan perubahan pengambilan data (CDC) di Azure Data Factory.
Untuk mempelajari selengkapnya, lihat Gambaran umum Azure Data Factory atau Gambaran umum Azure Synapse.
Saat Anda melakukan integrasi data dan proses ETL di cloud, pekerjaan Anda dapat berkinerja lebih baik dan lebih efektif ketika Anda hanya membaca data sumber yang berubah sejak terakhir kali alur berjalan, daripada selalu mengkueri seluruh himpunan data pada setiap eksekusi. ADF menyediakan beberapa cara mudah untuk mendapatkan data delta hanya dari eksekusi terakhir.
Cara term mudah dan tercepat untuk memulai di pabrik data dengan CDC adalah melalui tingkat pabrik Ubah sumber daya Tangkapan Data. Dari perancang alur utama, pilih Baru di bawah Sumber Daya Pabrik untuk membuat Change Data Capture baru. Sumber daya pabrik CDC menyediakan pengalaman panduan konfigurasi di mana Anda dapat memilih sumber dan tujuan Anda, menerapkan transformasi opsional, lalu memilih mulai untuk memulai penangkapan data Anda. Dengan sumber daya CDC, Anda tidak perlu merancang alur atau aktivitas aliran data. Anda juga hanya ditagih untuk empat inti aliran data Tujuan Umum saat data Anda sedang diproses. Anda dapat mengatur latensi pilihan, yang digunakan ADF untuk bangun dan mencari data yang diubah. Pemeriksaan awal itu adalah satu-satunya waktu Anda ditagih. Sumber daya CDC tingkat atas juga merupakan metode ADF untuk menjalankan proses Anda terus menerus. Alur di ADF hanya batch, tetapi sumber daya CDC dapat berjalan terus menerus.
Aliran data pemetaan ADF dapat secara otomatis mendeteksi dan mengekstrak data yang diubah, termasuk baris yang disisipkan, diperbarui, dan dihapus dari database sumber. Tidak ada tanda waktu atau kolom ID yang diperlukan untuk mengidentifikasi perubahan karena menggunakan teknologi penangkapan data perubahan asli dalam database. Dengan menautkan transformasi sumber dan referensi transformasi sink ke himpunan data database dalam aliran data pemetaan, Anda dapat melihat perubahan terjadi pada database sumber untuk diterapkan secara otomatis ke database target, sehingga Anda dapat dengan mudah menyinkronkan data di antara dua tabel. Anda juga dapat menambahkan transformasi apa pun di antara logika bisnis apa pun untuk memproses data delta. Saat menentukan tujuan data sink, Anda dapat mengatur operasi sisipkan, perbarui, upsert, dan hapus di sink Anda tanpa perlu transformasi Alter Row karena ADF dapat mendeteksi pembuat baris secara otomatis.
Konektor yang didukung
Baris yang baru diperbarui atau file yang diperbarui dapat secara otomatis terdeteksi dan diekstrak oleh aliran data pemetaan ADF dari penyimpanan sumber. Saat Anda ingin mendapatkan data delta dari database, kolom inkremental diperlukan untuk mengidentifikasi perubahan. Saat Anda ingin memuat file baru atau file yang diperbarui hanya dari penyimpanan penyimpanan, aliran data pemetaan ADF hanya berfungsi melalui waktu modifikasi terakhir file.
Konektor yang didukung
Anda selalu dapat membangun alur ekstraksi data delta Anda sendiri untuk semua penyimpanan data yang didukung ADF termasuk menggunakan aktivitas pencarian untuk mendapatkan nilai marka air yang disimpan dalam tabel kontrol eksternal, aktivitas salin, atau aktivitas aliran data pemetaan untuk mengkueri data delta terhadap tanda waktu atau kolom ID, dan aktivitas SP untuk menulis nilai marka air baru kembali ke tabel kontrol eksternal Anda untuk eksekusi berikutnya. Ketika Anda ingin memuat file baru hanya dari penyimpanan penyimpanan, Anda dapat menghapus file setiap kali setelah berhasil dipindahkan ke tujuan, atau menggunakan folder atau nama file yang dipartisi waktu atau waktu terakhir dimodifikasi untuk mengidentifikasi file baru.
Mengubah pengambilan data dari database
Mengubah pengambilan file dari penyimpanan berbasis file
Saat Anda mengaktifkan penangkapan data perubahan asli atau opsi ekstraksi bertambah bertahap otomatis dalam aliran data pemetaan ADF, ADF membantu Anda mengelola titik pemeriksaan untuk memastikan setiap aktivitas berjalan secara otomatis hanya membaca data sumber yang telah berubah sejak terakhir kali alur berjalan. Secara default, titik pemeriksaan digabungkan dengan alur dan nama aktivitas Anda. Jika Anda mengubah nama alur atau nama aktivitas Anda, titik pemeriksaan akan diatur ulang, yang mengarahkan Anda untuk memulai dari awal atau mendapatkan perubahan mulai sekarang di eksekusi berikutnya. Jika Anda ingin mengubah nama alur atau nama aktivitas tetapi masih menyimpan titik pemeriksaan untuk mendapatkan data yang diubah dari eksekusi terakhir secara otomatis, gunakan kunci Titik Pemeriksaan Anda sendiri dalam aktivitas aliran data untuk mencapainya. Aturan penamaan kunci titik pemeriksaan Anda sendiri sama dengan layanan tertaut, himpunan data, alur, dan aliran data.
Saat Anda men-debug alur, fitur ini berfungsi sama. Titik pemeriksaan diatur ulang saat Anda me-refresh browser selama eksekusi debug. Setelah puas dengan hasil alur dari eksekusi debug, Anda dapat melanjutkan untuk menerbitkan dan memicu alur. Pada saat Anda pertama kali memicu alur yang diterbitkan, maka secara otomatis dimulai ulang dari awal atau mendapat perubahan mulai sekarang.
Di bagian pemantauan, Anda selalu memiliki kesempatan untuk menjalankan kembali alur. Saat Anda melakukannya, data yang diubah selalu diambil dari titik pemeriksaan sebelumnya dari eksekusi alur yang Anda pilih.
Berikut ini adalah tutorial untuk memulai perubahan pengambilan data di Azure Data Factory dan Azure Synapse Analytics.
Berikut ini adalah templat untuk menggunakan tangkapan data perubahan di Azure Data Factory dan Azure Synapse Analytics.
Acara
31 Mar, 23 - 2 Apr, 23
Peristiwa pembelajaran Fabric, Power BI, dan SQL terbesar. 31 Maret – 2 April. Gunakan kode FABINSIDER untuk menyimpan $400.
Daftar hari iniPelatihan
Modul
Pelacakan dan sinkronisasi data dengan Azure SQL Database - Training
Modul pelacakan data Azure SQL yang mencakup pelacakan perubahan data. Modul ini menjelajahi alat seperti mengubah penangkapan data (CDC) dan pelacakan perubahan.
Sertifikasi
Microsoft Certified: Azure Data Engineer Associate - Certifications
Menunjukkan pemahaman tentang tugas rekayasa data umum untuk menerapkan dan mengelola beban kerja rekayasa data di Microsoft Azure, menggunakan sejumlah layanan Azure.