Bagikan melalui


Pelajari cara membuat tugas Salin di Data Factory untuk Microsoft Fabric

Tugas Salin di Data Factory mempermudah pemindahan data dari sumber Anda ke tujuan Anda tanpa membuat alur kerja. Anda dapat mengatur transfer data menggunakan pola bawaan sistem untuk salinan kelompok dan inkremental, serta menyalin sekali atau sesuai jadwal. Ikuti langkah-langkah dalam artikel ini untuk mulai menyalin data Anda baik dari database atau dari penyimpanan.

Buat pekerjaan penyalinan untuk memasukkan data dari database

Ikuti langkah-langkah ini untuk menyiapkan pekerjaan Salin yang memindahkan data dari database:

  1. Buat ruang kerja baru atau gunakan ruang kerja yang sudah ada.

  2. Pilih + Item Baru, pilih ikon pekerjaan salin, beri nama pekerjaan salin Anda, dan pilih Buat.

    Cuplikan layar memperlihatkan cara menavigasi ke halaman utama Data Factory dan membuat tugas Penyalinan baru.

  3. Pilih database untuk menyalin data. Dalam contoh ini, kita menggunakan Azure SQL DB.

    Cuplikan layar memperlihatkan tempat memilih sumber data untuk pekerjaan Salin.

  4. Untuk Azure SQL DB masukkan jalur server dan kredensial Anda. Anda dapat menyalin data dengan aman dalam lingkungan jaringan virtual menggunakan gateway jaringan lokal atau virtual. Untuk database lain, detail koneksi akan bervariasi.

    Cuplikan layar memperlihatkan tempat memasukkan kredensial.

  5. Pilih tabel dan kolom yang akan disalin . Gunakan kotak pencarian untuk mengidentifikasi tabel dan kolom tertentu yang ingin Anda salin.

    Cuplikan layar memperlihatkan tempat memilih tabel dan kolom untuk pekerjaan Salin.

  6. Pilih toko tujuan Anda. Dalam contoh ini, kita menggunakan Azure SQL DB lain.

    Cuplikan layar memperlihatkan tempat memilih toko tujuan untuk tugas salin.

  7. (Opsional) Pilih Perbarui metode untuk memutuskan bagaimana data ditulis ke tujuan Anda. Jika Anda memilih Gabungkan, pilih kolom Kunci yang mengidentifikasi setiap baris.

    Cuplikan layar memperlihatkan tempat memperbarui metode.

    Cuplikan layar memperlihatkan cara memperbarui metode.

  8. (Opsional) Konfigurasikan pemetaan tabel atau kolom untuk mengganti nama tabel atau kolom di tujuan, atau menerapkan konversi jenis data. Secara default, data disalin dengan nama tabel, nama kolom, dan jenis data yang sama dengan sumbernya.

    Cuplikan layar memperlihatkan tempat menentukan pemetaan tabel.

    Cuplikan layar memperlihatkan tempat menentukan pemetaan kolom.

  9. Pilih mode salin: Salinan data lengkap atau Salinan bertahap. Dalam contoh ini, kita menggunakan Salinan bertahap. Pilih kolom Inkremental untuk setiap tabel, untuk melacak baris mana yang telah berubah. Anda dapat menggunakan tombol pratinjau untuk menemukan kolom yang tepat. Untuk informasi selengkapnya tentang kolom tersebut, lihat: Kolom tambahan.

    Catatan

    Saat Anda memilih mode penyalinan bertahap, tugas Salinan awalnya memuat data secara penuh dan melakukan salinan bertahap di putaran berikutnya.

    Cuplikan layar memperlihatkan tempat untuk memilih mode salin pekerjaan.

  10. Tinjau ringkasan pekerjaan, pilih opsi eksekusi Anda untuk berjalan sekali atau sesuai jadwal, dan pilih Simpan + Jalankan.

    Cuplikan layar memperlihatkan tempat meninjau dan menyimpan tugas penyalinan yang baru dibuat.

  11. Pekerjaan Salin Anda akan segera dimulai, dan Anda dapat melacak status pekerjaan dari panel pemantauan sebaris yang memiliki informasi termasuk jumlah baris dan durasi salin untuk setiap tabel. Pelajari selengkapnya di Cara memantau pekerjaan penyalinan

    Tangkapan layar menunjukkan panel Pekerjaan Salin tempat Anda dapat memantau riwayat pelaksanaan.

  12. Anda dapat menjalankan pekerjaan Salin kapan pun Anda mau, meskipun diatur untuk berjalan sesuai jadwal. Cukup pilih tombol Jalankan kapan saja, dan pekerjaan penyalinan hanya menyalin data yang diubah sejak jalankan terakhir.

  13. Anda juga dapat mengedit pekerjaan Salin kapan saja, termasuk menambahkan atau menghapus tabel dan kolom yang akan disalin, mengonfigurasi jadwal, atau menyesuaikan pengaturan tingkat lanjut. Beberapa perubahan, seperti memperbarui kolom inkremental, akan mengatur ulang salinan bertahap untuk memulai dari beban penuh awal dalam eksekusi berikutnya.

    Cuplikan layar memperlihatkan bagaimana mengedit tugas penyalinan.

Buat tugas salin untuk mengimpor file dari penyimpanan

Ikuti langkah-langkah ini untuk menyiapkan pekerjaan Salin yang memindahkan data dari penyimpanan file:

  1. Buat ruang kerja baru atau gunakan ruang kerja yang sudah ada.

  2. Pilih + Item Baru, pilih ikon Salin Tugas, beri nama untuk tugas Salin Anda, dan pilih Buat.

    Cuplikan layar memperlihatkan cara menavigasi ke halaman utama Data Factory dan membuat tugas Penyalinan baru.

  3. Pilih penyimpanan data untuk menyalin data. Dalam contoh ini, kami menggunakan Azure Data Lake Storage Gen2.

    Cuplikan layar memperlihatkan tempat memilih sumber penyimpanan untuk pekerjaan Salin.

  4. Untuk menyambungkan ke Azure Data Lake Storage Gen2, masukkan url Storage dan Kredensial Anda untuk menyambungkan ke Azure Data Lake Storage Gen2. Untuk penyimpanan data lainnya, detail koneksi akan bervariasi. Anda dapat menyalin data dengan aman dalam lingkungan jaringan virtual menggunakan gateway jaringan lokal atau virtual.

    Cuplikan layar yang menunjukkan tempat untuk memasukkan kredensial penyimpanan.

  5. Pilih folder atau file yang akan disalin. Anda dapat memilih untuk menyalin seluruh folder dengan semua filenya, atau satu file.

    Petunjuk / Saran

    Skema agnostik (salinan biner) menyalin file ke penyimpanan data lain tanpa mengurai skema. Ini dapat secara signifikan meningkatkan efektivitas salinan.

    Cuplikan layar memperlihatkan tempat memilih folder untuk pekerjaan Salin.

  6. Pilih toko tujuan Anda. Dalam contoh ini, kami memilih Lakehouse.

    Cuplikan layar memperlihatkan tempat memilih tujuan penyimpanan untuk tugas penyalinan.

  7. Pilih jalur Folder di penyimpanan tujuan Anda. Pilih Pertahankan Hierarki untuk mempertahankan struktur folder yang sama dengan sumbernya, atau Ratakan Hierarki untuk menempatkan semua file dalam satu folder.

    Cuplikan layar memperlihatkan cara memilih folder tujuan.

  8. Pilih mode salin: Salinan data lengkap atau Salinan bertahap. Dalam contoh ini, kami menggunakan Salinan bertahap sehingga pekerjaan Salin akan menyalin semua file pada eksekusi pertama, lalu hanya menyalin file baru atau yang diperbarui dalam eksekusi berikutnya.

    Cuplikan layar memperlihatkan tempat memilih mode Salin pekerjaan untuk penyimpanan.

  9. Tinjau ringkasan pekerjaan, pilih opsi eksekusi Anda untuk berjalan sekali atau sesuai jadwal, dan pilih Simpan + Jalankan.

    Cuplikan layar memperlihatkan tempat meninjau dan menyimpan tugas penyalinan yang baru dibuat untuk penyimpanan.

  10. Pekerjaan Salin Anda akan segera dimulai, dan Anda dapat melacak status pekerjaan dari panel pemantauan langsung yang memuat informasi termasuk jumlah baris dan durasi salin untuk setiap tabel. Pelajari selengkapnya di Cara memantau pekerjaan penyalinan

    Cuplikan layar memperlihatkan panel Salin pekerjaan tempat Anda dapat memantau riwayat eksekusi untuk memindahkan data antar penyimpanan.

  11. Anda dapat menjalankan kembali pekerjaan Salin kapan pun Anda mau, meskipun diatur untuk berjalan sesuai jadwal. Cukup pilih tombol Jalankan kapan saja, dan Salin pekerjaan hanya menyalin data yang diubah sejak eksekusi terakhir.

  12. Anda juga dapat mengedit pekerjaan Salin kapan saja, termasuk mengonfigurasi jadwal, atau menyesuaikan pengaturan tingkat lanjut.

    Cuplikan layar memperlihatkan cara mengedit tugas Salin untuk penyimpanan.

Pembatasan yang diketahui

  • Saat ini, mode penyalinan bertahap hanya berfungsi dengan beberapa sumber. Untuk informasi lebih lanjut, lihat konektor yang didukung untuk Tugas Salin.
  • Penghapusan baris tidak dapat ditangkap dari penyimpanan sumber.
  • Saat menyalin file ke lokasi penyimpanan, file kosong akan dibuat di tujuan jika tidak ada data yang dimuat dari sumbernya.