Bagikan melalui


Mengonfigurasi MongoDB dalam aktivitas salin

Artikel ini menguraikan cara menggunakan aktivitas salin dalam alur data untuk menyalin data dari dan ke MongoDB.

Konfigurasi yang didukung

Untuk konfigurasi setiap tab di bawah aktivitas salin, buka bagian berikut.

Umum

Lihat panduan Pengaturan umum untuk mengonfigurasi tab Pengaturan umum.

Sumber

Buka tab Sumber untuk mengonfigurasi sumber aktivitas salin Anda. Lihat konten berikut untuk konfigurasi terperinci.

Cuplikan layar memperlihatkan tab sumber dan daftar properti.

Properti berikut diperlukan:

  • Koneksi: Pilih koneksi MongoDB dari daftar koneksi. Jika tidak ada koneksi, buat koneksi MongoDB baru dengan memilih Baru.
  • Database: Pilih database Anda dari daftar drop-down.
  • Nama koleksi: Tentukan nama koleksi dalam database MongoDB. Anda dapat memilih koleksi dari daftar drop-down atau memilih Edit untuk memasukkannya secara manual.
  • Versi: Versi yang Anda tentukan. Merekomendasikan peningkatan ke versi terbaru untuk memanfaatkan penyempurnaan terbaru. Untuk mempelajari perbedaan antara berbagai versi, buka bagian ini.

Di bawah Tingkat Lanjut, Anda bisa menentukan bidang berikut ini:

  • Filter: Menentukan filter pilihan menggunakan operator kueri. Untuk mengembalikan semua dokumen dalam koleksi, hilangkan parameter ini atau berikan dokumen kosong ({}).
  • Metode kursor: Pilih + Baru untuk menentukan cara kueri yang mendasar dijalankan. Cara menjalankan kueri adalah:
    • project: Menentukan bidang yang akan dikembalikan dalam dokumen untuk proyeksi. Untuk mengembalikan semua bidang dalam dokumen yang cocok, hilangkan parameter ini.
    • sortir: Menentukan urutan kueri mengembalikan dokumen yang cocok. Buka cursor.sort() untuk informasi selengkapnya.
    • batas: Menentukan jumlah maksimum dokumen yang dikembalikan server. Buka kursor.limit() untuk informasi selengkapnya.
    • skip: Menentukan jumlah dokumen yang akan dilewati dan dari tempat MongoDB mulai mengembalikan hasil. Buka kursor.skip() untuk informasi selengkapnya.
  • Ukuran batch: Menentukan jumlah dokumen yang akan dikembalikan di setiap batch respons dari instans MongoDB. Dalam kebanyakan kasus, memodifikasi ukuran batch tidak akan memengaruhi pengguna atau aplikasi.
  • Kolom tambahan: Tambahkan kolom data tambahan untuk menyimpan jalur relatif atau nilai statis file sumber. Ekspresi didukung untuk pilihan terakhir.

Tujuan

Buka tab Tujuan untuk mengonfigurasi tujuan aktivitas salin Anda. Lihat konten berikut untuk konfigurasi terperinci.

Cuplikan layar memperlihatkan tab tujuan dan daftar properti.

Properti berikut diperlukan:

  • Jenis penyimpanan data: Pilih Eksternal .
  • Koneksi: Pilih koneksi MongoDB dari daftar koneksi. Jika tidak ada koneksi, buat koneksi MongoDB baru dengan memilih Baru.
  • Database: Pilih database Anda dari daftar drop-down.
  • Nama koleksi: Tentukan nama koleksi dalam database MongoDB. Anda dapat memilih koleksi dari daftar drop-down atau memilih Edit untuk memasukkannya secara manual.

Di bawah Tingkat Lanjut, Anda bisa menentukan bidang berikut ini:

  • Perilaku tulis: Menjelaskan cara menulis data ke MongoDB. Nilai yang diizinkan: Sisipkan dan Upsert.

    Perilaku Upsert adalah mengganti dokumen jika dokumen dengan dokumen yang sama _id sudah ada; jika tidak, sisipkan dokumen.

    Nota

    Layanan secara otomatis menghasilkan _id untuk dokumen jika _id tidak ditentukan baik dalam dokumen asli atau pemetaan kolom. Ini berarti Anda harus memastikan bahwa, agar Upsert berfungsi seperti yang diharapkan, dokumen Anda memiliki ID.

  • Menulis batas waktu batch: Tentukan waktu tunggu untuk operasi penyisipan batch selesai sebelum waktu habis. Nilai yang diizinkan adalah rentang waktu.

  • Ukuran batch tulis: Properti ini mengontrol ukuran dokumen yang akan ditulis di setiap batch. Anda dapat mencoba meningkatkan nilai untuk meningkatkan performa dan mengurangi nilai jika ukuran dokumen Anda besar.

Pemetaan

Untuk Konfigurasi tab Pemetaan , lihat Mengonfigurasi pemetaan Anda di bawah tab pemetaan. Pemetaan tidak didukung ketika sumber dan tujuan adalah data hierarkis.

Pemetaan tipe data untuk MongoDB

Saat menyalin data dari MongoDB, pemetaan berikut digunakan dari jenis data MongoDB ke jenis data sementara yang digunakan oleh layanan secara internal.

Tipe data MongoDB Jenis data layanan sementara (untuk versi 1.1) Jenis data layanan sementara (untuk versi 1.0)
Tanggal Tanggal dan Waktu string
IDObjek string string
Desimal128 string string
Penanda Waktu 32 bit paling signifikan -> DateTime
32 bit yang paling tidak signifikan -> Int32
Int32
string string string
Array Array Array
Dobel Dobel string
Int32 Int32 string
Int64 Int64 string
Boolean (tipe data yang hanya memiliki dua nilai: true atau false) Boolean (tipe data yang hanya memiliki dua nilai: true atau false) Boolean (tipe data yang hanya memiliki dua nilai: true atau false)
NullData Nol Nol
Dokumen Kamus Kamus
javaScript string string
Regex string string
minKey string Int32
maxKey string Int32
Biner GUID (ketika SubJenis adalah "04" )
string
string

Pengaturan

Untuk konfigurasi tab Pengaturan, buka tab Pengaturan kemudian konfigurasikan pengaturan lain di bawah tab pengaturan.

Perbedaan antara versi MongoDB

Tabel di bawah ini memperlihatkan perbedaan fitur antara berbagai versi.

Versi 1.1 Versi 1.0
Pemetaan berikut digunakan dari jenis data MongoDB ke jenis data layanan sementara.

Tanggal -> TanggalWaktu
TimeStamp -> 32 bit paling signifikan -> DateTime; 32 bit yang paling tidak signifikan -> Int32
Ganda -> Ganda
Int32 -> Int32
Int64 -> Int64
minKey -> String
maxKey -> String
Biner -> GUID (saat SubType adalah "04") / String
Pemetaan berikut digunakan dari jenis data MongoDB ke jenis data layanan sementara.

Tanggal -> String
Tanda Waktu -> Int32
Ganda -> String
Int32 -> String
Int64 -> String
minKey -> Int32
maxKey -> Int32
Biner -> String

Ringkasan tabel

Tabel berikut berisi informasi selengkapnya tentang aktivitas salin di MongoDB.

Informasi sumber

Nama Deskripsi Nilai Diperlukan Properti skrip JSON
jenis penyimpanan data Jenis penyimpanan data Anda. Eksternal Ya /
Koneksi Koneksi Anda dengan gudang data sumber. < koneksi MongoDB Anda > Ya koneksi
Basis Data Database Anda yang Anda gunakan sebagai sumber. < database Anda > Ya basis data
Nama koleksi Nama koleksi dalam database MongoDB. < koleksi Anda > Ya koleksi
Versi Versi yang Anda tentukan. • 1.1
• 1.0
Ya versi:
• 1.1
• 1.0
Saringan Filter pilihan menggunakan operator kueri. Untuk mengembalikan semua dokumen dalam koleksi, hilangkan parameter ini atau berikan dokumen kosong ({}). < filter pilihan Anda > Tidak. penyaring
Metode kursor Cara eksekusi kueri dasar. proyek
sortir
batas
lewati
Tidak. cursorMethods:
•proyek
• urutkan
• batas
• lewati
Ukuran batch Jumlah dokumen yang akan dikembalikan di setiap batch respons dari instans MongoDB. < ukuran batch tulis Anda >
(defaultnya adalah 100)
Tidak. Ukuran Batch
Kolom tambahan Tambahkan kolom data tambahan untuk menyimpan jalur relatif file sumber atau nilai statis. Ekspresi didukung untuk pilihan terakhir. •Nama
•Nilai
Tidak. kolomTambahan:
•Nama
• nilai

Informasi tujuan

Nama Deskripsi Nilai Diperlukan Properti skrip JSON
jenis penyimpanan data Jenis penyimpanan data Anda. Eksternal Ya /
Koneksi Koneksi Anda ke penyimpanan data tujuan. < koneksi MongoDB Anda > Ya koneksi
Database Database Anda yang Anda gunakan sebagai tujuan. < database Anda > Ya basis data
Nama koleksi Nama koleksi dalam database MongoDB. < koleksi Anda > Ya koleksi
Tulis perilaku Menjelaskan cara menulis data ke MongoDB. Nilai yang diizinkan: Sisipkan dan Upsert.

Perilaku Upsert adalah mengganti dokumen jika dokumen dengan dokumen yang sama _id sudah ada; jika tidak, sisipkan dokumen.

Catatan: Layanan secara otomatis menghasilkan _id untuk dokumen jika _id tidak ditentukan baik dalam dokumen asli atau dengan pemetaan kolom. Ini berarti Anda harus memastikan bahwa, agar Upsert berfungsi seperti yang diharapkan, dokumen Anda memiliki ID.
Sisipkan (default)
Upsert
Tidak. tulisPerilaku:
•memasukkan
• sisip perbarui
batas waktu penulisan batch Waktu tunggu operasi penyisipan batch untuk selesai sebelum batas waktu kedaluwarsa. rentang waktu
(defaultnya adalah 00:30:00 - 30 menit)
Tidak. writeBatchTimeout
Setel ukuran batch Mengontrol ukuran dokumen yang akan ditulis di setiap batch. Anda dapat mencoba meningkatkan nilai ini untuk meningkatkan performa dan mengurangi nilai jika ukuran dokumen Anda besar. < ukuran batch tulis Anda > Tidak. writeBatchSize