Bagikan melalui


Transformasi Pencarian

Berlaku untuk: SQL Server SSIS Integration Runtime di Azure Data Factory

Transformasi Pencarian melakukan pencarian dengan menggabungkan data dalam kolom input dengan kolom dalam himpunan data referensi. Anda menggunakan pencarian untuk mengakses informasi tambahan dalam tabel terkait yang didasarkan pada nilai dalam kolom umum.

Himpunan data referensi bisa berupa file cache, tabel atau tampilan yang sudah ada, tabel baru, atau hasil kueri SQL. Transformasi Pencarian menggunakan manajer koneksi OLE DB atau manajer koneksi Cache untuk menyambungkan ke himpunan data referensi. Untuk informasi selengkapnya, lihat Pengelola Sambungan OLE DB dan Pengelola Sambungan Cache

Anda dapat mengonfigurasi transformasi Pencarian dengan cara berikut:

  • Pilih pengelola koneksi yang ingin Anda gunakan. Jika Anda ingin menyambungkan ke database, pilih manajer koneksi OLE DB. Jika Anda ingin menyambungkan ke file cache, pilih manajer koneksi Cache.

  • Tentukan tabel atau tampilan yang berisi himpunan data referensi.

  • Buat himpunan data referensi dengan menentukan pernyataan SQL.

  • Tentukan gabungan antara input dan himpunan data referensi.

  • Tambahkan kolom dari himpunan data referensi ke output transformasi Pencarian.

  • Konfigurasikan opsi penembolokan.

Transformasi Pencarian mendukung penyedia database berikut untuk manajer koneksi OLE DB:

  • SQL Server

  • Oracle

  • DB2

Transformasi Pencarian mencoba melakukan equi-join antara nilai dalam input transformasi dan nilai dalam himpunan data referensi. (Equi-join berarti bahwa setiap baris dalam input transformasi harus cocok dengan setidaknya satu baris dari himpunan data referensi.) Jika equi-join tidak dimungkinkan, transformasi Pencarian mengambil salah satu tindakan berikut:

  • Jika tidak ada entri yang cocok dalam himpunan data referensi, tidak ada gabungan yang terjadi. Secara default, transformasi Pencarian memperlakukan baris tanpa entri yang cocok sebagai kesalahan. Namun, Anda dapat mengonfigurasi transformasi Pencarian untuk mengalihkan baris tersebut ke output yang tidak cocok.

  • Jika ada beberapa kecocokan dalam tabel referensi, transformasi Pencarian hanya mengembalikan kecocokan pertama yang dikembalikan oleh kueri pencarian. Jika beberapa kecocokan ditemukan, transformasi Pencarian menghasilkan kesalahan atau peringatan hanya ketika transformasi telah dikonfigurasi untuk memuat semua himpunan data referensi ke dalam cache. Dalam hal ini, transformasi Pencarian menghasilkan peringatan ketika transformasi mendeteksi beberapa kecocokan saat transformasi mengisi cache.

Gabungan dapat menjadi gabungan komposit, yang berarti Anda dapat menggabungkan beberapa kolom dalam input transformasi ke kolom dalam himpunan data referensi. Transformasi mendukung gabungan kolom dengan jenis data apa pun, kecuali untuk DT_R4, DT_R8, DT_TEXT, DT_NTEXT, atau DT_IMAGE. Untuk informasi selengkapnya, lihat Jenis Data Integration Services.

Biasanya, nilai dari himpunan data referensi ditambahkan ke output transformasi. Misalnya, transformasi Pencarian dapat mengekstrak nama produk dari tabel menggunakan nilai dari kolom input, lalu menambahkan nama produk ke output transformasi. Nilai dari tabel referensi dapat menggantikan nilai kolom atau dapat ditambahkan ke kolom baru.

Pencarian yang dilakukan oleh transformasi Pencarian peka huruf besar/kecil. Untuk menghindari kegagalan pencarian yang disebabkan oleh perbedaan kasus dalam data, pertama-tama gunakan transformasi Peta Karakter untuk mengonversi data menjadi huruf besar atau kecil. Kemudian, sertakan fungsi UPPER atau LOWER dalam pernyataan SQL yang menghasilkan tabel referensi. Untuk informasi selengkapnya, lihat Transformasi Peta Karakter, UPPER (Transact-SQL), dan LOWER (Transact-SQL).

Transformasi Pencarian memiliki input dan output berikut:

  • Masukan.

  • Mencocokkan output. Output kecocokan menangani baris dalam input transformasi yang cocok dengan setidaknya satu entri dalam himpunan data referensi.

  • Tidak ada output Kecocokan. Output tidak cocok menangani baris dalam input yang tidak cocok dengan setidaknya satu entri dalam himpunan data referensi. Jika Anda mengonfigurasi transformasi Pencarian untuk memperlakukan baris tanpa mencocokkan entri sebagai kesalahan, baris dialihkan ke output kesalahan. Jika tidak, transformasi akan mengalihkan baris tersebut ke output yang tidak cocok.

  • Output kesalahan.

Penembolokan Himpunan Data Referensi

Cache dalam memori menyimpan himpunan data referensi dan menyimpan tabel hash yang mengindeks data. Cache tetap dalam memori sampai eksekusi paket selesai. Anda dapat mempertahankan cache ke file cache (.caw).

Ketika Anda mempertahankan cache ke file, sistem memuat cache lebih cepat. Ini meningkatkan performa transformasi Pencarian dan paket. Ingat, bahwa ketika Anda menggunakan file cache, Anda bekerja dengan data yang tidak terkini seperti data dalam database.

Berikut ini adalah manfaat tambahan dari mempertahankan cache ke file:

  • Bagikan file cache di antara beberapa paket. Untuk informasi selengkapnya, lihatMenerapkan Transformasi Pencarian dalam Mode Singgahan Penuh Menggunakan Pengelola Sambungan Cache.

  • Sebarkan file cache dengan paket. Anda kemudian dapat menggunakan data di beberapa komputer. Untuk informasi selengkapnya, lihat Membuat dan Menyebarkan Cache untuk Transformasi Pencarian.

  • Gunakan sumber File Mentah untuk membaca data dari file cache. Anda kemudian dapat menggunakan komponen aliran data lain untuk mengubah atau memindahkan data. Untuk informasi selengkapnya, lihat Sumber File Mentah.

    Catatan

    Manajer koneksi Cache tidak mendukung file cache yang dibuat atau dimodifikasi dengan menggunakan tujuan File Mentah.

  • Lakukan operasi dan atur atribut pada file cache dengan menggunakan tugas Sistem File. Untuk informasi selengkapnya, lihat dan Tugas Sistem File.

Berikut ini adalah opsi penembolokan:

  • Himpunan data referensi dihasilkan dengan menggunakan tabel, tampilan, atau kueri SQL dan dimuat ke dalam cache, sebelum transformasi Pencarian berjalan. Anda menggunakan pengelola koneksi OLE DB untuk mengakses himpunan data.

    Opsi penembolokan ini kompatibel dengan opsi penembolokan lengkap yang tersedia untuk transformasi Pencarian di SQL Server 2005 Integration Services (SSIS).

  • Himpunan data referensi dihasilkan dari sumber data yang terhubung dalam aliran data atau dari file cache, dan dimuat ke dalam cache sebelum transformasi Pencarian berjalan. Anda menggunakan manajer koneksi Cache, dan, secara opsional, transformasi Cache, untuk mengakses himpunan data. Untuk informasi selengkapnya, lihat Cache Pengelola Sambungan dan Cache Transform.

  • Himpunan data referensi dihasilkan dengan menggunakan tabel, tampilan, atau kueri SQL selama eksekusi transformasi Pencarian. Baris dengan entri yang cocok dalam himpunan data referensi dan baris tanpa entri yang cocok dalam himpunan data dimuat ke dalam cache.

    Ketika ukuran memori cache terlampaui, transformasi Pencarian secara otomatis menghapus baris yang paling jarang digunakan dari cache.

    Opsi penembolokan ini kompatibel dengan opsi penembolokan parsial yang tersedia untuk transformasi Pencarian di SQL Server 2005 Integration Services (SSIS).

  • Himpunan data referensi dihasilkan dengan menggunakan tabel, tampilan, atau kueri SQL selama eksekusi transformasi Pencarian. Tidak ada data yang di-cache.

    Opsi penembolokan ini kompatibel dengan opsi tanpa penembolokan yang tersedia untuk transformasi Pencarian di SQL Server 2005 Integration Services (SSIS).

Integration Services dan SQL Server berbeda dalam cara mereka membandingkan string. Jika transformasi Pencarian dikonfigurasi untuk memuat himpunan data referensi ke dalam cache sebelum transformasi Pencarian berjalan, Layanan Integrasi melakukan perbandingan pencarian di cache. Jika tidak, operasi pencarian menggunakan pernyataan SQL berparameter dan SQL Server melakukan perbandingan pencarian. Ini berarti bahwa transformasi Pencarian mungkin mengembalikan jumlah kecocokan yang berbeda dari tabel pencarian yang sama tergantung pada jenis cache.

Anda dapat mengatur properti melalui SSIS Designer atau secara terprogram. Untuk detail selengkapnya, lihat topik berikut ini.

Editor Transformasi Pencarian (Halaman Umum)

Gunakan halaman Umum kotak dialog Editor Transformasi Pencarian untuk memilih mode cache, pilih jenis koneksi, dan tentukan cara menangani baris tanpa entri yang cocok.

Opsi

Catatan

Output kecocokan dapat berbeda tergantung pada apakah Mode cache penuh, Tidak ada mode cache, atau Mode cache parsial yang digunakan:

  • Dalam mode Cache penuh, database dikueri sekali selama fase pra-eksekusi aliran data dan seluruh set referensi ditarik ke dalam memori. Ini berarti bahwa kita akan mengandalkan aturan pencocokan mesin SSIS yang peka huruf besar/kecil, sensitif dengan spasi berikutnya dan sensitif dengan presisi dan skala numerik.
  • Namun, ketika Tidak ada cache atau mode cache parsial yang digunakan, tidak ada penembolokan yang dilakukan selama fase pra-eksekusi. Ini berarti kita akan menggunakan aturan pencocokan database sumber. Misalnya, jika sumber adalah database SQL Server dan jika kolase kolom tidak peka huruf besar/kecil, maka aturan yang cocok juga harus tidak peka huruf besar/kecil.

Cache penuh
Buat dan muat himpunan data referensi ke dalam cache sebelum transformasi Pencarian dijalankan.

Cache parsial
Hasilkan himpunan data referensi selama eksekusi transformasi Pencarian. Muat baris dengan entri yang cocok dalam himpunan data referensi dan baris tanpa entri yang cocok dalam himpunan data ke dalam cache.

Tidak ada cache
Hasilkan himpunan data referensi selama eksekusi transformasi Pencarian. Tidak ada data yang dimuat ke dalam cache.

Manajer koneksi cache
Konfigurasikan transformasi Pencarian untuk menggunakan manajer koneksi Cache. Opsi ini hanya tersedia jika opsi Cache lengkap dipilih.

Manajer koneksi OLE DB
Konfigurasikan transformasi Pencarian untuk menggunakan manajer koneksi OLE DB.

Tentukan cara menangani baris tanpa entri yang cocok
Pilih opsi untuk menangani baris yang tidak cocok dengan setidaknya satu entri dalam himpunan data referensi.

Saat Anda memilih Alihkan baris ke output yang tidak cocok, baris dialihkan ke output yang tidak cocok dan tidak ditangani sebagai kesalahan. Opsi Kesalahan pada halaman Output Kesalahan dari kotak dialog Editor Transformasi Pencarian tidak tersedia.

Saat Anda memilih opsi lain dalam kotak daftar Tentukan cara menangani baris tanpa entri yang cocok, baris ditangani sebagai kesalahan. Opsi Kesalahan pada halaman Output Kesalahan tersedia.

Sumber Daya Eksternal

Entri blog, Mode cache pencarian di blogs.msdn.com

Editor Transformasi Pencarian (Halaman Koneksi)

Gunakan halaman Koneksi dari kotak dialog Editor Transformasi Pencarian untuk memilih manajer koneksi. Jika Anda memilih pengelola koneksi OLE DB, Anda juga memilih kueri, tabel, atau tampilan untuk menghasilkan himpunan data referensi.

Opsi

Opsi berikut ini tersedia saat Anda memilih Cache penuh dan manajer koneksi Cache pada halaman Umum kotak dialog Editor Transformasi Pencarian.

Manajer koneksi cache
Pilih manajer koneksi Cache yang sudah ada dari daftar, atau buat koneksi baru dengan mengklik Baru.

Baru
Buat koneksi baru dengan menggunakan kotak dialog Cache Pengelola Sambungan Editor.

Opsi berikut ini tersedia saat Anda memilih Cache penuh, Cache parsial, atau Tidak ada cache, dan manajer koneksi OLE DB, pada halaman Umum kotak dialog Editor Transformasi Pencarian.

Manajer koneksi OLE DB
Pilih manajer koneksi OLE DB yang sudah ada dari daftar, atau buat koneksi baru dengan mengklik Baru.

Baru
Buat koneksi baru dengan menggunakan kotak dialog Konfigurasikan Pengelola Sambungan OLE DB.

Menggunakan tabel atau tampilan
Pilih tabel atau tampilan yang sudah ada dari daftar, atau buat tabel baru dengan mengklik Baru.

Catatan

Jika Anda menentukan pernyataan SQL pada halaman Tingkat Lanjut dari Editor Transformasi Pencarian, pernyataan SQL tersebut mengambil alih dan mengganti nama tabel yang dipilih di sini. Untuk informasi selengkapnya, lihat Editor Transformasi Pencarian (Halaman Tingkat Lanjut).

Baru
Buat tabel baru dengan menggunakan kotak dialog Buat Tabel .

Menggunakan hasil kueri SQL
Pilih opsi ini untuk menelusuri kueri yang sudah ada sebelumnya, menyusun kueri baru, memeriksa sintaks kueri, dan mempratinjau hasil kueri.

Membuat kueri
Buat pernyataan Transact-SQL untuk dijalankan dengan menggunakan Query Builder, alat grafis yang digunakan untuk membuat kueri dengan menelusuri data.

Ramban
Gunakan opsi ini untuk menelusuri kueri yang sudah ada sebelumnya yang disimpan sebagai file.

Mengurai Kueri
Periksa sintaks kueri.

Pratinjau
Pratinjau hasil dengan menggunakan kotak dialog Pratinjau Hasil Kueri. Opsi ini menampilkan hingga 200 baris.

Sumber Daya Eksternal

Entri blog, Mode cache pencarian di blogs.msdn.com

Editor Transformasi Pencarian (Halaman Kolom)

Gunakan halaman Kolom dari kotak dialog Editor Transformasi Pencarian untuk menentukan gabungan antara tabel sumber dan tabel referensi, dan untuk memilih kolom pencarian dari tabel referensi.

Opsi

Kolom Input yang Tersedia
Lihat daftar kolom input yang tersedia. Kolom input adalah kolom dalam aliran data dari sumber yang tersambung. Kolom input dan kolom pencarian harus memiliki jenis data yang cocok.

Gunakan operasi seret dan letakkan untuk memetakan kolom input yang tersedia ke kolom pencarian.

Anda juga dapat memetakan kolom input ke kolom pencarian menggunakan keyboard, dengan menyoroti kolom di tabel Kolom Input yang Tersedia, menekan tombol Aplikasi, lalu mengklik Edit Pemetaan.

Kolom Pencarian yang Tersedia
Menampilkan daftar kolom pencarian. Kolom pencarian adalah kolom dalam tabel referensi tempat Anda ingin mencari nilai yang cocok dengan kolom input.

Gunakan operasi seret dan letakkan untuk memetakan kolom pencarian yang tersedia ke kolom input.

Gunakan kotak centang untuk memilih kolom pencarian dalam tabel referensi untuk melakukan operasi pencarian.

Anda juga dapat memetakan kolom pencarian ke kolom input menggunakan keyboard, dengan menyoroti kolom di tabel Kolom Pencarian yang Tersedia, menekan tombol Aplikasi, lalu mengklik Edit Pemetaan.

Kolom Pencarian
Menampilkan kolom pencarian yang dipilih. Pilihan tercermin dalam pilihan kotak centang dalam tabel Kolom Pencarian yang Tersedia.

Operasi Pencarian
Pilih operasi pencarian dari daftar untuk dilakukan pada kolom pencarian.

Output Alias
Ketik alias untuk output untuk setiap kolom pencarian. Defaultnya adalah nama kolom pencarian; namun, Anda dapat memilih nama deskriptif yang unik.

Editor Transformasi Pencarian (Halaman Tingkat Lanjut)

Gunakan halaman Tingkat Lanjut dari kotak dialog Editor Transformasi Pencarian untuk mengonfigurasi penembolokan parsial dan mengubah pernyataan SQL untuk transformasi Pencarian.

Opsi

Ukuran cache (32-bit)
Sesuaikan ukuran cache (dalam megabyte) untuk komputer 32-bit. Nilai defaultnya adalah 5 megabyte.

Ukuran cache (64-bit)
Sesuaikan ukuran cache (dalam megabyte) untuk komputer 64-bit. Nilai defaultnya adalah 5 megabyte.

Aktifkan cache untuk baris tanpa entri yang cocok
Baris singgahan tanpa entri yang cocok dalam himpunan data referensi.

Alokasi dari cache
Tentukan persentase cache yang akan dialokasikan untuk baris tanpa entri yang cocok dalam himpunan data referensi.

Mengubah pernyataan SQL
Ubah pernyataan SQL yang digunakan untuk menghasilkan himpunan data referensi.

Catatan

Pernyataan SQL opsional yang Anda tentukan di halaman ini mengambil alih dan mengganti nama tabel yang Anda tentukan di halaman Koneksi Editor Transformasi Pencarian. Untuk informasi selengkapnya, lihat Editor Transformasi Pencarian (Halaman Koneksi).

Atur Parameter
Petakan kolom input ke parameter dengan menggunakan kotak dialog Atur Parameter Kueri.

Sumber Daya Eksternal

Entri blog, Mode cache pencarian di blogs.msdn.com

Lihat Juga

Transformasi Pencarian Fuzzy
Transformasi Pencarian Istilah
Aliran Data
Transformasi Layanan Integrasi