Bagikan melalui


Membandingkan Data String

Berlaku untuk: SQL Server SSIS Integration Runtime di Azure Data Factory

Perbandingan string adalah bagian penting dari banyak transformasi yang dilakukan oleh Integration Services, dan perbandingan string juga digunakan dalam evaluasi ekspresi dalam variabel dan ekspresi properti. Misalnya, transformasi Sortir membandingkan nilai dalam himpunan data untuk mengurutkan data dalam urutan naik atau menurun.

Mengonfigurasi Transformasi untuk Perbandingan String

Transformasi Sortir, Agregat, Pengelompokan Fuzzy, dan Pencarian Fuzzy dapat disesuaikan untuk mengubah cara string dibandingkan di tingkat kolom. Misalnya, Anda dapat menentukan bahwa perbandingan mengabaikan kasus, yang berarti bahwa karakter huruf besar dan huruf kecil diperlakukan sebagai karakter yang sama.

Transformasi berikut menggunakan ekspresi yang dapat menyertakan perbandingan string.

  • Transformasi Pemisahan Bersyariah dapat menggunakan perbandingan string dalam ekspresi untuk menentukan output mana yang akan dikirimi baris data. Untuk informasi selengkapnya, lihat Transformasi Pemisahan Bersyar.

  • Transformasi Kolom Turunan dapat menggunakan perbandingan string dalam ekspresi untuk menghasilkan nilai kolom baru. Untuk informasi selengkapnya, lihat Transformasi Kolom Turunan.

Variabel, pemetaan variabel, dan batasan prioritas juga menggunakan ekspresi, yang dapat mencakup perbandingan string. Untuk informasi selengkapnya tentang ekspresi, lihat Ekspresi Integration Services (SSIS).

Pemrosesan selama Perbandingan String

Bergantung pada data dan konfigurasi transformasi, pemrosesan berikut dapat terjadi selama perbandingan data string:

  • Mengonversi data ke Unicode. Jika data sumber belum Unicode, data secara otomatis dikonversi ke Unicode sebelum perbandingan terjadi.

  • Menggunakan lokal untuk menerapkan aturan khusus lokal untuk menginterpretasikan tanggal, waktu, data desimal, dan urutan pengurutan.

  • Menerapkan opsi perbandingan di tingkat kolom untuk mengubah sensitivitas perbandingan.

Mengonversi Data String ke Unicode

Bergantung pada operasi yang dilakukan transformasi dan konfigurasi transformasi, data string dapat dikonversi ke jenis data DT_WSTR, yang merupakan representasi Unicode dari karakter string.

Data string yang memiliki jenis data DT_STR dikonversi ke Unicode menggunakan halaman kode kolom. Integration Services mendukung halaman kode di tingkat kolom, dan setiap kolom dapat dikonversi dengan menggunakan halaman kode yang berbeda.

Dalam kebanyakan kasus, Integration Services dapat mengidentifikasi halaman kode yang benar dari sumber data. Misalnya, di SQL Server Anda dapat mengatur kolase di tingkat database dan kolom. Halaman kode berasal dari kolase SQL Server, yang dapat berupa Kolase Windows atau SQL.

Jika Layanan Integrasi menyediakan halaman kode yang tidak terduga, atau jika paket mengakses sumber data dengan menggunakan penyedia yang tidak menyediakan informasi yang memadai untuk menentukan halaman kode yang benar, Anda dapat menentukan halaman kode default di sumber OLE DB dan tujuan OLE DB. Halaman kode default digunakan alih-alih halaman kode yang disediakan Integration Services.

File tidak memiliki halaman kode. Sebagai gantinya, File Datar dan manajer koneksi Beberapa File Datar yang digunakan paket untuk menyambungkan ke data file menyertakan properti untuk menentukan halaman kode file. Halaman kode hanya dapat diatur pada tingkat file, bukan di tingkat kolom.

Pengaturan Lokal

Layanan Integrasi tidak menggunakan halaman kode untuk menyimpulkan aturan khusus lokal untuk mengurutkan data atau menginterpretasikan data tanggal, waktu, dan desimal. Sebagai gantinya, transformasi membaca lokal yang diatur oleh properti LocaleId pada komponen aliran data, tugas Aliran Data, kontainer, atau paket. Secara default, lokal transformasi diwarisi dari tugas Aliran Datanya, yang pada gilirannya mewarisi dari paket. Jika tugas Aliran Data berada dalam kontainer seperti kontainer For Loop, tugas tersebut mewarisi lokalnya dari kontainer.

Anda juga dapat menentukan lokal untuk manajer koneksi File Datar dan manajer koneksi Beberapa File Datar.

Mengatur Opsi Perbandingan

Lokal menyediakan aturan dasar untuk membandingkan data string. Misalnya, lokal menentukan posisi pengurutan setiap huruf dalam alfabet. Namun, aturan ini mungkin tidak cukup untuk perbandingan yang dilakukan beberapa transformasi, dan Layanan Integrasi mendukung serangkaian opsi perbandingan tingkat lanjut yang melampaui aturan perbandingan lokal. Opsi perbandingan ini diatur pada tingkat kolom. Misalnya, salah satu opsi perbandingan memungkinkan Anda mengabaikan karakter nonspacing. Efek dari opsi ini adalah mengabaikan diakritik seperti aksen, yang membuat "a" dan "á" identik untuk tujuan perbandingan.

Tabel berikut ini menjelaskan opsi perbandingan dan gaya pengurutan.

Opsi perbandingan Deskripsi
Abaikan huruf besar/kecil Menentukan apakah perbandingan membedakan antara huruf besar dan huruf kecil. Jika opsi ini diatur, perbandingan string mengabaikan kasus. Misalnya, "ABC" menjadi sama dengan "abc".
Abaikan jenis kana Menentukan apakah perbandingan membedakan antara dua jenis karakter kana Jepang: hiragana dan katakana. Jika opsi ini diatur, perbandingan string mengabaikan jenis kana.
Abaikan lebar karakter Menentukan apakah perbandingan membedakan antara karakter byte tunggal dan karakter yang sama ketika direpresentasikan sebagai karakter byte ganda. Jika opsi ini diatur, perbandingan string memperlakukan representasi byte tunggal dan byte ganda dengan karakter yang sama seperti yang identik.
Abaikan karakter non-pengiriman Menentukan apakah perbandingan membedakan antara karakter penspasian dan diakritik. Jika opsi ini diatur, perbandingan mengabaikan diakritik. Misalnya, "Ã¥" sama dengan "a".
Abaikan simbol Menentukan apakah perbandingan membedakan antara karakter huruf dan simbol seperti karakter spasi putih, tanda baca, simbol mata uang, dan simbol matematika. Jika opsi ini diatur, perbandingan string mengabaikan simbol. Misalnya, "New York" menjadi sama dengan "New York" dan "*ABC" sama dengan "ABC".
Urutkan tanda baca sebagai simbol Menentukan apakah perbandingan mengurutkan semua simbol tanda baca, kecuali tanda hubung dan apostrof, sebelum karakter alfanumerik. Misalnya, jika opsi ini diatur, ". ABC" mengurutkan sebelum "ABC".

Transformasi Sortir, Agregat, Pengelompokan Fuzzy, dan Pencarian Fuzzy menyertakan opsi ini untuk membandingkan data.

Bendera perbandingan FullySensitive ditampilkan dalam kotak dialog Editor Lanjutan untuk transformasi Pengelompokan Fuzzy dan Pencarian Fuzzy. Memilih bendera perbandingan FullySensitive berarti semua opsi perbandingan berlaku.

Lihat Juga

Jenis Data Integration Services
Penguraian Cepat
Penguraian Standar