Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Şunlar için geçerlidir:SQL ServerAzure Data Factory'de SSIS Integration Runtime
Benzer Arama dönüşümü, verileri standartlaştırma, verileri düzeltme ve eksik değerler sağlama gibi veri temizleme görevlerini gerçekleştirir.
Not
Performans ve bellek sınırlamaları da dahil olmak üzere Benzer Arama dönüşümü hakkında daha ayrıntılı bilgi için SQL Server Integration Services 2005'de Belirsiz Arama ve Benzer Gruplandırma
Bulanık Arama dönüşümü, bulanık eşleştirme kullanımında Arama dönüşümünden farklıdır. Arama dönüşümü, başvuru tablosunda eşleşen kayıtları bulmak için bir eş birleşim kullanır. En az bir eşleşen kaydı olan kayıtları döndürür ve eşleşen kaydı olmayan kayıtları döndürür. Buna karşılık, Bulanık Arama dönüşümü, başvuru tablosunda bir veya daha fazla yakın eşleşmeyi döndürmek için bulanık eşleme kullanır.
Bulanık Arama dönüşümü, genellikle bir paket veri akışında bir Arama dönüşümünün sonrasında gelir. İlk olarak, Arama dönüşümü tam eşleşme bulmaya çalışır. Başarısız olursa, Fuzzy Lookup (Benzer Arama) dönüşümü referans tablosundan yakın eşleşmeler sağlar.
Dönüşümün, giriş verilerini temizlemek ve genişletmek için kullanılan değerleri içeren bir başvuru veri kaynağına erişmesi gerekir. Başvuru veri kaynağı SQL Server veritabanındaki bir tablo olmalıdır. Giriş sütunundaki değerle başvuru tablosundaki değer arasındaki eşleşme tam eşleşme veya benzer bir eşleşme olabilir. Ancak dönüşümün gerçekleşmesi için, bulanık eşleştirme amacıyla en az bir sütun eşleşmesinin yapılandırılması gerekir. Yalnızca tam eşleştirme kullanmak istiyorsanız, bunun yerine Arama dönüştürmesini kullanın.
Bu dönüşümün bir girişi ve bir çıkışı vardır.
Belirsiz eşleştirmede yalnızca DT_WSTR ve DT_STR veri türlerine sahip giriş sütunları kullanılabilir. Tam eşleştirme, DT_TEXT, DT_NTEXTve DT_IMAGEdışında herhangi bir DTS veri türünü kullanabilir. Daha fazla bilgi için bkz. Integration Services Veri Türleri. Giriş ve başvuru tablosu arasındaki birleştirmeye katılan sütunların uyumlu veri türleri olmalıdır. Örneğin, DTS DT_WSTR veri türüne sahip bir sütunu SQL Server nvarchar veri türüne sahip bir sütuna birleştirmek geçerlidir, ancak DT_WSTR veri türüne sahip bir sütunu int veri türüne sahip bir sütuna birleştirmek geçersizdir.
En fazla bellek miktarını, satır karşılaştırma algoritmasını ve dönüştürmenin kullandığı dizinlerin ve başvuru tablolarının önbelleğe alınmasını belirterek bu dönüşümü özelleştirebilirsiniz.
Bulanık Arama dönüştürmesinin kullandığı bellek miktarı MaxMemoryUsage özel özelliği ayarlanarak yapılandırılabilir. Megabayt (MB) sayısını belirtebilir veya dönüştürmenin gereksinimlerine ve kullanılabilir fiziksel belleğe göre dinamik bir bellek miktarı kullanmasını sağlayan 0 değerini kullanabilirsiniz. MaxMemoryUsage özel özelliği, paket yüklendiğinde bir özellik ifadesi tarafından güncelleştirilebilir. Daha fazla bilgi için bkz. Integration Services (SSIS) İfadeleri, Paketlerde Özellik İfadelerini Kullanmave Dönüştürme Özel Özellikleri.
Belirsiz Eşleştirme Davranışını Denetleme
Benzer Arama dönüşümü, gerçekleştirdiği aramayı özelleştirmeye yönelik üç özellik içerir: giriş satırı başına döndürülecek en fazla eşleşme sayısı, belirteç sınırlayıcıları ve benzerlik eşikleri.
Dönüştürme, belirtilen eşleşme sayısına kadar sıfır veya daha fazla eşleşme döndürür. En fazla eşleşme sayısı belirtilmesi, dönüşümün en fazla eşleşme sayısını döndüreceğini garanti etmez; yalnızca dönüşümün en fazla bu sayıda eşleşme döndürdüğünü garanti eder. En fazla eşleşme sayısını 1'den büyük bir değere ayarlarsanız, dönüştürmenin çıktısı arama başına birden fazla satır içerebilir ve bazı satırlar yinelenen olabilir.
Dönüştürme, verileri belirteç haline getirmek için kullanılan varsayılan sınırlayıcılar kümesi sağlar, ancak verilerinizin gereksinimlerine uygun belirteç sınırlayıcıları ekleyebilirsiniz. Sınırlayıcılar özelliği varsayılan sınırlayıcıları içerir. Belirteç oluşturma, verilerin içindeki birbiriyle karşılaştırılan birimleri tanımladığından önemlidir.
Benzerlik eşikleri bileşen ve birleştirme düzeylerinde ayarlanabilir. Birleştirme düzeyi benzerlik eşiği, yalnızca dönüşüm giriş ve başvuru tablosu sütunları arasında bulanık eşleşme gerçekleştirdiğinde kullanılabilir. Benzerlik aralığı 0 ile 1 arasındadır. Eşik 1'e ne kadar yakınsa, satırların ve sütunların yineleme olarak nitelenebilmesi için o kadar benzer olması gerekir. Bileşen ve birleştirme düzeylerinde MinSimilarity özelliğini ayarlayarak benzerlik eşiğini belirtirsiniz. Bileşen düzeyinde belirtilen benzerliği karşılamak için, tüm satırların, bileşen düzeyinde belirtilen benzerlik eşiğinden büyük veya buna eşit tüm eşleşmeler arasında bir benzerliği olmalıdır. Diğer bir ifadeyle, satır veya birleştirme düzeyindeki eşleşmeler eşit olarak yakın olmadığı sürece bileşen düzeyinde çok yakın bir eşleşme belirtemezsiniz.
Her eşleşme bir benzerlik puanı ve bir güvenilirlik puanı içerir. Benzerlik puanı, giriş kaydı ile Bulanık Arama dönüşümünün başvuru tablosundan döndürdüğü kayıt arasındaki metinsel benzerliğin matematiksel bir ölçüsüdür. Güvenilirlik puanı, başvuru tablosunda bulunan eşleşmeler arasında belirli bir değerin en iyi eşleşme olma olasılığının ölçüsüdür. Bir kayda atanan güvenilirlik puanı, döndürülen diğer eşleşen kayıtlara bağlıdır. Örneğin, St. ve Saint eşleşmesi, diğer eşleşmelerden bağımsız olarak düşük bir benzerlik puanı döndürür.
Saint döndürülen tek eşleşme ise, güvenilirlik puanı yüksektir. Başvuru tablosunda hem Saint hem de St. görünüyorsa, St. güveni yüksek ve Saint güveni düşüktür. Ancak, yüksek benzerlik yüksek güvenilirlik anlamına gelmeyebilir. Örneğin, Bölüm 4
Benzerlik puanı, 0 ile 1 arasında bir ondalık değerle temsil edilir; burada benzerlik puanı 1, giriş sütunundaki değerle başvuru tablosundaki değer arasında tam eşleşme anlamına gelir. 0 ile 1 arasında bir ondalık değer de olan güvenilirlik puanı, eşleşmedeki güveni gösterir. Kullanılabilir eşleşme bulunmazsa, satıra benzerlik ve güvenilirlik puanları 0 atanır ve başvuru tablosundan kopyalanan çıkış sütunları null değerler içerir.
Bazen Fuzzy Lookup, referans tablosunda uygun eşleşmeleri bulamayabilir. Aramada kullanılan giriş değeri tek, kısa bir sözcükse bu durum oluşabilir. Örneğin,
Dönüştürme çıkış sütunları geçiş sütunları olarak işaretlenmiş giriş sütunlarını, arama tablosundaki seçili sütunları ve aşağıdaki ek sütunları içerir:
_Similarity, giriş ve başvuru sütunlarındaki değerler arasındaki benzerliği açıklayan bir sütun.
_Confidence, eşleşmenin kalitesini açıklayan bir sütun.
Dönüştürme, benzer eşleşen algoritmanın kullandığı geçici tabloları oluşturmak için SQL Server veritabanı bağlantısını kullanır.
Benzeşik Arama Dönüşümünü Çalıştırmak
Paket dönüştürmeyi ilk kez çalıştırdığında, dönüştürme başvuru tablosunu kopyalar, yeni tabloya tamsayı veri türüne sahip bir anahtar ekler ve anahtar sütununda bir dizin oluşturur. Ardından dönüştürme, başvuru tablosunun kopyası üzerinde eşleşme dizini olarak adlandırılan bir dizin oluşturur. Eşleştirme dizini, dönüştürme giriş sütunlarındaki değerleri belirteç haline getirmenin sonuçlarını depolar ve dönüştürme, arama işleminde belirteçleri kullanır. Eşleşme dizini, SQL Server veritabanındaki bir tablodur.
Paket yeniden çalıştırıldığında, dönüştürme mevcut bir eşleşme dizinini kullanabilir veya yeni bir dizin oluşturabilir. Başvuru tablosu statikse, paket potansiyel olarak pahalı olan yinelenen veri temizleme oturumları için dizini yeniden yapılandırma sürecinden kaçınabilir. Mevcut bir dizini kullanmayı seçerseniz, paket ilk kez çalıştırıldığında dizin oluşturulur. Birden çok Benzer Arama dönüştürmesi aynı başvuru tablosunu kullanıyorsa, hepsi aynı dizini kullanabilir. Dizini yeniden kullanmak için arama işlemlerinin aynı olması gerekir; arama aynı sütunları kullanmalıdır. Dizini adlandırabilir ve dizini kaydeden SQL Server veritabanına bağlantıyı seçebilirsiniz.
Dönüştürme, eşleşme dizinini kaydederse, eşleşme dizini otomatik olarak korunabilir. Bu, başvuru tablosundaki bir kaydın her güncelleştirilişinde eşleşme dizininin de güncelleştirildiğini gösterir. Paket çalıştırıldığında dizinin yeniden oluşturulması gerekmediğinden, eşleşme dizininin korunması işlem zamanından tasarruf edebilir. Dönüştürmenin eşleşme dizinini nasıl yöneteceğini belirtebilirsiniz.
Aşağıdaki tabloda eşleşme dizini seçenekleri açıklanmaktadır.
| Seçenek | Açıklama |
|---|---|
| YeniIndeksOlusturVeKorunmasınıSağla | Yeni bir dizin oluşturun, kaydedin ve bakımını sağlayın. Dönüşüm, başvuru tablosunu ve dizin tablosunu senkronize tutmak için başvuru tablosuna tetikleyiciler yükler. |
| GenerateAndPersistNewIndex |
Yeni bir dizin oluşturun ve kaydedin, ancak bakımını yapmayın. |
| YeniEndeksOluştur | Yeni bir dizin oluşturun, ancak kaydetmeyin. |
| ReuseExistingIndex | Mevcut bir dizini yeniden kullanın. |
Eşleştirme Dizini Tablosunun Bakımı
GenerateAndMaintainNewIndex seçeneği, eşleşme dizin tablosu ve başvuru tablosunu senkronize etmek için başvuru tablosuna tetikleyiciler yükler. Yüklü tetikleyiciyi kaldırmanız gerekiyorsa, sp_FuzzyLookupTableMaintenanceUnInstall saklı yordamı çalıştırmanız ve MatchIndexName özelliğinde belirtilen adı giriş parametresi değeri olarak sağlamanız gerekir.
sp_FuzzyLookupTableMaintenanceUnInstall saklı yordamını çalıştırmadan önce kullanılan eşleşme dizini tablosunu silmemelisiniz. Eşleşme dizini tablosu silinirse, başvuru tablosundaki tetikleyiciler doğru yürütülmeyecektir. Referans tablosundaki sonraki tüm güncellemeler, referans tablosundaki tetikleyicileri manuel olarak kaldırana kadar başarısız olur.
SQL TRUNCATE TABLE komutu DELETE tetikleyicilerini çağırmaz. Başvuru tablosunda TRUNCATE TABLE komutu kullanılıyorsa, başvuru tablosu ve eşleşme dizini artık eşitlenmez ve Benzer Arama dönüşümü başarısız olur. Eşleşme dizini tablosunu koruyan tetikleyiciler başvuru tablosunda yüklü olsa da, TRUNCATE TABLE komutu yerine SQL DELETE komutunu kullanmanız gerekir.
Not
Depolanan dizini koru 'yı Başvuru Tablosu sekmesinde Benzer Arama Dönüştürme Düzenleyicisiüzerinde seçtiğinizde, dönüştürme, dizini korumak için yönetilen saklı yordamları kullanır. Bu yönetilen saklı yordamlar, SQL Server'da ortak dil çalışma zamanı (CLR) tümleştirme özelliğini kullanır. Varsayılan olarak, SQL Server'da CLR tümleştirmesi etkinleştirilmez. Depolanan dizin koru işlevini
Depolanan dizini koru seçeneği CLR tümleştirmesi gerektirdiğinden, bu özellik yalnızca CLR tümleştirmesinin etkinleştirildiği SQL Server örneğinde bir başvuru tablosu seçtiğinizde çalışır.
Satır Karşılaştırması
Benzer Arama dönüştürmesini yapılandırırken, dönüştürmenin başvuru tablosunda eşleşen kayıtları bulmak için kullandığı karşılaştırma algoritmasını belirtebilirsiniz. Kapsamlı özelliğini Trueolarak ayarlarsanız, dönüştürme, girişteki her satırı referans tablosundaki her satırla karşılaştırır. Bu karşılaştırma algoritması daha doğru sonuçlar üretebilir, ancak başvuru tablosunun satır sayısı küçük olmadığı sürece dönüştürmenin daha yavaş gerçekleştirilmesi olasıdır. Ayrıntılı özelliği Trueolarak ayarlanırsa, başvuru tablosunun tamamı belleğe yüklenir. Performans sorunlarını önlemek için, yalnızca paket geliştirme sırasında Exhaustive özelliğinin True olarak ayarlanması önerilir.
Exhaustive özelliği Falseolarak ayarlanırsa, Bulanık Arama dönüşümü, yalnızca giriş kaydıyla en az bir ortak dizinlenmiş belirteç veya alt diziyi (bu alt dizeye q-gramdenir) içeren eşleşmeleri döndürür. Aramaların verimliliğini en üst düzeye çıkarmak için, benzer arama dönüştürmesinin eşleşmeleri bulmak için kullandığı ters dizin yapısında tablodaki her satırdaki belirteçlerin yalnızca bir alt kümesi dizine eklenir. Giriş veri kümesi küçük olduğunda, dizin tablosunda ortak belirteç bulunmayan eşleşmelerin gözden kaçmaması için True olarak ayarlayabilirsiniz.
Dizinleri ve Başvuru Tablolarını Önbelleğe Alma
Benzer Arama dönüştürmesini yapılandırırken, dönüştürmenin çalışmasını yapmadan önce dizinin ve başvuru tablosunun bellekte kısmen önbelleğe alınıp alınmayacağını belirleyebilirsiniz. WarmCaches özelliğini true
Geçici Tablolar ve Dizinler
Çalışma zamanında Bulanık Arama dönüşümü, dönüşümün bağlandığı SQL Server veritabanında tablo ve dizinler gibi geçici nesneler oluşturur. Bu geçici tabloların ve dizinlerin boyutu, başvuru tablosundaki satır ve belirteç sayısı ile Benzer Arama dönüştürmesinin oluşturduğu belirteç sayısıyla orantılıdır; bu nedenle, büyük olasılıkla önemli miktarda disk alanı tüketebilirler. Dönüştürme, bu geçici tabloları da sorgular. Bu nedenle, özellikle üretim sunucusunda sınırlı disk alanı varsa, Benzer Arama dönüştürmesini SQL Server veritabanının üretim dışı bir örneğine bağlamayı düşünmelisiniz.
Kullandığı tablolar ve dizinler yerel bilgisayarda bulunuyorsa bu dönüşümün performansı iyileştirebilir. Benzer Arama dönüştürmesinin kullandığı başvuru tablosu üretim sunucusundaysa, tabloyu üretim dışı bir sunucuya kopyalamayı ve kopyaya erişmek için Benzer Arama dönüştürmesini yapılandırmayı düşünmelisiniz. Bunu yaparak, arama sorgularının üretim sunucusundaki kaynakları kullanmasını engelleyebilirsiniz. Buna ek olarak, Benzer Arama dönüşümü eşleşme dizinini korursa, MatchIndexOptions GenerateAndMaintainNewIndexolarak ayarlanırsa dönüştürme, veri temizleme işlemi boyunca başvuru tablosunu kilitleyebilir ve diğer kullanıcıların ve uygulamaların tabloya erişmesini engelleyebilir.
Bulanık Arama Dönüşümünü Yapılandırma
SSIS Tasarımcısı aracılığıyla veya program aracılığıyla özellikleri ayarlayabilirsiniz.
Gelişmiş Düzenleyici iletişim kutusunda veya program aracılığıyla ayarlayabileceğiniz özellikler hakkında daha fazla bilgi için aşağıdaki konulardan birine tıklayın:
Ortak Özellikler
İlgili Görevler
Veri akışı bileşeninin özelliklerini ayarlama hakkında ayrıntılı bilgi için bkz. Veri Akışı Bileşeninin Özelliklerini Ayarlama.
Bulanık Arama Dönüştürme Düzenleyicisi (Başvuru Tablosu Sekmesi)
Arama için kullanılacak kaynak tabloyu ve dizini belirtmek için Benzer Arama Dönüştürme Düzenleyicisi iletişim kutusunun Başvuru Tablosu sekmesini kullanın. Başvuru veri kaynağı SQL Server veritabanındaki bir tablo olmalıdır.
Not
Fuzzy Lookup dönüşümü, başvuru tablosunun geçici bir kopyasını oluşturur. Aşağıda açıklanan dizinler, bu çalışma tablosunda sıradan bir SQL Server dizini değil özel bir tablo kullanılarak oluşturulur. Depolanan dizini koruseçeneğini belirlemediğiniz sürece dönüştürme, var olan kaynak tabloları değiştirmez. Bu durumda, başvuru tablosunda çalışma tablosunu ve arama dizini tablosunu başvuru tablosundaki değişikliklere göre güncelleştiren bir tetikleyici oluşturur.
Not
Kapsamlı ve MaxMemoryUsage özellikleri, Benzer Arama dönüştürmesi için Benzer Arama Dönüştürme Düzenleyicisi'te mevcut değildir, ancak Gelişmiş Düzenleyicikullanılarak ayarlanabilir. Ayrıca, "MaxOutputMatchesPerInput"
Seçenekler
OLE DB bağlantı yöneticisi
Listeden mevcut bir OLE DB bağlantı yöneticisini seçin veya Yeni
yeni
OLE DB Bağlantı Yöneticisini Yapılandır iletişim kutusunu kullanarak yeni bir bağlantı oluşturun.
Yeni dizin oluşturma
Dönüşümün arama için kullanılacak yeni bir dizin oluşturması gerektiğini belirtin.
Başvuru tablosu adı
Başvuru (arama) tablosu olarak kullanılacak mevcut tabloyu seçin.
Yeni dizini sakla
Yeni arama dizinini kaydetmek istiyorsanız bu seçeneği belirleyin.
yeni dizin adı
Yeni arama dizinini kaydetmeyi seçtiyseniz, dizin için açıklayıcı bir ad yazın.
Depolanan dizini koruyun
Yeni arama dizinini kaydetmeyi seçtiyseniz, SQL Server'ın da dizini korumasını isteyip istemediğinizi belirtin.
Not
Fuzzy Lookup Transformation Editörü'nin Başvuru Tablosu sekmesinde Depolanan dizin'i koru'yu seçtiğinizde, dönüşüm, dizini korumak için yönetilen saklı yordamları kullanır. Bu yönetilen saklı yordamlar, SQL Server'da ortak dil çalışma zamanı (CLR) tümleştirme özelliğini kullanır. Varsayılan olarak, SQL Server'da CLR tümleştirmesi etkinleştirilmez. Depolanan dizin’i koruma işlevini
Depolanan dizini koru seçeneği CLR tümleştirmesi gerektirdiğinden, bu özellik yalnızca CLR tümleştirmesinin etkinleştirildiği SQL Server örneğinde bir başvuru tablosu seçtiğinizde çalışır.
Var olan dizin kullanma
Dönüşümün arama için var olan bir dizini kullanması gerektiğini belirtin.
Var olan bir dizin adı
Listeden daha önce oluşturulmuş bir arama dizini seçin.
Bulanık Arama Dönüştürme Düzenleyicisi (Sütunlar Sekmesi)
Giriş ve çıkış sütunlarının özelliklerini ayarlamak için Benzer Arama Dönüştürme Düzenleyicisi iletişim kutusunun Sütunlar sekmesini kullanın.
Seçenekler
Kullanılabilir Giriş Sütunları
Giriş sütunlarını sürükleyerek kullanılabilir arama sütunlarına bağlayın. Bu sütunların eşleşen, desteklenen veri türleri olmalıdır. Bir eşleme çizgisi seçin ve İlişki Oluştur iletişim kutusunda eşlemeleri düzenlemek için sağ tıklayın.
Adı
Kullanılabilir giriş sütunlarının adlarını görüntüleyin.
geçiş
Giriş sütunlarının dönüşümün çıkışına eklenip eklenmeyeceğini belirtin.
Kullanılabilir Arama Sütunları
Bulanık arama işlemleri gerçekleştirmek için sütunları seçerken onay kutularını kullanın.
Arama Sütunu
Kullanılabilir başvuru tablosu sütunları listesinden arama sütunlarını seçin. Seçimleriniz, Kullanılabilir Arama Sütunları tablosundaki
Çıktı Diğer Adı
Her arama sütunu için sonuç için bir takma ad yazın. Varsayılan değer, sayısal dizin değeri eklenmiş arama sütununun adıdır; ancak, herhangi bir benzersiz, açıklayıcı ad seçebilirsiniz.
Bulanık Arama Dönüştürme Düzenleyicisi (İleri Düzey Sekme)
Bulanık arama parametrelerini ayarlamak için Bulanık Arama Dönüştürme Düzenleyicisi iletişim kutusunun Gelişmiş sekmesini kullanın.
Seçenekler
Arama işlemi başına çıktı için maksimum eşleşme sayısı
Dönüştürmenin her giriş satırı için döndürebileceği en fazla eşleşme sayısını belirtin. Varsayılan değer 1'dir.
Benzerlik eşiği
Kaydırıcıyı kullanarak bileşen düzeyinde benzerlik eşiğini ayarlayın. Değer 1'e ne kadar yakınsa, eşleşme olarak nitelenecek arama değerinin kaynak değere olan benzerliği o kadar yakın olmalıdır. Daha az aday kaydın dikkate alınması gerektiğinden eşiğin artırılması eşleştirme hızını artırabilir.
Belirteci sınırlayıcıları
Dönüştürmenin sütun değerlerini belirteç haline getirmek için kullandığı sınırlayıcıları belirtin.
Ayrıca Bkz.
arama dönüştürme
Bulanık Gruplandırma Dönüştürme
Entegrasyon Hizmetleri Dönüşümleri