Aracılığıyla paylaş


benzer öğe gruplandırma dönüştürme

benzer öğe gruplandırma dönüştürme veri çoğaltmaları etkilenebilir veri satırlarının tanımlayıp kurallı verileri standartlaştırılmasına içinde kullanmak için bir veri satırı seçerek, görevleri temizlemeyi gerçekleştirir.

Not

Performans ve bellek sınırlamaları, belirsiz bir gruplandırma dönüştürme hakkında daha ayrıntılı bilgi için teknik incelemeye bakın... Belirsiz arama ve SQL Server ıntegration Hizmetleri 2005 benzer öğe gruplandırma.

benzer öğe gruplandırma dönüştürme örnek için bir bağlantı gerektirir. SQL Server geçici oluşturmak için SQL Server Tablo dönüştürme algoritması işini yapmasını gerektirir. Bağlantı veritabanında tablolar oluşturma iznine sahip bir kullanıcı çözülmesi gerekir.

dönüştürme yapılandırmak için , yinelemeler tanımlarken kullanmasını giriş sütunları seçin ve bir eşleşme türü seçmeniz gerekir; bulanık veya tam — her sütun için.Yalnızca, satırları bir tam eşleşme garanti aynı değerleri içinde olan sütun gruplandırılır.Tam olarak eşleşen herhangi bir sütun için uygulanabilir Integration Services DT_TEXT DT_NTEXT ve DT_IMAGE dışında veri türü. Bir bulanık eşleşme yaklaşık olarak aynı değerlere sahip satırlar gruplandırır.Yaklaşık verileri eşleştirmek için bu yöntem, bir kullanıcı tarafından belirtilen benzerliği puan üzerinde dayanır.benzer öğe eşleştirme, yalnızca sütun DT_WSTR ve DT_STR veri türleriyle kullanılabilir.Daha fazla bilgi için bkz:Tümleştirme Hizmetleri veri türleri.

dönüştürme çıktısı tüm giriş sütun, standart veri ile bir veya daha çok sütun ve benzerlik Skor içeren bir sütunu içerir.Skor, 0 ile 1 arasında ondalık bir değerdir.Kanonik satır 1'in bir puan vardır.Satır, kurallı satır ne kadar iyi eşleşen gösteren puanları belirsiz grubundaki diğer satırları var.Daha yakın sonuç 1, satır, kurallı satır daha yakından eşleşen olur.Belirsiz grubu, kurallı satırın tam çoğaltmaları olan satırlar içeriyorsa, bu satırlar ayrıca bir puan 1 var.dönüştürme yinelenen satırları kaldırma; Bu, bunları kurallı satır benzer bir satır olarak ilgili bir anahtar oluşturarak gruplandırır.

dönüştürme aşağıdaki ek sütunlar ile giriş her satır için bir çıkış satır üretir:

  • _key_in, her satırı benzersiz olarak tanıtan bir sütun.

  • _key_out, yinelenen satırları grubu tanımlayan bir sütun.The _key_out sütun has the value of the _key_in sütun in the canonical data row.Satırları aynı değer _key_out aynı grubun parçası olur.The _key_outvalue for a group corresponds to the value of _key_in in the canonical data row.

  • _skor, değeri 0 ile 1, kurallı satıra giriş satırının benzerlik gösterir.

Varsayılan sütun adları bunlar ve diğer adları benzer öğe gruplandırma dönüştürme yapılandırabilirsiniz.Çıktı, belirsiz bir gruplandırma her sütunun bir benzerliği puan de sağlar.

Bu gruplandırma özelleştirmek için iki özellik, benzer öğe gruplandırma dönüştürme aşağıdakileri içerir: belirteci bir sınırlayıcı ve benzerlik eşik. Varsayılan değer dönüşümü sağlar küme ayırıcısını verileri tokenize için kullanılır, ancak verilerinizin belirteçlere ayırma artıran yeni ayırıcıları ekleyebilirsiniz.

Benzerlik eşiği nasıl kesinlikle bu dönüştürme çoğaltmaları tanımlayan gösterir.Benzerlik eşiklerini olabilir küme bileşen ve sütun düzeyi.Sütun-düzey benzerliği eşik yalnızca bir bulanık eşleşme gerçekleştiren sütunlar için kullanılabilir.Benzerlik aralık 0 için 1.Çoğaltma olarak nitelemek için satır ve sütunları olmalı eşik olan 1 daha benzer yaklaşılmış.Satırlar ve sütunlar arasında benzerliği eşik ayarlayarak belirtin MinSimilarity Bileşen ve sütun düzeylerde özellik. Belirtilen bileşen düzeyinde benzerliği karşılamak için , tüm satırlar bir benzerliği bileşen düzeyinde belirtilen benzerliği eşiğine eşit veya daha büyük olan tüm sütunlar arasında) olmalıdır.

benzer öğe gruplandırma dönüştürme benzerliği ve belirtilen değerden daha az benzer satırların iç önlemler hesaplar. MinSimilarity gruplandırılmıştır.

Verileriniz için çalışan bir benzerliği eşik tanımlamak için , birkaç farklı minimum benzerliği eşiklerini kullanarak zamanları benzer öğe gruplandırma dönüştürme uygulamak olabilir.Çalıştırma sırasında dönüştürme çıktısı Skor sütunlarda benzerliği puanları grubundaki her bir satır içerir.Bu değerler, verileriniz için uygun olan benzerliği eşik tanımlamak için kullanabilirsiniz.Benzerlik artırmak istiyorsanız, ayarlamalıdır MinSimilarity bir değer Skor sütunlarındaki değerinden daha büyük.

Giriş benzer öğe gruplandırma dönüştürme sütun özelliklerini ayarlayarak dönüştürme gerçekleştiren gruplandırmayı özelleştirebilirsiniz.Örneğin, FuzzyComparisonFlags Dize veri dönüştürme'nasıl karşılaştırır özelliği belirtir bir sütun ve ExactFuzzy özellik dönüştürme bulanık eşleşme veya tam bir eşleşme belirtir.

benzer öğe gruplandırma dönüştürme kullandığı bellek miktarını ayarlayarak yapılandırılabilir MaxMemoryUsage özel özellik. Megabayt (MB) sayısını belirtmek veya 0 değeri, dönüştürme, dinamik bir kendi gereksinimlerine göre bellek ve kullanılabilir fiziksel bellek miktarı kullanmak izin vermek için kullanın.The MaxMemoryUsage custom özellik can be updated by a özellik ifade when the paket is loaded. Daha fazla bilgi için bkz: Tümleştirme Hizmetleri ifade başvurusu, Paketlerinde özellik ifadeleri kullanma, ve Dönüştürme için özel özellikler.

Bu dönüştürme sahip girdi ve bir çıkış.Bir hata çıktı desteklemiyor.

Satır karşılaştırma

benzer öğe gruplandırma dönüştürme yapılandırdığınızda, satırların dönüştürme girdisi Karşılaştırılacak dönüşümün kullandığı karşılaştırma algoritmayı belirtebilirsiniz.küme, Exhaustive özellik true, her satırda bir giriş diğer her satıra giriş dönüştürme karşılaştırır. Bu karşılaştırma algoritma daha kesin sonuçlar oluşturabilir, ancak daha yavaş, satırların giriş numarasını küçük olmadıkça gerçekleştirmek dönüştürme yapmak olasıdır.Performans sorunlarını önlemek için , bunun için önerilir küme Exhaustive özellik true Paket geliştirme yalnızca sırasında.

Geçici tablolar ve dizinler

Çalışma sırasında saat, belirsiz gruplandırma dönüştürme geçici oluşturur, tablolar ve dizinler, büyük olasılıkla önemli boyutu gibi nesneleri SQL Server dönüşümün bağlayan veritabanıdır. Tablolar ve dizinler boyutunu orantılı dönüştürme girdi satır numarasını ve benzer öğe gruplandırma dönüştürme tarafından oluşturulan bir simge sayısı.

dönüştürme, geçici tablolar da sorgular.Bu nedenle bir olmayan üretim örneğine benzer öğe gruplandırma dönüştürme bağlanma düşünmelisiniz SQL Server, özellikle üretim sunucusuna kullanılabilir disk alanının sınırlı olması durumunda.

Tablolar ve dizinler kullanır, yerel bilgisayarda bulunuyorsa, bu dönüştürme performansını artırabilir.

benzer öğe gruplandırma dönüştürme yapılandırma

Yapabilecekleriniz küme özellikleri yoluyla SSIS Tasarımcı veya programlı olarak.

Yapabilecekleriniz özellikleri hakkında daha fazla bilgi için küme, benzer öğe gruplandırma dönüştürme Düzenleyicisi iletişim kutusunda, aşağıdaki konulardan birini tıklatın:

Ayarlayabileceğiniz özellikler hakkında daha fazla bilgi için Gelişmiş Düzenleyici iletişim kutusunda veya programlı olarak aşağıdaki konulardan birini tıklatın:

Özellikleri küme hakkında daha fazla bilgi için aşağıdaki konulardan birini tıklatın:

Integration Services icon (small) Tümleştirme Hizmetleri ile güncel kalın

Karşıdan yüklemeler, makaleleri, örnekler ve en son Microsoft video yanı sıra, seçili topluluğun çözümleri için ziyaret Integration Services sayfa MSDN veya TechNet:

Bu güncelleştirmelerin otomatik bildirim için kullanılabilir RSS akışlarına abone olmak sayfa.