Aracılığıyla paylaş


Veri profil oluşturma görev

Veri profil oluşturma görev yardımcı olan çeşitli profilleri içeren bir veri kaynak hakkında bilgi sahibi olun ve düzeltilmesi gereken veri sorunlarını belirlemek hesaplar.

Veri profil oluşturma görev içinde kullanabileceğiniz bir Integration Services paket içinde depolanan profil verileri için SQL Server ve ile ilgili olası sorunları tanımlamak için veri kalitesi.

Not

Bu konu yalnızca açıklar veri profil oluşturma görev gereksinimleri ve özellikleri.İzlenecek yol nasıl veri profil oluşturma görev kullanmak için bkz: Bölüm Görev ve Görüntüleyicisi profil oluşturma verileri verilerle profil oluşturma.

Önemli notÖnemli

Veri profil oluşturma görev depolanan verileri ile çalışır SQL Server 2000 veya daha sonraki sürümleri.Bu görev, üçüncü taraf veya dosya tabanlı veri kaynakları ile çalışmaz.

Ayrıca, veri profil oluşturma görev içeren bir paket çalıştırmak için create table iznine dahil, okuma/yazma izinleri olan bir hesap kullanmanız gerekir tempdb veritabanı.

Görevi, veri profilleri hesaplamak ve bunları bir dosyaya kaydetmek için kullandıktan sonra Profil çıktı gözden geçirmek için tek başına veri profil Görüntüleyicisi'ni kullanabilirsiniz.Veri profil görüntüleyiciyi de tha profil çıkışı tanımlanan veri kalitesi anlaşılmasına yardımcı olmak için geçiş yapmayı yeteneğini destekler.Daha fazla bilgi için bkz: Profil çıkış veri profil Görüntüleyicisi'nde görüntüleme.

Önemli notÖnemli

Çıktı dosyası veritabanı hakkındaki gizli veri ve veritabanı içeren veri içerebilir.Bu dosya daha güvenli yapma hakkında daha fazla bilgi için bkz: Paketleri tarafından kullanılan dosyalara erişimi denetleme.

Veri profil Görüntüleyicisi'nde mevcut olan geçiş yapmayı yeteneği Canlı sorguları için özgün verileri gönderir kaynak.

Kullanılabilir profillerini anlama

Veri profil oluşturma görev sekiz farklı veri profilleri hesaplamak için.Beş bu profilleri tek tek sütunların çözümlemek ve diğer üçü birden çok sütun veya sütunları ve tablolar arasındaki ilişkileri analiz etmek.

Aşağıdaki beş profilleri sütunları tek tek analiz.

Tek tek sütunların çözümlemek profilleri

Açıklama

Sütun uzunluğu dağıtım profili

Seçili sütundaki dize değerleri farklı uzunluklarını ve satırların yüzdesini bildirir tablo temsil eden her uzunluğu.

Bu profil verilerinizi geçerli değerler gibi sorunları tanımlamanıza yardımcı olur.Örneğin, bir sütun iki karakter uzunluğunda ve iki karakterden daha uzun olan değerleri keşfetmek gerekir ABD durum kodları profil.

Sütun Null oranı profil

Null değerler seçili yüzdesini bildirir sütun.

Bu profil, verilerinizdeki null değerleri beklenmedik biçimde yüksek bir oranı gibi sorunları tanımlamanıza yardımcı olur bir sütun.Örneğin, bir posta kodu posta kodu profil sütun ve eksik kodları kabul edilemeyecek kadar yüksek bir yüzdesini keşfedin.

Sütun deseni profil

Raporları bir küme belirtilen bir dize sütundaki değerleri yüzdesi kapak normal ifadeler.

Bu profili gibi verilerinizdeki sorunları belirlemenize yardımcı olur dize , geçerli değil.Bu profil, gelecekte yeni değerleri doğrulamak için kullanılan normal ifadeler de önerebilir.Örneğin, bir ABD ZIP kodu sütun deseni profil normal ifadeler ortaya çıkarabilir: {\d{5}-\d{4}, \d{5} ve \d{9}.Diğer normal ifadeler görüyorsanız, büyük olasılıkla verilerinizi değil geçerli veya biçimi hatalı değerler içerir.

Sütun istatistikleri profil

En az, en büyük, ortalama ve standart sapma için sayısal sütunlar ve en az ve en fazla için gibi istatistikleri raporlar datetime sütunlar.

Bu profil verilerinizi geçerli tarih gibi sorunları tanımlamanıza yardımcı olur.Örneğin, profil bir sütun geçmiş tarih ve gelecekte en büyük tarihi keşfedin.

Sütun değeri dağıtım profili

Tüm farklı değerler seçili sütun ve satırların yüzdesini bildirir tablo , her bir değeri temsil eder.Birden çok satırda belirtilen yüzdesi temsil eden değerleri de rapor edebilirsiniz tablo.

Bu profil, verilerinizdeki farklı değerler yanlış sayıda gibi sorunları tanımlamanıza yardımcı olur bir sütun.Örneğin, 50'den fazla farklı değerler keşfedin ve Amerika Birleşik Devletleri'nde durumları içeren beklenir bir sütun profil.

Aşağıdaki üç profilleri, birden çok sütun veya sütunları ve tablolar arasındaki ilişkileri analiz.

Birden çok sütun çözümlemek profilleri

Açıklama

Aday anahtar profil

Raporları bir sütun veya sütunları küme anahtar veya seçili tablo için yaklaşık anahtar olup olmadığı.

Bu profili de verilerinizi olası anahtar sütun yinelenen değerleri gibi sorunları tanımlamanıza yardımcı olur.

İşlevsel bağımlılık profili

Olduğu (bağımlı sütun) bir sütundaki değerlere bağlıdır başka bir sütundaki değerlerin testin raporları veya küme (determinant sütun) sütun.

Bu profili de verilerinizi geçerli değerler gibi sorunları tanımlamanıza yardımcı olur.Örneğin, ABD posta kodları içeren bir sütunu Amerika Birleşik Devletleri'nde durumlar içeren bir sütun arasında bağımlılık profil.Posta kodu aynı olan her zaman aynı duruma sahip olmalıdır, ancak bu bağımlılık ihlalleri profil bulur.

Değer eklenmesi profil

Üst üste iki sütun veya sütunları kümesi arasında değerleri hesaplar.Bu profili bir sütun olup olmadığını belirlemek veya sütunları küme arasında seçili tabloları bir yabancı anahtar olarak hizmet vermek uygundur.

Bu profili de verilerinizi geçerli değerler gibi sorunları tanımlamanıza yardımcı olur.ProductID sütununu bir satış profili gibi tablo ve sütun ProductID sütununu ürünlerin içinde bulunan değerleri içeren tablo.

Geçerli profil için Önkoşullar

Tabloları ve boş olmayan sütunları seçmediğiniz sürece bir profili geçerli değil ve profil için geçerli olan veri türleri sütunlar içerir.

Geçerli veri türleri

Kullanılabilir profilleri yalnızca belirli veri türleri için anlamlı birkaçıdır.Örneğin, sayısal içeren bir sütun için bir sütun deseni profil bilgi işlem ya da datetime değerler anlamlı değil.Bu nedenle, bu tür bir profili geçerli değil.

Profil

Geçerli veri türleri *

ColumnStatisticsProfile

Sayısal tür sütunları veya datetime türü (yok mean ve stddev için datetime sütun)

ColumnNullRatioProfile

Tüm sütunları **

ColumnValueDistributionProfile

Sütunlarından integer türü, char türü, ve datetime türü

ColumnLengthDistributionProfile

Sütunlarından char türü

ColumnPatternProfile

Sütunlarından char türü

CandidateKeyProfile

Sütunlarından integer türü, char türü, ve datetime türü

FunctionalDependencyProfile

Sütunlarından integer türü, char türü, ve datetime türü

InclusionProfile

Sütunlarından integer türü, char türü, ve datetime türü

* Nda önceki tablo geçerli veri türleri, integer, char, datetime, ve numeric türleri aşağıdaki belirli veri türlerini içerir:

Integer types include bit, tinyint, smallint, int, and bigint.

Karakter türleri dahil char, nchar, varchar, ve nvarchar, , ancak ekleme varchar(max) ve nvarchar(max).

Tarih ve saat türleri dahil datetime, smalldatetime, ve timestamp.

Numeric types include integer types (except bit), money, smallmoney, decimal, float, real, and numeric.

** image, text, xml, udt, ve variant türleri desteklenmez profiller farklı sütun Null oranı profil.

Tablolar ve sütunlar geçerli

Tablo veya sütun boş veri Profiling sürer aşağıdaki eylemleri ise:

  • Seçili tablo veya Görünüm boş olduğunda, veri profil oluşturma görev herhangi bir profil hesaplaması yapmıyor.

  • Seçili sütundaki tüm değerleri null olduğunda, veri profil oluşturma görev yalnızca sütun Null oranı profil hesaplar.Görev, sütun uzunluğu dağıtım profili, sütun deseni profil, sütun istatistikleri profil veya sütun değeri dağıtım profili hesaplaması yapmıyor.

Veri profil oluşturma görev özellikleri

Veri profil oluşturma görev bu uygun yapılandırma seçenekleri vardır:

  • Joker karakter sütunlarıbir profil isteği yapılandırırken, görevi kabul (*) bir sütun adı yerine joker.Bu kolaylaştırır yapılandırma ve bilmediğiniz veri özelliklerini keşfetmek daha kolay hale getirir.Görev çalıştırıldığında, görev profilleri her sütun , uygun bir veri türü vardır.

  • Hızlı profilgörevi hızlı bir şekilde yapılandırmak için hızlı profili seçebilirsiniz.Hızlı profil varsayılan profiller ve varsayılan ayarları kullanarak bir tablo ya da Görünüm profilleri.

Veri Profililng görev kullanılabilir özel günlüğü iletileri

Aşağıdaki tablo veri profil oluşturma görev için özel günlük girdileri listeler.Daha fazla bilgi için bkz: Uygulama paketlerinde günlüğü ve Özel günlük iletileri.

Günlük girdisi

Açıklama

DataProfilingTaskTrace

Görevin durumu hakkında açıklayıcı bilgiler sağlar.İletileri aşağıdaki bilgileri içerir:

  • İstekleri işlemeyi Başlat

  • Sorguyu Başlat

  • Sorgu Sonlandır

  • İstek Computing bitiş

Çıktı ve şemasını anlama

Veri profil oluşturma görev Seçili profilleri DataProfile.xsd şemaya göre yapılandırılmış xml içine çıkarır.Bu xml çıktısı bir dosyada veya paket değişken kaydedilen belirtebilirsiniz.Bu schema çevrimiçi görebilirsiniz https://schemas.microsoft.com/sqlserver/2008/DataDebugger/.Web'den sayfa, şema yerel bir kopyasını kaydedebilirsiniz.Daha sonra şema yerel kopyasını Microsoft görebilir Visual Studio ya da başka bir şema düzenleyicisinde, bir xml Düzenleyicisi veya gibi bir metin düzenleyicisiNot Defteri.

Bu şema veri kalite bilgi için yararlı olabilir:

  • İçinde ve kuruluşlar arasında veri kalite bilgi değişimi.

  • Veri kalite bilgilerle çalışmak özel araçlar oluşturmak.

Hedef ad alanı şeması olarak tanımlanan https://schemas.microsoft.com/sqlserver/2008/DataDebugger/.

Çıkış paketi koşullu iş akışı kullanma

Bileşenleri profil oluşturma verileri koşullu mantığı iş akışı uygulamak için yerleşik işlevleri içermemektedir Integration Services paket esas çıkış veri profil oluşturma görev.Ancak, bir komut dosyası görevi ile programlama, en az miktarda bu mantık kolayca ekleyebilirsiniz.Bu kod xml çıktısı karşı bir XPath sorgusu gerçekleştirin ve sonucu paket değişkeninde kaydedin.Sonraki görevleri için komut dosyası görev bağlanmak önceliği kısıtlamaları, iş akışını belirlemek için ifade kullanabilirsiniz.Örneğin, komut dosyası görev, algılar null değerler yüzdesi bir sütun belirli bir eşiği aşıyor.Bu koşul doğru olduğunda, paket kesme ve devam etmeden önce bu sorunu gidermek isteyebilirsiniz.

Görev profil oluşturma verileri yapılandırma

Veri profil oluşturma görev kullanarak yapılandırma Veri profil oluşturma görev Düzenleyicisi.İki sayfa Düzenleyicisi vardır:

Integration Services simgesi (küçük)Integration Services ile güncel kalın

En son karşıdan yüklemeler, makaleler, örnekler ve seçilen topluluk çözümleri yanı sıra Microsoft videolar için ziyaret Integration Services sayfa msdn veya TechNet:

Bu güncelleştirmelerle ilgili otomatik bildirim almak için, sayfadaki RSS akışlarına abone olun.