Veri profil oluşturma görev
Veri profil oluşturma görev yardımcı olan çeşitli profilleri içeren bir veri kaynak hakkında bilgi sahibi olun ve düzeltilmesi gereken veri sorunlarını belirlemek hesaplar.
Veri profil oluşturma görev içinde kullanabileceğiniz bir Integration Services paket içinde depolanan profil verileri için SQL Server ve ile ilgili olası sorunları tanımlamak için veri kalitesi.
Not
Bu konu yalnızca açıklar veri profil oluşturma görev gereksinimleri ve özellikleri.İzlenecek yol nasıl veri profil oluşturma görev kullanmak için bkz: Bölüm Görev ve Görüntüleyicisi profil oluşturma verileri verilerle profil oluşturma.
Önemli |
---|
Veri profil oluşturma görev depolanan verileri ile çalışır SQL Server 2000 veya daha sonraki sürümleri.Bu görev, üçüncü taraf veya dosya tabanlı veri kaynakları ile çalışmaz. Ayrıca, veri profil oluşturma görev içeren bir paket çalıştırmak için create table iznine dahil, okuma/yazma izinleri olan bir hesap kullanmanız gerekir tempdb veritabanı. |
Görevi, veri profilleri hesaplamak ve bunları bir dosyaya kaydetmek için kullandıktan sonra Profil çıktı gözden geçirmek için tek başına veri profil Görüntüleyicisi'ni kullanabilirsiniz.Veri profil görüntüleyiciyi de tha profil çıkışı tanımlanan veri kalitesi anlaşılmasına yardımcı olmak için geçiş yapmayı yeteneğini destekler.Daha fazla bilgi için bkz: Profil çıkış veri profil Görüntüleyicisi'nde görüntüleme.
Önemli |
---|
Çıktı dosyası veritabanı hakkındaki gizli veri ve veritabanı içeren veri içerebilir.Bu dosya daha güvenli yapma hakkında daha fazla bilgi için bkz: Paketleri tarafından kullanılan dosyalara erişimi denetleme. Veri profil Görüntüleyicisi'nde mevcut olan geçiş yapmayı yeteneği Canlı sorguları için özgün verileri gönderir kaynak. |
Kullanılabilir profillerini anlama
Veri profil oluşturma görev sekiz farklı veri profilleri hesaplamak için.Beş bu profilleri tek tek sütunların çözümlemek ve diğer üçü birden çok sütun veya sütunları ve tablolar arasındaki ilişkileri analiz etmek.
Aşağıdaki beş profilleri sütunları tek tek analiz.
Tek tek sütunların çözümlemek profilleri |
Açıklama |
---|---|
Sütun uzunluğu dağıtım profili |
Seçili sütundaki dize değerleri farklı uzunluklarını ve satırların yüzdesini bildirir tablo temsil eden her uzunluğu. Bu profil verilerinizi geçerli değerler gibi sorunları tanımlamanıza yardımcı olur.Örneğin, bir sütun iki karakter uzunluğunda ve iki karakterden daha uzun olan değerleri keşfetmek gerekir ABD durum kodları profil. |
Sütun Null oranı profil |
Null değerler seçili yüzdesini bildirir sütun. Bu profil, verilerinizdeki null değerleri beklenmedik biçimde yüksek bir oranı gibi sorunları tanımlamanıza yardımcı olur bir sütun.Örneğin, bir posta kodu posta kodu profil sütun ve eksik kodları kabul edilemeyecek kadar yüksek bir yüzdesini keşfedin. |
Sütun deseni profil |
Raporları bir küme belirtilen bir dize sütundaki değerleri yüzdesi kapak normal ifadeler. Bu profili gibi verilerinizdeki sorunları belirlemenize yardımcı olur dize , geçerli değil.Bu profil, gelecekte yeni değerleri doğrulamak için kullanılan normal ifadeler de önerebilir.Örneğin, bir ABD ZIP kodu sütun deseni profil normal ifadeler ortaya çıkarabilir: {\d{5}-\d{4}, \d{5} ve \d{9}.Diğer normal ifadeler görüyorsanız, büyük olasılıkla verilerinizi değil geçerli veya biçimi hatalı değerler içerir. |
Sütun istatistikleri profil |
En az, en büyük, ortalama ve standart sapma için sayısal sütunlar ve en az ve en fazla için gibi istatistikleri raporlar datetime sütunlar. Bu profil verilerinizi geçerli tarih gibi sorunları tanımlamanıza yardımcı olur.Örneğin, profil bir sütun geçmiş tarih ve gelecekte en büyük tarihi keşfedin. |
Sütun değeri dağıtım profili |
Tüm farklı değerler seçili sütun ve satırların yüzdesini bildirir tablo , her bir değeri temsil eder.Birden çok satırda belirtilen yüzdesi temsil eden değerleri de rapor edebilirsiniz tablo. Bu profil, verilerinizdeki farklı değerler yanlış sayıda gibi sorunları tanımlamanıza yardımcı olur bir sütun.Örneğin, 50'den fazla farklı değerler keşfedin ve Amerika Birleşik Devletleri'nde durumları içeren beklenir bir sütun profil. |
Aşağıdaki üç profilleri, birden çok sütun veya sütunları ve tablolar arasındaki ilişkileri analiz.
Birden çok sütun çözümlemek profilleri |
Açıklama |
---|---|
Aday anahtar profil |
Raporları bir sütun veya sütunları küme anahtar veya seçili tablo için yaklaşık anahtar olup olmadığı. Bu profili de verilerinizi olası anahtar sütun yinelenen değerleri gibi sorunları tanımlamanıza yardımcı olur. |
İşlevsel bağımlılık profili |
Olduğu (bağımlı sütun) bir sütundaki değerlere bağlıdır başka bir sütundaki değerlerin testin raporları veya küme (determinant sütun) sütun. Bu profili de verilerinizi geçerli değerler gibi sorunları tanımlamanıza yardımcı olur.Örneğin, ABD posta kodları içeren bir sütunu Amerika Birleşik Devletleri'nde durumlar içeren bir sütun arasında bağımlılık profil.Posta kodu aynı olan her zaman aynı duruma sahip olmalıdır, ancak bu bağımlılık ihlalleri profil bulur. |
Değer eklenmesi profil |
Üst üste iki sütun veya sütunları kümesi arasında değerleri hesaplar.Bu profili bir sütun olup olmadığını belirlemek veya sütunları küme arasında seçili tabloları bir yabancı anahtar olarak hizmet vermek uygundur. Bu profili de verilerinizi geçerli değerler gibi sorunları tanımlamanıza yardımcı olur.ProductID sütununu bir satış profili gibi tablo ve sütun ProductID sütununu ürünlerin içinde bulunan değerleri içeren tablo. |
Geçerli profil için Önkoşullar
Tabloları ve boş olmayan sütunları seçmediğiniz sürece bir profili geçerli değil ve profil için geçerli olan veri türleri sütunlar içerir.
Geçerli veri türleri
Kullanılabilir profilleri yalnızca belirli veri türleri için anlamlı birkaçıdır.Örneğin, sayısal içeren bir sütun için bir sütun deseni profil bilgi işlem ya da datetime değerler anlamlı değil.Bu nedenle, bu tür bir profili geçerli değil.
Profil |
Geçerli veri türleri * |
---|---|
ColumnStatisticsProfile |
Sayısal tür sütunları veya datetime türü (yok mean ve stddev için datetime sütun) |
ColumnNullRatioProfile |
Tüm sütunları ** |
ColumnValueDistributionProfile |
Sütunlarından integer türü, char türü, ve datetime türü |
ColumnLengthDistributionProfile |
Sütunlarından char türü |
ColumnPatternProfile |
Sütunlarından char türü |
CandidateKeyProfile |
Sütunlarından integer türü, char türü, ve datetime türü |
FunctionalDependencyProfile |
Sütunlarından integer türü, char türü, ve datetime türü |
InclusionProfile |
Sütunlarından integer türü, char türü, ve datetime türü |
* Nda önceki tablo geçerli veri türleri, integer, char, datetime, ve numeric türleri aşağıdaki belirli veri türlerini içerir:
Integer types include bit, tinyint, smallint, int, and bigint.
Karakter türleri dahil char, nchar, varchar, ve nvarchar, , ancak ekleme varchar(max) ve nvarchar(max).
Tarih ve saat türleri dahil datetime, smalldatetime, ve timestamp.
Numeric types include integer types (except bit), money, smallmoney, decimal, float, real, and numeric.
** image, text, xml, udt, ve variant türleri desteklenmez profiller farklı sütun Null oranı profil.
Tablolar ve sütunlar geçerli
Tablo veya sütun boş veri Profiling sürer aşağıdaki eylemleri ise:
Seçili tablo veya Görünüm boş olduğunda, veri profil oluşturma görev herhangi bir profil hesaplaması yapmıyor.
Seçili sütundaki tüm değerleri null olduğunda, veri profil oluşturma görev yalnızca sütun Null oranı profil hesaplar.Görev, sütun uzunluğu dağıtım profili, sütun deseni profil, sütun istatistikleri profil veya sütun değeri dağıtım profili hesaplaması yapmıyor.
Veri profil oluşturma görev özellikleri
Veri profil oluşturma görev bu uygun yapılandırma seçenekleri vardır:
Joker karakter sütunlarıbir profil isteği yapılandırırken, görevi kabul (*) bir sütun adı yerine joker.Bu kolaylaştırır yapılandırma ve bilmediğiniz veri özelliklerini keşfetmek daha kolay hale getirir.Görev çalıştırıldığında, görev profilleri her sütun , uygun bir veri türü vardır.
Hızlı profilgörevi hızlı bir şekilde yapılandırmak için hızlı profili seçebilirsiniz.Hızlı profil varsayılan profiller ve varsayılan ayarları kullanarak bir tablo ya da Görünüm profilleri.
Veri Profililng görev kullanılabilir özel günlüğü iletileri
Aşağıdaki tablo veri profil oluşturma görev için özel günlük girdileri listeler.Daha fazla bilgi için bkz: Uygulama paketlerinde günlüğü ve Özel günlük iletileri.
Günlük girdisi |
Açıklama |
---|---|
DataProfilingTaskTrace |
Görevin durumu hakkında açıklayıcı bilgiler sağlar.İletileri aşağıdaki bilgileri içerir:
|
Çıktı ve şemasını anlama
Veri profil oluşturma görev Seçili profilleri DataProfile.xsd şemaya göre yapılandırılmış xml içine çıkarır.Bu xml çıktısı bir dosyada veya paket değişken kaydedilen belirtebilirsiniz.Bu schema çevrimiçi görebilirsiniz https://schemas.microsoft.com/sqlserver/2008/DataDebugger/.Web'den sayfa, şema yerel bir kopyasını kaydedebilirsiniz.Daha sonra şema yerel kopyasını Microsoft görebilir Visual Studio ya da başka bir şema düzenleyicisinde, bir xml Düzenleyicisi veya gibi bir metin düzenleyicisiNot Defteri.
Bu şema veri kalite bilgi için yararlı olabilir:
İçinde ve kuruluşlar arasında veri kalite bilgi değişimi.
Veri kalite bilgilerle çalışmak özel araçlar oluşturmak.
Hedef ad alanı şeması olarak tanımlanan https://schemas.microsoft.com/sqlserver/2008/DataDebugger/.
Çıkış paketi koşullu iş akışı kullanma
Bileşenleri profil oluşturma verileri koşullu mantığı iş akışı uygulamak için yerleşik işlevleri içermemektedir Integration Services paket esas çıkış veri profil oluşturma görev.Ancak, bir komut dosyası görevi ile programlama, en az miktarda bu mantık kolayca ekleyebilirsiniz.Bu kod xml çıktısı karşı bir XPath sorgusu gerçekleştirin ve sonucu paket değişkeninde kaydedin.Sonraki görevleri için komut dosyası görev bağlanmak önceliği kısıtlamaları, iş akışını belirlemek için ifade kullanabilirsiniz.Örneğin, komut dosyası görev, algılar null değerler yüzdesi bir sütun belirli bir eşiği aşıyor.Bu koşul doğru olduğunda, paket kesme ve devam etmeden önce bu sorunu gidermek isteyebilirsiniz.
Görev profil oluşturma verileri yapılandırma
Veri profil oluşturma görev kullanarak yapılandırma Veri profil oluşturma görev Düzenleyicisi.İki sayfa Düzenleyicisi vardır:
Genel sayfası
Üzerinde Genel sayfa, çıktı dosyası veya değişkeni belirtin.Ayrıca seçebilirsiniz Hızlı profil profilleri varsayılan ayarları kullanarak hızla hesaplamak için görev yapılandırmak için.Daha fazla bilgi için bkz: Tek tablo hızlı profil formuna (veri görev profil oluşturma).Profil istekleri sayfa
Üzerinde Profil istekleri sayfasında verileri belirtmek kaynak, seçin ve hesaplamak istediğiniz veri profillerini yapılandırmak.Yapılandırabileceğiniz çeşitli profilleri hakkında daha fazla bilgi için aşağıdaki konulara bakın:Aday anahtar profil isteği seçenekleri (veri görev profil oluşturma)
Sütun uzunluğu dağıtım profili isteği seçenekleri (veri görev profil oluşturma)
Sütun Null oranı profil isteği seçenekleri (veri görev profil oluşturma)
Sütun deseni profil isteği seçenekleri (veri görev profil oluşturma)
Sütun istatistikleri profil isteği seçenekleri (veri görev profil oluşturma)
Sütun değeri dağıtım profili isteği seçenekleri (veri görev profil oluşturma)
İşlevsel bağımlılık profil isteği seçenekleri (veri görev profil oluşturma)
Değer eklenmesi profil isteği seçenekleri (veri görev profil oluşturma)
|