Udostępnij za pośrednictwem


Konfigurowanie danych Profilowanie zadań

Zanim można przejrzeć profilu danych źródłowych, pierwszym krokiem jest zestaw up i uruchomić zadanie Profilowanie danych.Tworzenie zadania wewnątrz Integration Services pakiet. Aby skonfigurować Profilowanie dane zadanie, korzystanie z edytora zadań Profilowanie danych.Tego edytora można wybrać miejsce wyjściowe profile, a które profile do obliczenia.Po zestaw aż zadania, można uruchomić pakiet w celu obliczenia danych profilów.

Important noteImportant Note:

Profilowanie danych zadania działa tylko w przypadku danych, które są przechowywane w SQL Server 2000 lub jego nowszych wersjach. Przekierowanie nie działa ze źródłami danych innych producentów lub na podstawie pliku.

Ponadto aby uruchomić pakiet zawierający Profilowanie dane zadanie, należy użyć konta, które ma uprawnienia odczytu i zapisu, w tym uprawnienia CREATE tabela, w bazie danych tempdb.

Jak korzystać z zadaniem w podejmowaniu decyzji, pakiet

Profilowanie dane zadanie tylko konfiguruje profile i tworzy plik wyjściowy, który zawiera obliczaną profilów.Aby przejrzeć ten plik danych wyjściowych, należy użyć przeglądarki profil danych, program Podgląd autonomicznego.Ponieważ dane wyjściowe należy wyświetlić oddzielnie, można wykonać zadania Profilowanie danych w pakiet zawierający żadnych innych zadań.

Jednakże, nie trzeba używać Profilowanie danych zadania jako zadania tylko w pakiet.Jeśli chcesz wykonać profilowania danych przepływu pracy lub przepływ danych pakiet bardziej złożone, są dostępne następujące opcje:

  • Aby zaimplementować warunkowego logiki, która jest oparta na pliku wyjściowego zadania, w przepływ sterowania pakiet, należy umieścić zadania skryptu po Profilowanie dane zadanie.Można użyć tego zadania skryptu, aby wykonać kwerendę dotyczącą pliku wyjściowego.

  • Do danych profilu przepływu, mimo że dane zostały załadowane i transformacji, należy tymczasowo do zapisywania zmienionych danych, SQL Server Tabela. Użytkownik może następnie profilu zapisanych danych.

Aby uzyskać więcej informacji zobaczPrzy użyciu profilowania zadania w przepływie pracy pakiet danych.

Konfigurowanie dane wyjściowe zadania

Po zadania Profilowanie danych znajduje się w pakiecie, należy przeprowadzić zestaw up danych wyjściowych dla profilów, które zadania będą obliczenia.Aby zestaw zapasowych danych wyjściowych dla profili, użyj Ogólne strona z danych Profilowanie zadań edytora.Oprócz określenia obiekt docelowy dla danych wyjściowych, Ogólne strona oferuje również możliwość wykonywania szybkich profilu danych.Po wybraniu Szybkie profilu, Profilowanie dane zadanie profil tabela lub widoku za pomocą niektórych lub wszystkich domyślne profile z ustawień domyślnych.

Aby uzyskać więcej informacji zobacz Dane Profilowanie Edytor zadań (strona głównej) i Formularza profilu szybkiej pojedynczej tabela (dane Profilowanie zadań).

Important noteImportant Note:

Plik wyjściowy może zawierać dane poufne na temat używanej bazy danych i zawiera dane, które bazy danych.Aby sugestie, jak zabezpieczyć ten plik Zobacz Controlling Access to Files Used by Packages.

Wybieranie i konfigurowanie profilów się obliczono

Po zdefiniowaniu pliku wyjściowego, należy wybrać, które profile dane do obliczenia.Zadanie Profilowanie danych można obliczyć osiem różnych danych profilów.Analizowanie pięć te profile poszczególnych kolumn i pozostałych trzech analizowanie wiele kolumn lub relacje między kolumn i tabel.W jedno zadanie Profilowanie danych można obliczyć wiele profilów dla wielu kolumn lub kombinacji kolumn w wielu tabel lub widoków.

W poniższej tabela przedstawiono raporty, każdy z tych profili obliczany i typy danych, dla którego profil jest prawidłowy.

Aby obliczyć

Które pomagają określić

Używaj tego profilu

Wszystkie różne długości ciąg wartości w zaznaczonej kolumna i wiersze w tabela każdy odcinek stanowi procent.

Wartości ciągów, które nie są prawidłowe— Na przykład, profil kolumna, w której powinien używać dwóch znaków województw w Stanach Zjednoczonych, ale wykrywanie wartości, które są więcej niż dwóch znaków.

Dystrybucja długość kolumna —Prawidłowy dla kolumna z jednej z tych typów danych:

  • Typy danych znaków: char, nchar, varchar, a nvarchar

Zestaw wyrażeń regularnych, obejmujące określonej wartości procentowej wartości kolumna ciąg znaków.

Ponadto do znajdowania wyrażeń regularnych, które mogą być używane w przyszłości do sprawdzania poprawności nowych wartości

Ciąg wartości, które nie są prawidłowe lub nie znajduje się w poprawnym formacie —Na przykład profil deseń kolumna, kod pocztowy/kod pocztowy może dawać wyrażeń regularnych: \d{5}-\d{4} \d{5}, a \d{9}. Jeśli wyjście zawiera innych wyrażeń regularnych, dane zawierają wartości, które są nieprawidłowe albo w niepoprawnym formacie.

Profil wzorca kolumn —Prawidłowy dla kolumna z jednej z tych typów danych:

  • Typy danych znaków: char, nchar, varchar, a nvarchar

Procent wartości null w wybranym kolumna.

Nieoczekiwanie wysoki stopień wartości null kolumna —Na przykład profilu kolumna, która powinna zawierać kody ZIP w Stanach Zjednoczonych, ale wykrywanie zbyt wysoki stopień brakujące kody pocztowe.

Współczynnik wartości null kolumna —Prawidłowy dla kolumna z tych typów danych:

  • Dowolny typ danych.Dotyczy to również image, text, xml, w przypadku typów zdefiniowanych przez użytkownika i typy wariantu.

Statystyki, takie jak minimum, maksimum, średnią i odchylenie standardowe dla kolumn numerycznych i minimalną i maksymalną wartość dla datetime kolumny.

Wartości liczbowe i dat, które nie są prawidłowe— Na przykład kolumna daty historycznej profilu, ale wykrywanie Maksymalna data, która jest w przyszłości.

Profil Statystyka kolumna —Prawidłowy dla kolumna z jednej z tych typów danych:

  • Liczbowych typów danych: typu Integer (z wyjątkiem bit), money, smallmoney, decimal, float, real, a numeric

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, a datetimeoffset

    NoteNote:
    Dla kolumna, które znajdują się dane typu Data i godzina profilu oblicza minimalną i maksymalną tylko.

Różne wartości w wybranej kolumnie i procent wierszy w tabela, która reprezentuje wszystkie wartości.Lub wartości, które reprezentują większej od określonej wartości procentowej w tabela.

Nieprawidłowa liczba różne wartości kolumna— Na przykład profilu zawierająca stanów w Stanach Zjednoczonych, ale odkryć więcej niż 50 różnych wartości.

Dystrybucja wartość kolumna —Prawidłowy dla kolumna z jednej z tych typów danych:

  • Liczbowych typów danych: typu Integer (z wyjątkiem bit), money, smallmoney, decimal, float, real, a numeric

  • Typy danych znaków: char, nchar, varchar, a nvarchar

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, a datetimeoffset

Czy kolumna lub zestaw kolumn jest kluczem lub klucz przybliżone dla wybranej tabela.

Duplikowanie wartości kolumna klucz potencjalnych —Na przykład użytkownik profilu nazwy i adresu kolumn w tabela Klienci i wykrycia powtarzających się wartości kombinacji nazwy i adresu powinien być unikatowy.

klucz kandydujący —Wiele kolumn profil, który informuje, czy kolumna lub zestaw kolumn jest odpowiednia służyć jako klucza podstawowego dla wybranej tabela.

Ważne w wypadku kolumn o jednym z tych typów danych:

  • Typu danych Integer: bit, tinyint, smallint, int, a bigint

  • Typy danych znaków: char, nchar, varchar, a nvarchar

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, a datetimeoffset

fragment, do których wartości w jednej kolumnie (kolumny zależnej) zależą od wartości w innej kolumnie lub zestaw kolumn (kolumna wyznacznik).

Wartości, które nie są dozwolone w kolumn zależnych —Na przykład profilu zależność między kolumna, która zawiera kody ZIP w Stanach Zjednoczonych i kolumna, która zawiera stanów w Stanach Zjednoczonych.Ten sam kod pocztowy zawsze powinien mieć ten sam stan.Jednak w profilu wykryje naruszenie zależności.

Zależność funkcjonalności —Ważne w wypadku kolumn o jednym z tych typów danych:

  • Typu danych Integer: bit, tinyint, smallint, int, a bigint

  • Typy danych znaków: char, nchar, varchar, a nvarchar

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, a datetimeoffset

Czy kolumna lub zestaw kolumn jest służy jako klucz obcy między wybranymi tabelami.

Oznacza to ten profil raportów nakładania się wartości między dwoma kolumnami lub zestawy kolumn.

Wartości, które nie są prawidłowe —Na przykład profil jest kolumna IDproduktu tabela Sprzedaż.Profil odkryje, że kolumna zawiera wartości, które nie znajdują się w kolumnie IDProduktu tabela Produkty.

Wartość dołączania —Ważne w wypadku kolumn o jednym z tych typów danych:

  • Typu danych Integer: bit, tinyint, smallint, int, a bigint

  • Dane znakowe należy wpisać: char, nchar, varchar, a nvarchar

  • Data i czas typów danych: datetime, smalldatetime, timestamp, date, time, datetime2, a datetimeoffset

Aby wybrać które profile do obliczenia, należy użyć Żądania profilu strona z danych Profilowanie zadań edytora.Aby uzyskać więcej informacji zobaczDane Profilowanie Edytor zadań (strona profil żądań).

Na Żądanie profilu strona, należy także określić dane urządzenie źródłowe i konfigurowania profilów danych.Podczas konfigurowania zadania należy zastanowić się następujące informacje:

  • Aby uprościć konfiguracja i ułatwić odkrywanie charakterystyki nieznane dane, można użyć symboli wieloznacznych, (*), zamiast o nazwie poszczególnych kolumn.Jeśli używasz tego symbolu wieloznacznego, zadanie będzie profilu każdej kolumna, która ma typ danych, które z kolei może spowolnić przetwarzania.

  • Przy zaznaczonej tabela lub widoku jest puste, zadanie Profilowanie danych nie obliczyć żaden profil.

  • Gdy wszystkie wartości w wybranej kolumnie są puste, zadanie Profilowanie danych oblicza tylko kolumna null współczynnik profil.To nie obliczyć kolumna długość dystrybucji profilu, kolumny deseń profilu, profil statystyki kolumn lub kolumny wartości dystrybucji profilu puste kolumny.

Każda z dostępnych danych profilów ma własne opcje konfiguracja.Aby uzyskać więcej informacji o tych opcjach zobacz następujące tematy:

Uruchomienie pakiet zawiera dane Profilowanie zadań

Po utworzeniu zestaw aż zadania Profilowanie Data uruchomienia zadania.Następnie oblicza profile dane i wyświetla te informacje w formacie XML do pliku lub zmiennej pakiet zadania.Struktura XML to następuje DataProfile.xsd schematu.You can open the schema in Microsoft Visual Studio or another schema editor, in an XML editor, or in a text editor such as Notepad.Ten schemat dla informacji o jakości danych może być przydatne w następujących celach:

  • Do wymiany informacji o jakości danych w ramach i między organizacjami.

  • Do tworzenia niestandardowych narzędzi, pracować z informacjami o jakości danych.

miejsce docelowe obszar nazw jest identyfikowany w schemacie jako https://schemas.Microsoft.com/SQLServer/2008/DataDebugger/.

Następny krok

Wyświetlanie profil wyjściowy w oknie Przeglądarka profilu danych.

Integration Services icon (small) Konfiguracja w aktualizacji z usług integracja Services pobytu

Najnowsze pliki do pobrania, artykuły, próbki, i pliki wideo firmy Microsoft, jak również wybranego rozwiązania od Wspólnoty, odwiedź witrynę Integration Services strona w witrynie MSDN lub TechNet:

Automatycznego powiadomienie tych aktualizacji należy subskrybować źródła danych RSS, które jest dostępne strona.

Historia zmian

Microsoft Learning

  • Dodano uwagę dotyczącą uprawnień, które są niezbędne do uruchomienia pakiet, który zawiera Profilowanie dane zadanie.