Udostępnij przez


Opcje żądania profilu dystrybucji wartości kolumny (zadanie profilowania danych)

Dotyczy:SQL Server SSIS Integration Runtime w ramach usługi Azure Data Factory

Użyj okienka Właściwości żądania na stronie Żądania profilu , aby ustawić opcje dla żądania profilu dystrybucji wartości kolumny wybranej w okienku żądań. Profil rozkładu wartości kolumny raportuje wszystkie odrębne wartości w wybranej kolumnie i procent wierszy w tabeli, które reprezentuje każda wartość. Profil może również zgłaszać wartości reprezentujące więcej niż określony procent wierszy w tabeli. Ten profil może pomóc w zidentyfikowaniu problemów w danych, takich jak nieprawidłowa liczba unikatowych wartości w kolumnie. Na przykład profilujesz kolumnę stanu Stany Zjednoczone i odnajdujesz więcej niż 50 odrębnych wartości.

Uwaga / Notatka

Opcje opisane w tym temacie są wyświetlane na stronie Żądania profiluw Edytorze zadań profilowania danych. Aby uzyskać więcej informacji na temat tej strony edytora, zobacz Edytor zadań profilowania danych (strona żądań profilu).

Aby uzyskać więcej informacji na temat korzystania z zadania profilowania danych, zobacz Konfigurowanie zadania profilowania danych. Aby uzyskać więcej informacji na temat używania przeglądarki profilów danych do analizowania danych wyjściowych zadania profilowania danych, zobacz Podgląd profilu danych.

Opcje właściwości żądania

W przypadku żądania profilu dystrybucji wartości kolumny okienko Właściwości żądania wyświetla następujące grupy opcji:

  • Dane, które obejmują opcje TableOrView i Column

  • Ogólne

  • Options

Opcje danych

Connectionmanager
Wybierz istniejącego menedżera połączeń ADO.NET, który używa dostawcy danych platformy .NET dla programu SQL Server (SqlClient), aby nawiązać połączenie z bazą danych programu SQL Server zawierającą tabelę lub widok do profilowania.

Tableorview
Wybierz istniejącą tabelę lub widok zawierający kolumnę do profilowania.

Aby uzyskać więcej informacji, zobacz sekcję "Opcje tableorView", w tym temacie.

Kolumna
Wybierz istniejącą kolumnę do profilowania. Wybierz (*), aby profilować wszystkie kolumny.

Aby uzyskać więcej informacji, zobacz sekcję "Opcje kolumny" w tym temacie.

Opcje TableOrView

schemat
Określa schemat, do którego należy wybrana tabela. Ta opcja jest tylko do odczytu.

tabela
Wyświetla nazwę wybranej tabeli. Ta opcja jest tylko do odczytu.

Opcje kolumn

IsWildCard
Określa, czy symbol wieloznaczny (*) został wybrany. Ta opcja jest ustawiona na True, jeśli wybrano (*) w celu profilowania wszystkich kolumn. To jest fałsz, jeśli wybrano profilowanie pojedynczej kolumny. Ta opcja jest tylko do odczytu.

ColumnName
Wyświetla nazwę wybranej kolumny. Ta opcja jest pusta, jeśli wybrano opcję (*) w celu profilowania wszystkich kolumn. Ta opcja jest tylko do odczytu.

StringCompareOptions
Wybierz opcje porównywania wartości ciągów. Ta właściwość zawiera opcje wymienione w poniższej tabeli. Wartość domyślna tej opcji to Wartość domyślna.

Uwaga / Notatka

Jeśli symbol wieloznaczny (*) jest używany dla ColumnName, CompareOptions jest tylko do odczytu i jest ustawiona na Domyślne.

Wartość Description
Wartość domyślna Sortuje i porównuje dane na podstawie sortowania kolumny w tabeli źródłowej.
BinarySort Sortuje i porównuje dane na podstawie wzorców bitów zdefiniowanych dla każdego znaku. Kolejność sortowania binarnego uwzględnia wielkość liter i uwzględnia akcent. Kolejność binarna jest również najszybszą metodą sortowania.
DictionarySort Sortuje i porównuje dane na podstawie reguł sortowania i porównywania zgodnie z definicją w słownikach dla skojarzonego języka lub alfabetu.

Jeśli wybierzesz pozycję SłownikSort, możesz również wybrać dowolną kombinację opcji wymienionych w poniższej tabeli. Domyślnie żadna z tych dodatkowych opcji nie jest zaznaczona.

Wartość Description
IgnoreCase Określa, czy porównanie rozróżnia wielkie i małe litery. Jeśli ta opcja jest ustawiona, porównanie ciągów ignoruje wielkość liter. Na przykład "ABC" staje się identyczne jak "abc".
IgnorujNonSpace Określa, czy porównanie rozróżnia odstępy między znakami i znakami diakrytycznymi. Jeśli ta opcja jest ustawiona, porównanie ignoruje znaki diakrytyczne. Na przykład znak "Ã¥" jest równy "a".
IgnoreKanaType Określa, czy porównanie rozróżnia dwa typy japońskich znaków kana: hiragana i katakana. Jeśli ta opcja jest ustawiona, porównanie ciągów ignoruje typ kana.
IgnorujSzerokość Określa, czy porównanie rozróżnia znak jednobajtowy i ten sam znak, gdy jest reprezentowany jako znak dwubajtowy. Jeśli ta opcja jest ustawiona, porównanie ciągów traktuje reprezentacje jednobajtowe i dwubajtowe tego samego znaku co identyczne.

Opcje ogólne

RequestID
Wpisz opisową nazwę, aby zidentyfikować to żądanie profilu. Zazwyczaj nie trzeba zmieniać automatycznie wygenerowanej wartości.

Opcje

ValueDistributionOption
Określ, czy ma być obliczana dystrybucja dla wszystkich wartości kolumn. Wartość domyślna tej opcji to FrequentValues.

Wartość Description
AllValues Rozkład jest obliczany dla wszystkich wartości kolumn.
Częste wartości Rozkład jest obliczany tylko dla wartości, których częstotliwość przekracza wartość minimalną określoną w właściwości FrequentValueThreshold. Wartości, które nie spełniają wartości FrequentValueThreshold , są wykluczone z raportu wyjściowego.

FrequentValueThreshold
Określ próg (przy użyciu wartości z zakresu od 0 do 1), powyżej której należy zgłosić wartość kolumny. Ta opcja jest wyłączona, gdy wybierzesz AllValues jako ValueDistributionOption. Wartość domyślna tej opcji to 0,001.

Zobacz też

Edytor zadań profilowania danych (strona ogólna)
Formularz szybkiego profilu dla jednej tabeli (Zadanie profilowania danych)