Opcje żądania profilu dystrybucji wartości kolumny (zadanie profilowania danych)

Dotyczy:SQL Server SSIS Integration Runtime w ramach usługi Azure Data Factory

Użyj okienka Właściwości żądania na stronie Żądania profilu , aby ustawić opcje dla żądania profilu dystrybucji wartości kolumny wybranej w okienku żądań. Profil rozkładu wartości kolumny raportuje wszystkie odrębne wartości w wybranej kolumnie i procent wierszy w tabeli, które reprezentuje każda wartość. Profil może również zgłaszać wartości reprezentujące więcej niż określony procent wierszy w tabeli. Ten profil może pomóc w zidentyfikowaniu problemów w danych, takich jak nieprawidłowa liczba unikatowych wartości w kolumnie. Na przykład profilujesz kolumnę stanu Stany Zjednoczone i odnajdujesz więcej niż 50 odrębnych wartości.

Uwaga / Notatka

Opcje opisane w tym temacie są wyświetlane na stronie Żądania profiluw Edytorze zadań profilowania danych. Aby uzyskać więcej informacji na temat tej strony edytora, zobacz Edytor zadań profilowania danych (strona żądań profilu).

Aby uzyskać więcej informacji na temat korzystania z zadania profilowania danych, zobacz Konfigurowanie zadania profilowania danych. Aby uzyskać więcej informacji na temat używania przeglądarki profilów danych do analizowania danych wyjściowych zadania profilowania danych, zobacz Podgląd profilu danych.

Opcje właściwości żądania

W przypadku żądania profilu dystrybucji wartości kolumny okienko Właściwości żądania wyświetla następujące grupy opcji:

Dane, które obejmują opcje TableOrView i Column
Ogólne
Options

Opcje danych

Connectionmanager
Wybierz istniejącego menedżera połączeń ADO.NET, który używa dostawcy danych platformy .NET dla programu SQL Server (SqlClient), aby nawiązać połączenie z bazą danych programu SQL Server zawierającą tabelę lub widok do profilowania.

Tableorview
Wybierz istniejącą tabelę lub widok zawierający kolumnę do profilowania.

Aby uzyskać więcej informacji, zobacz sekcję "Opcje tableorView", w tym temacie.

Kolumna
Wybierz istniejącą kolumnę do profilowania. Wybierz (*), aby profilować wszystkie kolumny.

Aby uzyskać więcej informacji, zobacz sekcję "Opcje kolumny" w tym temacie.

Opcje TableOrView

schemat
Określa schemat, do którego należy wybrana tabela. Ta opcja jest tylko do odczytu.

tabela
Wyświetla nazwę wybranej tabeli. Ta opcja jest tylko do odczytu.

Opcje kolumn

IsWildCard
Określa, czy symbol wieloznaczny (*) został wybrany. Ta opcja jest ustawiona na True, jeśli wybrano (*) w celu profilowania wszystkich kolumn. To jest fałsz, jeśli wybrano profilowanie pojedynczej kolumny. Ta opcja jest tylko do odczytu.

ColumnName
Wyświetla nazwę wybranej kolumny. Ta opcja jest pusta, jeśli wybrano opcję (*) w celu profilowania wszystkich kolumn. Ta opcja jest tylko do odczytu.

StringCompareOptions
Wybierz opcje porównywania wartości ciągów. Ta właściwość zawiera opcje wymienione w poniższej tabeli. Wartość domyślna tej opcji to Wartość domyślna.

Uwaga / Notatka

Jeśli symbol wieloznaczny (*) jest używany dla ColumnName, CompareOptions jest tylko do odczytu i jest ustawiona na Domyślne.

Wartość	Description
Wartość domyślna	Sortuje i porównuje dane na podstawie sortowania kolumny w tabeli źródłowej.
BinarySort	Sortuje i porównuje dane na podstawie wzorców bitów zdefiniowanych dla każdego znaku. Kolejność sortowania binarnego uwzględnia wielkość liter i uwzględnia akcent. Kolejność binarna jest również najszybszą metodą sortowania.
DictionarySort	Sortuje i porównuje dane na podstawie reguł sortowania i porównywania zgodnie z definicją w słownikach dla skojarzonego języka lub alfabetu.

Jeśli wybierzesz pozycję SłownikSort, możesz również wybrać dowolną kombinację opcji wymienionych w poniższej tabeli. Domyślnie żadna z tych dodatkowych opcji nie jest zaznaczona.

Wartość	Description
IgnoreCase	Określa, czy porównanie rozróżnia wielkie i małe litery. Jeśli ta opcja jest ustawiona, porównanie ciągów ignoruje wielkość liter. Na przykład "ABC" staje się identyczne jak "abc".
IgnorujNonSpace	Określa, czy porównanie rozróżnia odstępy między znakami i znakami diakrytycznymi. Jeśli ta opcja jest ustawiona, porównanie ignoruje znaki diakrytyczne. Na przykład znak "Ã¥" jest równy "a".
IgnoreKanaType	Określa, czy porównanie rozróżnia dwa typy japońskich znaków kana: hiragana i katakana. Jeśli ta opcja jest ustawiona, porównanie ciągów ignoruje typ kana.
IgnorujSzerokość	Określa, czy porównanie rozróżnia znak jednobajtowy i ten sam znak, gdy jest reprezentowany jako znak dwubajtowy. Jeśli ta opcja jest ustawiona, porównanie ciągów traktuje reprezentacje jednobajtowe i dwubajtowe tego samego znaku co identyczne.

Opcje ogólne

RequestID
Wpisz opisową nazwę, aby zidentyfikować to żądanie profilu. Zazwyczaj nie trzeba zmieniać automatycznie wygenerowanej wartości.

Opcje

ValueDistributionOption
Określ, czy ma być obliczana dystrybucja dla wszystkich wartości kolumn. Wartość domyślna tej opcji to FrequentValues.

Wartość	Description
AllValues	Rozkład jest obliczany dla wszystkich wartości kolumn.
Częste wartości	Rozkład jest obliczany tylko dla wartości, których częstotliwość przekracza wartość minimalną określoną w właściwości FrequentValueThreshold. Wartości, które nie spełniają wartości FrequentValueThreshold , są wykluczone z raportu wyjściowego.

FrequentValueThreshold
Określ próg (przy użyciu wartości z zakresu od 0 do 1), powyżej której należy zgłosić wartość kolumny. Ta opcja jest wyłączona, gdy wybierzesz AllValues jako ValueDistributionOption. Wartość domyślna tej opcji to 0,001.

Zobacz też

Edytor zadań profilowania danych (strona ogólna)
Formularz szybkiego profilu dla jednej tabeli (Zadanie profilowania danych)

Last updated on 2026-01-22

Udostępnij przez