Udostępnij przez


Opcje żądania profilu zależności funkcjonalnych (zadanie profilowania danych)

Dotyczy:SQL Server SSIS Integration Runtime w ramach usługi Azure Data Factory

Użyj okienka Właściwości żądania na stronie Żądania profilu , aby ustawić opcje żądania profilu zależności funkcjonalnej wybrane w okienku żądań. Profil zależności funkcjonalnej zgłasza zakres, w jakim wartości w jednej kolumnie (kolumnie zależnej) zależą od wartości w innej kolumnie lub zestawie kolumn (kolumnie determinantnej). Ten profil może również pomóc w zidentyfikowaniu problemów w danych, takich jak nieprawidłowe wartości. Na przykład, profilujesz zależność między kolumną Kod pocztowy a kolumną stanu w Stanach Zjednoczonych. W tym profilu ten sam kod pocztowy powinien zawsze mieć ten sam stan, ale profil odnajduje naruszenia zależności.

Uwaga / Notatka

Opcje opisane w tym temacie są wyświetlane na stronie Żądania profiluw Edytorze zadań profilowania danych. Aby uzyskać więcej informacji na temat tej strony edytora, zobacz Edytor zadań profilowania danych (strona żądań profilu).

Aby uzyskać więcej informacji na temat korzystania z zadania profilowania danych, zobacz Konfigurowanie zadania profilowania danych. Aby uzyskać więcej informacji na temat używania przeglądarki profilów danych do analizowania danych wyjściowych zadania profilowania danych, zobacz Podgląd profilu danych.

Opis wyboru kolumn determinantnych i zależnych

Żądanie profilu zależności funkcjonalnej oblicza stopień, w jakim określana kolumna po stronie lub zestaw kolumn (określony we właściwości DeterminantColumns) określa wartość kolumny bocznej zależnej (określonej we właściwości DependencyColumn). Na przykład kolumna stanu w Stanach Zjednoczonych powinna być funkcjonalnie zależna od kolumny kodu ZIP Stanów Zjednoczonych. Oznacza to, że jeśli kod pocztowy (kolumna determinant) to 98052, stan (kolumna zależna) powinien zawsze być Stanem Waszyngton.

Dla strony determinatora można określić kolumnę lub zestaw kolumn we właściwości DeterminantColumns . Rozważmy na przykład przykładową tabelę zawierającą kolumny A, B i C. Dla właściwości DeterminantColumns należy wybrać następujące opcje:

  • Po wybraniu symbolu wieloznakowego (*) zadanie Profilowanie danych sprawdza każdą kolumnę jako determinantną stronę zależności.

  • Po wybraniu symbolu wieloznakowego (*) i innej kolumny zadanie profilowania danych sprawdza każdą kombinację kolumn jako determinantną stronę zależności. Rozważmy na przykład przykładową tabelę zawierającą kolumny A, B i C. Jeśli określisz wartość (*) i kolumnę C jako wartość właściwości DeterminantColumns , zadanie Profilowanie danych sprawdza kombinacje kombinacji (A, C) i (B, C) jako determinantną stronę zależności.

Po stronie zależnej można określić jedną kolumnę lub symbol wieloznaczny (*) we właściwości DependentColumn . Po wybraniu pozycji (*) zadanie Profilowanie danych sprawdza kolumny po stronie determinantów lub zestaw kolumn w odniesieniu do każdej kolumny.

Uwaga / Notatka

W przypadku wybrania opcji (*)ta opcja może spowodować dużą liczbę obliczeń i zmniejszyć wydajność zadania. Jeśli jednak zadanie znajdzie podzbiór spełniający próg zależności funkcjonalnej, zadanie nie analizuje dodatkowych kombinacji. Na przykład w przykładowej tabeli opisanej powyżej, jeśli zadanie określa, że kolumna C jest kolumną determinującą, zadanie przestaje analizować kandydatów złożonych.

Opcje właściwości żądania

W przypadku żądania profilu zależności funkcjonalnej w okienku Właściwości żądania są wyświetlane następujące grupy opcji:

  • Dane, które obejmują opcje DeterminantColumns i DependentColumn

  • Ogólne

  • Options

Opcje danych

Connectionmanager
Wybierz istniejącego menedżera połączeń ADO.NET, który używa dostawcy danych platformy .NET dla programu SQL Server (SqlClient), aby nawiązać połączenie z bazą danych programu SQL Server zawierającą tabelę lub widok do profilowania.

Tableorview
Wybierz istniejącą tabelę lub widok do profilowania.

DeterminantColumns
Wybierz kolumnę określającą lub zestaw kolumn. Oznacza to, że wybierz kolumnę lub zestaw kolumn, których wartości określają wartość kolumny zależnej.

Aby uzyskać więcej informacji, zobacz sekcje "Opis wyboru kolumn determinantnych i zależnych" oraz "Opcje kolumn determinantnych i zależnych" w tym temacie.

DependentColumn
Wybierz kolumnę zależną. Oznacza to, że wybierz kolumnę, której wartość zależy od wartości kolumny wyznacznika lub zestawu kolumn.

Aby uzyskać więcej informacji, zobacz sekcje "Opis wyboru kolumn determinantnych i zależnych" oraz "Opcje determinantne i zależne" w tym temacie.

Opcje kolumn wyznaczających i kolumny zależnej

Poniżej przedstawiono opcje dla każdej kolumny wybranej do profilowania w kolumnie DeterminantColumns i w kolumnie DependentColumn.

Aby uzyskać więcej informacji, zobacz sekcję "Understanding the Selection of Determinant and Dependent Columns" (Opis wyboru kolumn determinantnych i zależnych) we wcześniejszej części tego tematu.

IsWildCard
Określa, czy symbol wieloznaczny (*) został wybrany. Ta opcja jest ustawiona na True, jeśli wybrano (*) w celu profilowania wszystkich kolumn. To jest fałsz, jeśli wybrano profilowanie pojedynczej kolumny. Ta opcja jest tylko do odczytu.

ColumnName
Wyświetla nazwę wybranej kolumny. Ta opcja jest pusta, jeśli wybrano opcję (*) w celu profilowania wszystkich kolumn. Ta opcja jest tylko do odczytu.

StringCompareOptions
Wybierz opcje porównywania wartości ciągów. Ta właściwość zawiera opcje wymienione w poniższej tabeli. Wartość domyślna tej opcji to Wartość domyślna.

Uwaga / Notatka

Jeśli używasz symbolu wieloznakowego (*)dla kolumny ColumnName, funkcja CompareOptions jest tylko do odczytu i jest ustawiona na ustawienie Domyślne .

Wartość Description
Wartość domyślna Sortuje i porównuje dane na podstawie sortowania kolumny w tabeli źródłowej.
BinarySort Sortuje i porównuje dane na podstawie wzorców bitów zdefiniowanych dla każdego znaku. Kolejność sortowania binarnego uwzględnia wielkość liter i uwzględnia akcent. Kolejność binarna jest również najszybszą metodą sortowania.
DictionarySort Sortuje i porównuje dane na podstawie reguł sortowania i porównywania zgodnie z definicją w słownikach dla skojarzonego języka lub alfabetu.

Jeśli wybierzesz pozycję SłownikSort, możesz również wybrać dowolną kombinację opcji wymienionych w poniższej tabeli. Domyślnie żadna z tych dodatkowych opcji nie jest zaznaczona.

Wartość Description
IgnoreCase Określa, czy porównanie rozróżnia wielkie i małe litery. Jeśli ta opcja jest ustawiona, porównanie ciągów ignoruje wielkość liter. Na przykład "ABC" staje się identyczne jak "abc".
IgnorujNonSpace Określa, czy porównanie rozróżnia odstępy między znakami i znakami diakrytycznymi. Jeśli ta opcja jest ustawiona, porównanie ignoruje znaki diakrytyczne. Na przykład znak "Ã¥" jest równy "a".
IgnoreKanaType Określa, czy porównanie rozróżnia dwa typy japońskich znaków kana: hiragana i katakana. Jeśli ta opcja jest ustawiona, porównanie ciągów ignoruje typ kana.
IgnorujSzerokość Określa, czy porównanie rozróżnia znak jednobajtowy i ten sam znak, gdy jest reprezentowany jako znak dwubajtowy. Jeśli ta opcja jest ustawiona, porównanie ciągów traktuje reprezentacje jednobajtowe i dwubajtowe tego samego znaku co identyczne.

Opcje ogólne

RequestID
Wpisz opisową nazwę, aby zidentyfikować to żądanie profilu. Zazwyczaj nie trzeba zmieniać automatycznie wygenerowanej wartości.

Opcje

UstawienieProgu
Określ ustawienie progu. Wartość domyślna tej właściwości to Określona.

Wartość Description
Brak Nie określa progu. Siła zależności funkcjonalnej jest zgłaszana niezależnie od jej wartości.
Określony Użyj progu określonego w FDStrengthThreshold. Siła zależności funkcjonalnej jest zgłaszana tylko wtedy, gdy jest większa niż próg.
Dokładny Nie określa progu. Siła zależności funkcjonalnej jest zgłaszana tylko wtedy, gdy zależność funkcjonalna między wybranymi kolumnami jest dokładna.

FDStrengthThreshold
Określ próg (przy użyciu wartości z zakresu od 0 do 1), powyżej której należy zgłosić siłę współzależności funkcjonalnej. Wartość domyślna tej właściwości to 0,95. Ta opcja jest włączona tylko wtedy, gdy Określony jest wybrany jako PrógUstawienia.

MaksymalnaLiczbaNaruszeń
Określ maksymalną liczbę naruszeń zależności funkcjonalnych do raportowania w danych wyjściowych. Wartość domyślna tej właściwości to 100. Ta opcja jest wyłączona, gdy Exact jest wybrane jako ustawienie progu.

Zobacz też

Edytor zadań profilowania danych (strona ogólna)
Formularz szybkiego profilu dla jednej tabeli (Zadanie profilowania danych)