Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Dotyczy:programu SQL Server
Ważne
Usługi Data Quality Services (DQS) są usuwane w wersji zapoznawczej programu SQL Server 2025 (17.x). Nadal obsługujemy DQS w programie SQL Server 2022 (16.x) i starszych wersjach.
W tym temacie opisano sposób tworzenia zasady dopasowywania w bazie wiedzy w usługach Data Quality Services (DQS). Przygotowujesz się do procesu dopasowania w DQS, uruchamiając proces Dopasowywania Polityki na przykładowych danych. W tym działaniu utworzysz i przetestujesz co najmniej jedną regułę dopasowania w zasadach, a następnie opublikujesz bazę wiedzy, aby publicznie udostępnić zgodne reguły do użycia. W bazie wiedzy może istnieć tylko jedna zgodna zasada, ale ta zasada może zawierać wiele pasujących reguł.
Tworzenie pasujących zasad odbywa się w trzech etapach: proces mapowania, w którym można zidentyfikować źródło danych i zamapować domeny na kolumny, zgodny proces zasad, w którym tworzysz co najmniej jedną regułę dopasowania i testujesz poszczególne pasujące reguły oddzielnie, oraz proces dopasowywania wyników, w którym uruchamiasz wszystkie zgodne reguły razem, a jeśli je spełnisz, dodaj zasady do bazy wiedzy. Każdy z tych procesów jest wykonywany na oddzielnej stronie kreatora działania Dopasowywanie zasad, umożliwiając przechodzenie do różnych stron, ponowne uruchomienie procesu, zamknięcie określonego procesu dopasowywania zasad oraz powrót do tego samego etapu procesu. Po przetestowaniu wszystkich reguł razem, jeśli chcesz, możesz wrócić do strony Polityki Dopasowania, dostosować pojedynczą regułę, przetestować ją ponownie, a następnie wrócić do strony Wyników Dopasowania, aby ponownie uruchomić wszystkie reguły razem. DQS zapewnia statystyki dotyczące danych źródłowych, reguł dopasowania i wyników dopasowania, które umożliwiają podejmowanie świadomych decyzji dotyczących polityki dopasowania, aby można ją było udoskonalić.
Przed rozpoczęciem
Warunki wstępne
Program Microsoft Excel musi być zainstalowany na komputerze klienckim jakości danych, jeśli dane źródłowe są w pliku programu Excel. W przeciwnym razie nie będzie można wybrać pliku programu Excel na etapie mapowania. Pliki utworzone przez program Microsoft Excel mogą mieć rozszerzenie .xlsx, .xlslub .csv. Jeśli jest używana 64-bitowa wersja programu Excel, obsługiwane są tylko pliki programu Excel 2003 (.xls). Pliki programu Excel 2007 lub 2010 (.xlsx) nie są obsługiwane. Jeśli używasz 64-bitowej wersji programu Excel 2007 lub 2010, zapisz plik jako plik .xls lub plik .csv albo zainstaluj 32-bitową wersję programu Excel.
Bezpieczeństwo
Uprawnienia
Aby utworzyć zasady dopasowywania, musisz mieć rolę dqs_kb_editor lub dqs_administrator w bazie danych DQS_MAIN.
Jak ustawić pasujące parametry reguły
Tworzenie reguły dopasowania to proces iteracyjny, w którym należy wprowadzić czynniki używane do określenia, czy jeden rekord jest zgodny z innym. Możesz wprowadzić warunki dla dowolnej domeny w tabeli. Gdy DQS wykonuje dopasowywanie na dwóch rekordach, porównuje wartości w polach zamapowanych na domeny uwzględnione w regule dopasowania. DQS analizuje wartości w każdym polu reguły, a następnie używa czynników wprowadzonych w regule dla każdej domeny do obliczenia końcowego wyniku dopasowania. Jeśli wynik dopasowania dla dwóch porównywanych rekordów jest większy niż minimalny wynik dopasowania, dwa pola są uznawane za zgodne.
Czynniki wprowadzone w regule dopasowania obejmują następujące elementy:
Waga: Dla każdej domeny w regule wprowadź wartość liczbową, która określi, jak analiza dopasowania dla tej domeny będzie porównywana z analizą dla innych domen w regule. Waga wskazuje wkład wyniku pola w ogólny wynik dopasowania między dwoma rekordami. Obliczone wyniki przypisane do każdego pola źródłowego są sumowane razem dla złożonego wyniku dopasowania dla dwóch rekordów. Dla każdego pola, które nie jest wymogiem wstępnym (o dokładnym lub zbliżonym podobieństwie), ustaw wagę w przedziale od 10 do 100. Suma wag domen, które nie są wymaganiami wstępnymi, musi być równa 100. Jeśli wartość jest wymaganiem wstępnym, waga jest ustawiona na 0 i nie można jej zmienić.
Podobieństwo dokładne: Wybierz Dokładne, jeśli wartości w tym samym polu dwóch różnych rekordów muszą być identyczne, aby można je było uznać za zgodne. Jeśli jest taka sama, wynik dopasowania dla tej domeny zostanie ustawiony na "100", a DQS użyje tego wyniku i wyników dla innych domen w regule, aby określić zagregowany wynik dopasowania. Jeśli nie jest taka sama, wynik dopasowania dla tej domeny zostanie ustawiony na wartość "0", a przetwarzanie reguły przejdzie do następnego warunku. Jeśli skonfigurujesz regułę dopasowania dla domeny liczbowej i wybierzesz Podobne, możesz wprowadzić tolerancję jako wartość procentową lub liczbę całkowitą. W przypadku domeny typu data można wprowadzić tolerancję jako dzień, miesiąc lub rok (liczba całkowita), jeśli wybierzesz Podobne; nie ma tolerancji procentowej dla domeny daty. Jeśli wybierzesz Dokładne, nie masz tej opcji.
Podobieństwo: wybierz opcję Podobne, jeśli dwie wartości w tym samym polu dwóch różnych rekordów mogą być uznane za zgodne, nawet jeśli nie są identyczne. Gdy DQS uruchamia regułę, obliczy ona pasujący wynik dla tej domeny i użyje tego wyniku i wyników dla innych domen w regule, aby określić agregujący wynik dopasowania. Minimalna podobieństwo między wartościami pola wynosi 60%. Jeśli obliczony wynik dopasowania dla pola dwóch rekordów jest mniejszy niż 60, wynik podobieństwa zostanie automatycznie ustawiony na 0. Jeśli konfigurujesz regułę dopasowania dla pola liczbowego, a następnie wybierzesz pozycję Podobne, możesz wprowadzić tolerancję jako wartość procentową lub całkowitą. Jeśli konfigurujesz regułę dopasowania dla pola daty, a następnie wybierzesz pozycję Podobne, możesz wprowadzić tolerancję liczbową.
Wymaganie wstępne: wybierz Wymaganie wstępne, aby określić, że wartości w tym samym polu w dwóch różnych rekordach muszą zwrócić 100%% zgodności, inaczej rekordy nie są uznawane za pasujące, a inne klauzule w regule są ignorowane. Po wybraniu wymagania wstępne pole wagi dla domeny zostanie usunięte, aby nie można było zdefiniować wagi dla domeny. Należy zresetować co najmniej jedną wagę domeny, aby suma wag jest równa 100. Domeny wymagań wstępnych nie przyczyniają się do wyniku dopasowania rekordów. Wynik dopasowania rekordu jest określany przez porównanie wartości w polach, dla których właściwość Podobieństwo jest ustawiona na Wartość Podobna lub Dokładna. Gdy ustawisz pole jako prerekwizyt, Podobieństwo dla tej domeny jest automatycznie ustawiane na Dokładne.
Minimalny wynik dopasowania to próg, przy którym lub powyżej którego dwa rekordy są uznawane za dopasowane (a ich status jest ustawiany na "Dopasowane"). Wprowadź wartość całkowitą, zwiększając o 1, lub kliknij strzałkę w górę lub w dół, aby zwiększyć lub zmniejszyć wartość, zwiększając o 10. Wartość minimalna to 80. Jeśli pasujący wynik jest niższy niż 80, dwa rekordy nie są traktowane jako zgodne. Nie można zmienić zakresu minimalnej zgodnej oceny na tej stronie. Najniższy min. wynik dopasowania to 80. Możesz jednak zmienić najniższy minimalny wynik dopasowania na stronie Administracja (jeśli jesteś administratorem DQS).
Tworzenie reguły dopasowania jest procesem iteracyjnym, ponieważ może być konieczne dokonanie zmiany względnych wag domen w regule, dopasowania lub właściwości wymagań wstępnych dla domeny, lub minimalnego wyniku dla reguły, aby osiągnąć potrzebne rezultaty. Może się również okazać, że musisz utworzyć wiele reguł, z których każda zostanie uruchomiona w celu utworzenia zgodnego wyniku. Osiągnięcie potrzebnego wyniku może być trudne tylko z jedną regułą. Wiele reguł będzie dostarczać różne widoki wymaganego dopasowania. W przypadku wielu reguł może być możliwe uwzględnienie mniejszej liczby domen w każdej regule, użycie wyższych wag dla każdej domeny i uzyskanie lepszych wyników. Jeśli dane są mniej dokładne i mniej kompletne, może być konieczne użycie większej liczby reguł w celu znalezienia wymaganych dopasowań. Jeśli dane są dokładniejsze i kompletne, potrzebujesz mniejszej liczby reguł.
Profilowanie zapewnia szczegółowe informacje na temat kompletności i unikatowości. Rozważ kompletność i wyjątkowość w parze. Użyj danych o kompletności i unikatowości, aby określić, jaką wagę nadać polu w procesie dopasowywania. Jeśli w polu istnieje wysoki poziom unikatowości, użycie tego pola w polityce dopasowania może zmniejszyć wyniki dopasowania, dlatego warto ustawić wagę dla tego pola na stosunkowo małą wartość. Jeśli masz niski poziom unikatowości dla kolumny, ale niską kompletność, możesz nie chcieć dołączyć domeny dla tej kolumny. Przy niskim poziomie unikatowości, ale wysokim poziomie kompletności, należy uwzględnić domenę. Niektóre kolumny, takie jak płeć, mogą naturalnie mieć niski poziom unikatowości. Aby uzyskać więcej informacji, zobacz Profiler i karty wyników.
Pierwszy krok: rozpoczynanie stosowania polityki dopasowywania
Działanie dotyczące dopasowania polityki przeprowadzane jest w obszarze zarządzania bazą wiedzy w aplikacji Klient Jakości Danych.
Uruchom klienta jakości danych. Aby uzyskać informacje o tym, zobacz Uruchamianie aplikacji klienckiej jakości danych.
Na ekranie głównym Klienta jakości danych kliknij Nowa baza wiedzy, aby utworzyć pasujące zasady w nowej bazie wiedzy. Wprowadź nazwę bazy wiedzy, wprowadź opis i ustaw Utwórz bazę wiedzy z zgodnie z potrzebami. Kliknij Politykę Dopasowywania dla aktywności. Kliknij przycisk Dalej, aby kontynuować.
Kliknij Otwórz bazę wiedzy, aby utworzyć lub zmodyfikować pasujące zasady w istniejącej bazie wiedzy. Wybierz bazę wiedzy, wybierz Politykę dopasowania, a następnie kliknij Dalej. Możesz również kliknąć bazę wiedzy w obszarze Najnowsze bazy wiedzy. Jeśli otworzysz bazę wiedzy, która została zamknięta, gdy trwały prace nad zgodną polityką, przejdziesz do etapu, na którym zamknięto działania związane z tą polityką (co jest wskazane przez kolumnę Stan dla bazy wiedzy w tabeli bazy wiedzy lub w nazwie bazy wiedzy w obszarze Recent Knowledge Base). Jeśli otworzysz bazę wiedzy zawierającą politykę dopasowywania i która została zakończona, przejdziesz do strony Polityki Dopasowywania. Jeśli otworzysz bazę wiedzy, która nie zawiera pasujących zasad i została ukończona, przejdziesz do strony mapowania .
Etap mapowania
Na etapie mapowania określisz źródło danych, dla których zostaną utworzone pasujące zasady, i zamapujesz kolumny źródłowe na domeny, aby udostępnić domeny dla pasujących działań zasad.
Na stronie Mapuj, aby utworzyć politykę dla bazy danych, pozostaw Źródło danych jako SQL Server, wybierz bazę danych, dla której chcesz utworzyć politykę w Bazie danych, a następnie wybierz tabelę lub widok w Tabeli/Widoku. Źródłowa baza danych musi znajdować się w tym samym wystąpieniu programu SQL Server co serwer jakości danych. W przeciwnym razie nie będzie ona wyświetlana na liście rozwijanej.
Aby utworzyć politykę dla danych w arkuszu kalkulacyjnym programu Excel, wybierz plik programu Excel dla źródła danych, kliknij przycisk Przeglądaj, wybierz plik programu Excel i, jeśli to stosowne, pozostaw zaznaczoną opcję Użyj pierwszego wiersza jako nagłówka. W Arkuszwybierz arkusz w pliku programu Excel, który będzie źródłem danych. Program Microsoft Excel musi być zainstalowany na komputerze Data Quality Client, aby można było wybrać plik Excel. W przeciwnym razie przycisk Przeglądaj nie będzie dostępny i otrzymasz powiadomienie pod tym polem tekstowym, że program Microsoft Excel nie jest zainstalowany.
W obszarze Mapowaniawybierz pole dla kolumny źródłowej, a następnie kliknij ikonę Utwórz domenę.
W obszarze Mapowaniawybierz pole w źródle danych dla kolumny źródłowej, a następnie wybierz odpowiadającą domenę. Powtórz dla wszystkich domen używanych w procesie dopasowywania. W razie potrzeby utwórz domenę, klikając Utwórz domenę lub domenę złożoną Utwórz domenę złożoną.
Notatka
Dane źródłowe można mapować na domenę DQS podczas tworzenia pasujących zasad tylko wtedy, gdy typ danych źródłowych jest obsługiwany w DQS i pasuje do typu danych domeny DQS. Aby uzyskać informacje o obsługiwanych typach danych w programie DQS, zobacz Obsługiwane typy danych programu SQL Server i usług SSIS dla domen DQS.
Kliknij kontrolkę plus (+), aby dodać wiersz do tabeli Mapowania lub kontrolkę minus (-), aby usunąć wiersz.
Kliknij Podgląd źródła danych, aby wyświetlić dane w wybranej tabeli lub widoku serwera SQL Server, albo w wybranym arkuszu programu Excel.
Kliknij Widok/Wybierz domeny złożone, aby zobaczyć listę dostępnych domen złożonych w bazie wiedzy i odpowiednio je wybrać do mapowania.
Kliknij przycisk Dalej, aby przejść do etapu dopasowywania zasad.
Notatka
Kliknij Zamknij, aby zapisać etap pasującego projektu i wrócić do strony głównej DQS. Przy następnym otwarciu tego projektu rozpocznie się on od tego samego etapu. Kliknij przycisk Anuluj, aby zakończyć zgodne działanie, utracić pracę i wrócić do strony głównej DQS.
Etap dopasowywania polityki
Tworzysz reguły dopasowania i testujesz je indywidualnie na stronie Polityka dopasowywania. Podczas testowania reguły dopasowania na stronie Zasady Dopasowania zobaczysz tabelę wyników dopasowania, która pokazuje klastry, które DQS zidentyfikował dla wybranej reguły. W tabeli przedstawiono każdy rekord w klastrze z wartościami z domeny mapowania i wynikiem dopasowania oraz początkowym rekordem przestawnym dla klastra. Można również wyświetlać dane profilowania dla zgodnego procesu jako całości, warunki w każdej regule dopasowania i statystyki dotyczące wyników dla każdej zgodnej reguły oddzielnie. Możesz filtrować dane reguły głównej, które chcesz.
Aby uzyskać więcej informacji na temat działania pasujących reguł, zobacz Jak ustawić pasujące parametry reguły.
Na stronie Zasady dopasowywania kliknij ikonę Utwórz dopasowującą regułę.
Wprowadź nazwę i opis reguły.
Zwiększ wartość minimalną wyniku dopasowania, jeśli chcesz, aby wymagania dopasowania były bardziej rygorystyczne. Aby uzyskać więcej informacji o minimalnym wyniku dopasowania, zobacz How to Set Matching Rule Parameters (Jak ustawić pasujące parametry reguły).
Kliknij ikonę Dodaj nowy element domeny.
Wybierz domenę lub domenę złożoną, aby wprowadzić wartości reguł.
Notatka
Możesz wybrać domenę złożoną tylko wtedy, gdy każda pojedyncza domena w domenie złożonej została zamapowana na kolumnę źródłową.
W przypadku podobieństwawybierz opcję Podobne, jeśli dwie wartości w tym samym polu dwóch różnych rekordów mogą być uznane za zgodne, nawet jeśli nie są identyczne. Wybierz pozycję Dokładne, jeśli dwie wartości w tym samym polu w dwóch różnych rekordach muszą być identyczne, aby uznać je za zgodne. (Aby uzyskać więcej informacji, zobacz Jak ustawić parametry reguł dopasowywania.)
W przypadku wagawprowadź wartość, która określa wkład wyniku dopasowania domeny do ogólnego wyniku dopasowania dla dwóch rekordów.
Notatka
Podczas definiowania wagi dla domeny złożonej można wprowadzić inną wagę dla każdej domeny złożonej w domenie złożonej, w tym przypadku domena złożona nie ma oddzielnej wagi lub można wprowadzić pojedynczą wagę dla domeny złożonej, w której pojedyncze domeny w domenie złożonej nie mają oddzielnych wag.
Wybierz warunek wstępny, aby określić, że wartości pola w dwóch rekordach muszą zwrócić procentowe dopasowanie 100%, w przeciwnym razie rekordy nie są uznawane za zgodne, a pozostałe klauzule w regule są ignorowane. Jeśli podobieństwo jest podobne, zmieni się na dokładne, a waga zostanie usunięta, ponieważ dopasowanie musi wynosić 100%.
Powtórz kroki od 4 do 8 dla wszystkich innych domen, które będą częścią zgodnej reguły. Upewnij się, że suma wag dla wszystkich domen w regule wynosi 100.
Wybierz Nakładające się klastry z listy rozwijanej, aby wyświetlić rekordy przestawne i kolejne rekordy dla wszystkich klastrów podczas dopasowywania, nawet jeśli grupy klastrów mają wspólne rekordy. Wybierz pozycję Klastry nienakładujące się, aby wyświetlić klastry, które mają rekordy wspólne jako pojedynczy klaster podczas dopasowywania.
Kliknij przycisk Załaduj ponownie dane ze źródła, aby skopiować dane ze źródła do tabeli przejściowej i ponownie zaindeksować je podczas uruchamiania polityki dopasowania. Kliknij przycisk Wykonaj w odniesieniu do poprzednich danych, aby uruchomić pasującą zasadę bez kopiowania danych do tabeli przejściowej i ponownego indeksowania danych. Wykonaj na poprzednich danych jest wyłączona dla pierwszego uruchomienia polityki dopasowania lub jeśli zmienisz mapowanie na stronie mapy , a potem naciśnij Tak w poniższym oknie podręcznym. W obu tych przypadkach należy ponownie indeksować. Ponowne indeksowanie nie jest konieczne, jeśli pasujące zasady nie uległy zmianie. Wykorzystanie poprzednich danych może poprawić wydajność.
Kliknij Start, aby uruchomić proces dopasowywania dla wybranej reguły. Po zakończeniu procesu w tabeli są wyświetlane kolumny Identyfikator rekordu, Numer klastra i dane (w tym te, które nie są zgodne z regułą) dla każdego rekordu w klastrze. Wiersz przestawny w klastrze jest uważany za podstawowego kandydata do przetrwania procesu deduplikacji. Każdy dodatkowy wiersz w klastrze jest traktowany jako duplikat; jego pasujący wynik (w porównaniu z rekordem przestawnym) jest udostępniany w tabeli wyników. Numer klastra jest taki sam jak identyfikator rekordu dla rekordu przestawnego w klastrze.
Możesz pracować z danymi w tabeli Pasujących wyników w następujący sposób:
W filtruwybierz pozycję Dopasowane, aby wyświetlić wszystkie dopasowane wiersze i ich wynik. Wiersze, które nie są uznawane za dopasowania (które mają wynik dopasowania mniejszy niż minimalny wynik dopasowania), nie są wyświetlane w tabeli wyników dopasowań. Wybierz Niedopasowane, aby wyświetlić wszystkie niedopasowane wiersze, zamiast dopasowanych wierszy.
W polu listy rozwijanej procentowej wybierz wartość procentową z listy rozwijanej w przyrostach co 5 procent. Wszystkie wiersze z pasującym wynikiem, który jest większy lub równy tej wartości procentowej, zostaną wyświetlone w pasującej tabeli wyników.
Jeśli dwukrotnie klikniesz rekord w pasującej tabeli wyników, DQS wyświetli Szczegóły Wyniku Dopasowania w wyskakującym oknie, które pokazuje rekord przestawny i rekord źródłowy (oraz wartości we wszystkich ich polach), wynik oceny między nimi i przechodzenie do szczegółów dopasowania rekordu. W obszarze przechodzenia do szczegółów wyświetlane są wartości w każdym polu rekordu przestawnego i rekordu źródłowego, co pozwala na ich porównanie, oraz pokazany jest wynik dopasowania, do którego każde pole przyczynia się w kontekście całkowitego wyniku dopasowania dla dwóch rekordów.
Wyświetl statystyki na kartach Profiler i Pasujące wyniki, aby upewnić się, że uzyskujesz potrzebne wyniki. Aby uzyskać więcej informacji, zobacz Profiler i karty wyników.
Jeśli reguła musi zostać zmieniona, zmień ją w Edytorze reguł, a następnie kliknij przycisk Uruchom ponownie.
Notatka
Po zakończeniu pierwszej analizy przycisk Uruchom zmieni się na przycisk Uruchom ponownie. Jeśli wyniki poprzedniej analizy nie zostały jeszcze zapisane, kliknięcie Uruchom ponownie spowoduje utratę poprzednich danych. Gdy analiza jest uruchomiona, nie opuszczaj strony lub proces analizy zostanie zakończony.
Na karcie Wyniki dopasowania są wyświetlane statystyki dotyczące dwóch ostatnich uruchomień reguły. Jeśli reguła dopasowania jest uruchamiana więcej niż raz z różnymi ustawieniami, porównaj statystyki dla bieżącej reguły i poprzedniej reguły. Jeśli okaże się, że wyniki z poprzedniej reguły były lepsze, kliknij przycisk Przywróć poprzednią regułę, aby przywrócić warunki poprzedniej reguły, zwracając regułę do poprzedniego stanu przed edycją. Warunki reguły bieżącej zostaną utracone. Dzięki temu można dostroić zasady na podstawie dwóch ostatnich pasujących przebiegów, skracając czas, który poświęcasz na dostrajanie pasujących zasad.
Jeśli chcesz dodać kolejną regułę do pasujących zasad, powtórz krok 1.
Kliknij przycisk Dalej, aby przejść do pasującego etapu wyników.
Etap dopasowania wyników
Przetestuj wszystkie swoje reguły dopasowania jednocześnie na stronie Wyników Dopasowania. Zanim to zrobisz, możesz określić, czy przebieg testu reguły powinien identyfikować klastry nakładające się lub niepokrywające się. Jeśli reguły są uruchamiane wiele razy, możesz wykonać regułę na danych przeładowanych ze źródła lub na poprzednich danych.
Podczas testowania reguł dopasowywania na stronie Rezultatów dopasowywania zostanie wyświetlona tabela wyników dopasowywania, która pokazuje klastry zidentyfikowane przez DQS dla wszystkich reguł. W tabeli przedstawiono każdy rekord w klastrze z wartościami z domeny mapowania i wynikiem dopasowania oraz początkowym rekordem przestawnym dla klastra. Możesz również wyświetlić dane profilowania dla reguł dopasowania jako całości, warunki w każdej regule dopasowania i statystyki dotyczące wyników dla wszystkich pasujących reguł.
Na stronie Pasujące wyniki wybierz pozycję Nakładające się klastry z listy rozwijanej, aby wyświetlić rekordy główne i kolejne rekordy dla wszystkich klastrów podczas dopasowywania, nawet jeśli klastry mają wspólne rekordy. Wybierz pozycję Klastry nienakładujące się, aby wyświetlić klastry, które mają rekordy wspólne jako pojedynczy klaster podczas dopasowywania.
Kliknij przycisk Załaduj ponownie dane ze źródła, aby skopiować dane ze źródła do tabeli przejściowej i ponownie zaindeksować je podczas uruchamiania polityki dopasowania. Kliknij przycisk Wykonaj w odniesieniu do poprzednich danych, aby uruchomić pasującą zasadę bez kopiowania danych do tabeli przejściowej i ponownego indeksowania danych. Wykonaj na poprzednich danych jest wyłączona dla pierwszego uruchomienia polityki dopasowania lub jeśli zmienisz mapowanie na stronie mapy , a potem naciśnij Tak w poniższym oknie podręcznym. W obu tych przypadkach należy ponownie indeksować. Ponowne indeksowanie nie jest konieczne, jeśli pasujące zasady nie uległy zmianie. Wykorzystanie poprzednich danych może poprawić wydajność.
Kliknij przycisk Uruchom, aby uruchomić proces dopasowywania dla wszystkich zdefiniowanych reguł. Tabela Wyniki dopasowania wyświetla identyfikator rekordu, numer klastra oraz kolumny danych (w tym te, które nie są uwzględnione w regule dopasowania) dla każdego rekordu w klastrze. Rekord wiodący w klastrze jest wybierany losowo. (Rekord przetrwały jest określany przez wybranie reguły przetrwałości na stronie Eksport podczas uruchamiania projektu dopasowania). Każdy dodatkowy wiersz w klastrze jest traktowany jako duplikat; jego wynik dopasowania (w porównaniu z rekordem przestawnym) jest udostępniany w tabeli wyników.
Możesz pracować z danymi w tabeli Pasujących wyników w następujący sposób:
W filtruwybierz pozycję Dopasowane, aby wyświetlić wszystkie dopasowane wiersze i ich wynik. Wiersze, które nie są uznawane za dopasowania (które mają wynik dopasowania mniejszy niż minimalny wynik dopasowania), nie są wyświetlane w tabeli wyników dopasowań. Wybierz Niedopasowane, aby wyświetlić wszystkie niedopasowane wiersze, zamiast dopasowanych wierszy.
W polu listy rozwijanej procentowej wybierz wartość procentową z listy rozwijanej w przyrostach co 5 procent. Wszystkie wiersze z pasującym wynikiem, który jest większy lub równy tej wartości procentowej, zostaną wyświetlone w pasującej tabeli wyników.
Jeśli dwukrotnie klikniesz rekord w pasującej tabeli wyników, DQS wyświetli Szczegóły Wyniku Dopasowania w wyskakującym oknie, które pokazuje rekord przestawny i rekord źródłowy (oraz wartości we wszystkich ich polach), wynik oceny między nimi i przechodzenie do szczegółów dopasowania rekordu. W obszarze przechodzenia do szczegółów wyświetlane są wartości w każdym polu rekordu przestawnego i rekordu źródłowego, co pozwala na ich porównanie, oraz pokazany jest wynik dopasowania, do którego każde pole przyczynia się w kontekście całkowitego wyniku dopasowania dla dwóch rekordów.
Wyświetl statystyki na kartach Profiler i Pasujące wyniki, aby upewnić się, że uzyskujesz potrzebne wyniki. Kliknij kartę Reguły dopasowywania, aby zobaczyć, jakie są ustawienia domeny dla każdej reguły. Aby uzyskać więcej informacji, zobacz Profiler i karty wyników.
Jeśli wyniki wszystkich reguł nie są zadowalające, kliknij przycisk Wstecz, aby powrócić do strony Polityki dopasowania, zmodyfikuj jedną lub więcej reguł, wróć do strony Pasujących wyników, a następnie kliknij Uruchom ponownie.
Notatka
Po zakończeniu analizy przycisk Uruchom zmieni się na przycisk Uruchom ponownie. Jeśli wyniki poprzedniej analizy nie zostały jeszcze zapisane, kliknięcie Uruchom ponownie spowoduje utratę poprzednich danych.
Jeśli wyniki wszystkich reguł są zadowalające, kliknij przycisk Zakończ, aby dokończyć proces dopasowywania zasad, a następnie kliknij jedną z następujących opcji:
Tak — opublikuj bazę wiedzy i zakończ: baza wiedzy zostanie opublikowana dla bieżącego użytkownika lub innych użytkowników do użycia. Baza wiedzy nie zostanie zablokowana, a stan bazy wiedzy (w tabeli bazy wiedzy) zostanie ustawiony na pusty, a działania zarządzania domenami i odnajdywania wiedzy będą dostępne. Zostaniesz przekierowany na ekran Otwartej bazy wiedzy.
Nie — zapisz pracę w bazie wiedzy i zakończ: Praca zostanie zapisana, baza wiedzy pozostanie zablokowana, a stan bazy wiedzy zostanie ustawiony na W pracy. Dostępne będą zarówno działania zarządzania domeną, jak i odnajdywania wiedzy. Nastąpi powrót do strony głównej.
Anuluj – Pozostań na obecnym ekranie: Okno podręczne zostanie zamknięte i nastąpi powrót do ekranu Zarządzanie domenami.
Kliknij Zamknij, aby zapisać swoją pracę, a następnie wróć do strony głównej DQS. Stan bazy wiedzy będzie zawierać ciąg "Pasujące zasady — " i bieżący stan. Jeśli klikniesz Zamknij, gdy jesteś na ekranie Wynik dopasowania, w oknie stanu pojawi się napis: "Polityka dopasowania - Wyniki". Jeśli klikniesz przycisk zamknij, gdy znajdujesz się na ekranie Polityka Dopasowania, stan będzie wyświetlany: "Polityka Dopasowania - Polityka Dopasowania". Po kliknięciu Zamknij, aby wykonać działanie Odkrywanie wiedzy, należy powrócić do działania Zasady dopasowywania, kliknij Zakończ, a następnie kliknij Tak, aby opublikować bazę wiedzy lub Nie, aby zapisać pracę w bazie wiedzy i wyjść.
Notatka
Jeśli klikniesz przycisk Zamknij podczas uruchamiania zgodnego procesu, pasujący proces nie zakończy się po kliknięciu przycisku Zamknij. Możesz ponownie otworzyć bazę wiedzy i zobaczyć, że proces jest nadal uruchomiony lub jeśli został ukończony, zostaną wyświetlone wyniki. Jeśli proces nie został ukończony, ekran wyświetli postęp.
Kliknij przycisk Anuluj, aby zakończyć działanie zasad dopasowywania, tracąc dotychczasową pracę, i wrócić do strony głównej DQS.
Kontynuacja: po utworzeniu polityki dopasowania
Po utworzeniu pasujących zasad można uruchomić pasujący projekt na podstawie bazy wiedzy zawierającej pasujące zasady. Aby uzyskać więcej informacji, zobacz Run a Matching Project.
Karty Profiler i Wyniki
Karta Profilera i Wyników zawiera statystyki zarówno dla polityki dopasowywania, jak i stron wyników dopasowywania.
Karta Profilera
Kliknij kartę Profiler, aby wyświetlić statystyki dla źródłowej bazy danych i dla każdego pola zawartego w regule. Statystyki zostaną zaktualizowane w miarę uruchamiania reguły.
Aby uzyskać więcej informacji na temat interpretowania poniższych statystyk, zobacz Jak ustawić pasujące parametry reguły.
Statystyki źródłowej bazy danych obejmują następujące elementy:
Rekordy: całkowita liczba rekordów w źródłowej bazie danych
łączne wartości: całkowita liczba wartości w polach źródła danych
Nowe Wartości: całkowita liczba wartości, które są nowe od poprzedniego przebiegu, oraz ich procent całości
wartości unikatowe: całkowita liczba unikatowych wartości w polach i ich procent całości
nowe wartości unikatowe: całkowita liczba unikatowych wartości, które są nowe w polach, oraz ich procent całości
Statystyki pól obejmują następujące elementy:
nazwa pola
nazwa domeny
Nowy: liczba nowych wartości i procent nowych wartości w porównaniu z istniejącymi wartościami w domenie
Unikatowy: liczba unikatowych rekordów w polu i ich procent sumy
Kompletność: Kompletność każdego pola źródłowego, które jest mapowane do ćwiczenia dopasowywania
Dopasowane powiadomienia dotyczące zasad
W przypadku pasujących działań zasad następujące warunki powodują powiadomienia:
Pole jest puste we wszystkich rekordach; zaleca się wyeliminowanie go z mapowania.
Ocena kompletności pola jest bardzo niska; możesz rozważyć usunięcie go z mapowania.
Wszystkie wartości w polu są nieprawidłowe; należy zweryfikować mapowanie i trafność reguł domeny do zawartości pola.
W polu znajduje się niski poziom prawidłowych wartości; należy zweryfikować mapowanie i trafność reguł domeny do zawartości pola.
W tym polu istnieje wysoki poziom unikatowości. Użycie tego pola w zasadach dopasowywania może zmniejszyć wyniki dopasowywania.
Karta wyników dopasowań
Kliknij kartę Pasujące wyniki, aby wyświetlić statystyki dla wykonania zgodnej reguły oraz poprzedniego przebiegu tej reguły. Jeśli uruchomiono tę samą regułę więcej niż raz z różnymi parametrami, pasująca tabela wyników wyświetli statystyki dla obu przebiegów, co umożliwi ich porównanie. Możesz również przywrócić poprzednią regułę, jeśli chcesz.
Statystyki obejmują następujące elementy:
Całkowita liczba rekordów w bazie danych
Całkowita liczba pasujących rekordów w bazie danych
Liczba rekordów w bazie danych, które nie są uważane za duplikaty
Liczba odnalezionych klastrów
Średni rozmiar klastra (liczba zduplikowanych rekordów podzielonych przez liczbę klastrów)
Najmniejsza liczba duplikatów w klastrze
Największa liczba duplikatów w klastrze