Udostępnij za pośrednictwem


Edytor transformacji rozmyte grupowania (karta kolumn)

Użyj kolumny karcie Edytor transformacji grupowania rozmyte okno dialogowe, aby określić kolumny używane do grupy wierszy z zduplikowane wartości.

Aby dowiedzieć się więcej o transformacja rozmyte grupowania, zobacz Przekształcenie grupowania rozmyte.

Opcje

  • Dostępne kolumny danych wejściowych
    Wybierz z listy wejściowe kolumn używanych do grupy wierszy z zduplikowane wartości.

  • Nazwa
    Wyświetlanie nazw dostępnych kolumn danych wejściowych.

  • Przekazywanie
    Wybierz, czy uwzględnić wprowadzania kolumna w danych wyjściowych transformacja.Wszystkie kolumny używane do grupowanie są automatycznie kopiowane do wyjścia.Sprawdzając ta kolumna może zawierać dodatkowe kolumny.

  • Kolumny danych wejściowych
    Wybierz jeden z wejściowych kolumny wybranej wcześniej w Dostępne kolumny danych wejściowych listy.

  • Alias wyjścia
    Wprowadź opisową nazwę odpowiedniej kolumna danych wyjściowych.Domyślnie nazwa kolumna danych wyjściowych jest taka sama jak nazwa kolumna danych wejściowych.

  • Aliasu grupy wyników
    Wprowadź opisową nazwę kolumna, która będzie zawierać wartość kanoniczny zgrupowanych duplikatów.Domyślną nazwą tej kolumna wyjociowej jest nazwa kolumna wejściowego z dołączonym _clean.

  • Typ dopasowania
    Wybierz rozmyte lub dokładne dopasowanie.Wiersze są uważane za duplikaty, jeżeli są one wystarczająco podobne we wszystkich kolumnach z typ dopasowania rozmyty.Jeśli określisz również dokładne dopasowywanie niektórych kolumn, tylko te wiersze, które zawierają identyczne wartości w kolumnach dokładnego dopasowania uważane są możliwe duplikaty.Dlatego, jeśli wiadomo, że niektóre kolumna nie zawiera błędy lub niezgodności, można określić dokładne dopasowywanie tej kolumna, aby zwiększyć dokładność dopasowywanie rozmyte na innych kolumnach.

  • Minimalne podobieństw
    Ustawić próg podobieństwa poziom łączyć za pomocą suwaka.Im bliżej wartością jest 1, im bliżej wynik wartość odnośnika do wartości źródło musi być w celu zakwalifikowania jako zgodne.Zwiększenie progu może przyspieszyć dopasowania, ponieważ uważane mniejsza liczba rekordów kandydata.

  • Alias wyjścia podobieństw
    Określ nazwę dla nowej kolumna Wyjście zawiera wyniki podobieństwa dla wybranego łączyć.Jeśli wartość ta pozostanie puste, kolumna Wyjście nie jest tworzony.

  • Cyfry
    Należy określić istotność początkowe i końcowe cyfry w porównywanie danych kolumna.Na przykład, jeśli wiodącymi cyframi są znaczące "123 głównej ulicy" nie będą zgrupowane z "456 głównej ulicy".

    Wartość

    Opis

    Ani

    Początkowe i końcowe cyfry nie są znaczące.

    Wiodące

    Tylko cyfry wiodące są znaczące.

    Końcowe

    Tylko cyfry końcowe są znaczące.

    LeadingAndTrailing

    Zarówno początkowe i końcowe cyfry są znaczące.

  • Porównanie flag
    Aby uzyskać informacje o ciąg Zobacz opcje porównywania Porównywanie danych String.