Udostępnij za pośrednictwem


Modyfikowanie parametrów zliczanych tabel

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Modyfikuje parametry używane do tworzenia funkcji z liczników

Kategoria: Edukacja z liczbami

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób używania modułu Modyfikowanie parametrów tabeli liczby w programie Machine Learning Studio (wersja klasyczna) w celu zmiany sposobu generowania funkcji na podstawie tabeli zliczania.

Ogólnie rzecz biorąc, aby utworzyć funkcje oparte na liczbach, należy użyć funkcji Przekształcanie zliczania kompilacji do przetwarzania zestawu danych i tworzenia tabeli zliczania, a na podstawie tej tabeli zliczanej wygeneruj nowy zestaw funkcji.

Jeśli jednak utworzono już tabelę zliczaną, możesz użyć modułu Modyfikowanie parametrów tabeli zliczania, aby edytować definicję sposobu przetwarzania danych zliczania. Dzięki temu można utworzyć inny zestaw statystyk opartych na liczbach na podstawie istniejących danych bez konieczności ponownego analizowania zestawu danych.

Jak skonfigurować modyfikowanie parametrów liczby

  1. Znajdź przekształcenie, które chcesz zmodyfikować, w grupie Przekształcenia i dodaj je do eksperymentu.

    Wcześniej należy uruchomić eksperyment, który utworzył przekształcenie liczby.

    • Aby zmodyfikować zapisane przekształcenie: zlokalizuj przekształcenie w grupie Przekształcenia i dodaj je do eksperymentu.

    • Aby zmodyfikować przekształcenie liczby utworzone w ramach tego samego eksperymentu: jeśli przekształcenie nie zostało zapisane, ale jest dostępne jako dane wyjściowe w bieżącym eksperymencie (na przykład sprawdź dane wyjściowe modułu Przekształcanie zliczania kompilacji), możesz użyć go bezpośrednio, łącząc moduły.

  2. Dodaj moduł Modify Count Table Parameters (Modyfikowanie parametrów tabeli zliczania ) i połącz przekształcenie jako dane wejściowe.

  3. W okienku Właściwości modułu Modyfikowanie parametrów tabeli zliczaj wpisz wartość do użycia jako próg pojemnikaGarbage.

    Ta wartość określa minimalną liczbę wystąpień, które muszą zostać znalezione dla każdej wartości funkcji, aby można było użyć liczb. Jeśli częstotliwość wartości jest mniejsza niż próg kosza na śmieci, para etykiety wartości nie jest liczona jako dyskretny element; Zamiast tego wszystkie elementy z liczbami niższymi niż wartość progowa są umieszczane w jednym "koszu na śmieci".

    Jeśli używasz małego zestawu danych i zliczasz te same dane i trenujesz je, dobrą wartością początkową jest 1.

  4. W przypadku dodatkowych poprzednich przykładów przykładowych wpisz liczbę, która wskazuje liczbę dodatkowych przykładów pseudo do dołączyć. Nie musisz poświadczyć tych przykładów. Przykłady pseudo są generowane na podstawie wcześniejszego rozkładu.

  5. W przypadku skalowania szumów laplacji wpisz dodatnią wartość zmiennoprzecinkową, która reprezentuje skalę używaną do wprowadzania szumu próbkowania z rozkładu laplacian. W przypadku ustawienia wartości skalowania pewien akceptowalny poziom szumu jest uwzględniany w modelu, więc prawdopodobieństwo, że na model będzie mieć wpływ niezaznane wartości w danych, jest mniejsze.

  6. W opcji Funkcje danych wyjściowych wybierz metodę, która ma być stosowana podczas tworzenia funkcji opartych na liczbach, które mają być dołączane do przekształcenia.

    • CountsOnly: utwórz funkcje przy użyciu liczników.

    • LogOddsOnly: utwórz funkcje przy użyciu dziennika współczynnika prawdopodobieńszy.

    • BothCountsAndLogOdds: Tworzenie funkcji przy użyciu liczników i prawdopodobieńszy dziennika.

  7. Wybierz opcję Ignoruj kolumnę z powrotem , IsBackOff jeśli chcesz zastąpić flagę w danych wyjściowych podczas tworzenia funkcji. Po wybraniu tej opcji funkcje oparte na liczbach są tworzone nawet wtedy, gdy kolumna nie ma znaczących wartości zliczania.

  8. Uruchom eksperyment. Następnie możesz zapisać dane wyjściowe polecenia Modyfikuj liczbę parametrów tabeli jako nowe przekształcenie, jeśli to konieczne.

Przykłady

Przykłady tego modułu można znaleźć w Azure AI Gallery:

  • Edukacja z liczbami: Klasyfikacja binarna: pokazuje, jak używać modułów uczenia z liczbami do generowania funkcji na podstawie kolumn wartości kategorii dla binarnego modelu klasyfikacji.

  • Edukacja z liczbami: Klasyfikacja wieloklasowa z danymi taksówek w NYC:sample Przedstawia sposób użycia modułów uczenia z liczbami do wykonywania klasyfikacji wieloklasowej na publicznie dostępnym zestawie danych dotyczących taksówek w NYC. W przykładzie użyto wieloklasowej klasy uczenia regresji logistycznej do modelowania tego problemu.

  • Edukacja z liczbami: Klasyfikacja binarna z danymi taksówek w NYC: pokazuje, jak używać modułów uczenia się z liczbami do przeprowadzania klasyfikacji binarnej na publicznie dostępnym zestawie danych dotyczących taksówek w NYC. W przykładzie użyto dwuklasowej klasy uczenia regresji logistycznej do modelowania tego problemu.

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

W przypadku ustawienia parametru skalowania szumu laplacianego jest statystycznie bezpieczne zliczane i trenowanie na tym samym zestawie danych.

Oczekiwane dane wejściowe

Nazwa Typ Opis
Przekształcanie zliczania ITransform, interfejs Przekształcenie zliczania do zastosowania

Parametry modułu

Nazwa Typ Zakres Opcjonalne Domyślny Opis
Próg kosza na śmieci Float >= 0,0f Wymagane 10,0f Próg, w ramach którego wartość kolumny będzie cechowana względem kosza na śmieci
Dodatkowe wcześniejsze przykłady przykładów Float >= 0,0f Wymagane 42,0f Dodatkowe przykłady przykładów po poprzednich dystrybucjach, które mają zostać uwzględnione
Skala szumu laplacji Float >= 0,0f Wymagane 0,0f Skala rozkładu Laplacian, z którego próbkowane są szumy
Funkcje wyjściowe obejmują OutputFeatureType Wymagane BothCountsAndLogOdds Funkcje, które mają być wyprowadzane
Ignoruj kolumnę z powrotem Wartość logiczna Wymagane fałsz Czy zignorować kolumnę IsBackOff w danych wyjściowych

Dane wyjściowe

Nazwa Typ Opis
Zmodyfikowane przekształcenie ITransform, interfejs Zmodyfikowane przekształcenie

Wyjątki

Wyjątek Opis
Błąd 0003 Wyjątek występuje, jeśli co najmniej jeden z danych wejściowych ma wartość null lub jest pusty.
Błąd 0086 Wyjątek występuje, gdy przekształcenie zliczania jest nieprawidłowe.

Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kody błędów.

Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).

Zobacz też

Edukacja z liczbami