Scalanie przekształcenia liczby

Artykuł
05/06/2019

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
Dowiedz się więcej o Azure Machine Learning.

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Tworzy zestaw cech na podstawie tabeli counts

Kategoria: Edukacja z liczbami

Uwaga

Dotyczy: Machine Learning Studio (wersja klasyczna)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano, jak używać modułu Scalanie przekształć liczbę w programie Machine Learning Studio (wersja klasyczna) w celu połączenia dwóch zestawów funkcji opartych na liczbach. Scalając dwa zestawy powiązanych liczników i funkcji, można potencjalnie poprawić pokrycie i dystrybucję funkcji.

Edukacja z liczników jest szczególnie przydatne w dużych zestawach danych z funkcjami o wysokiej kardynalności. Możliwość łączenia wielu zestawów danych w zestawy funkcji opartych na liczbach bez konieczności ponownego przetwarzania zestawów danych ułatwia zbieranie statystyk dotyczących bardzo dużych zestawów danych i stosowanie ich do nowych zestawów danych. Na przykład tabele count mogą służyć do zbierania informacji o terabajtach danych. Możesz ponownie użyć tych statystyk, aby zwiększyć dokładność modeli predykcyjnych w małych zestawach danych.

Aby scalić dwa zestawy funkcji opartych na liczbach, cechy muszą zostać utworzone przy użyciu tabel, które mają ten sam schemat: to oznacza, że oba zestawy muszą używać tych samych kolumn i mieć te same nazwy i typy danych.

How to configure Merge Count Transform

Aby użyć przekształcenia scalania liczby, musisz utworzyć co najmniej jedno przekształcenie na podstawie liczby, a to przekształcenie musi być obecne w obszarze roboczym. Jeśli zapisano przekształcenie na podstawie liczby z innego eksperymentu, poszukaj w grupie Przekształcenia . Jeśli przekształcenie utworzono w bieżącym eksperymencie, połącz dane wyjściowe następujących modułów:
- Przekształcanie zliczania kompilacji. Tworzy nowe przekształcenie na podstawie liczby na podstawie danych źródłowych.
- Modyfikowanie parametrów zliczanych tabel. Przyjmuje istniejące przekształcenie liczby jako dane wejściowe i wyprowadza zaktualizowane przekształcenie.
- Importuj tabelę zliczania. Ten moduł obsługuje zgodność z poprzednimi wersjami ze starszymi eksperymentami, które używały uczenia opartego na liczbach. Jeśli do przeanalizowania rozkładu wartości w zestawie danych używasz tabeli zliczanych importów, a następnie przekonwertowano wartości na funkcje przy użyciu przestarzałego modułu Count Featurizer (Liczba cech), użyj funkcji Import Count Table (Importuj tabelę zliczania), aby przekonwertować wyniki na przekształcenie.
Dodaj moduł Merge Count Transform (Przekształć liczbę scalania) do eksperymentu i połącz przekształcenie z każdymi wejściami.

Porada

Drugie przekształcenie jest opcjonalnym elementem wejściowym — możesz połączyć to samo przekształcenie dwa razy lub połączyć się z niczym na drugim porcie wejściowym.
Jeśli nie chcesz, aby drugi zestaw danych był ważony równo z pierwszym, określ wartość dla współczynnika dekalii. Wpisana wartość wskazuje, jak powinien być ważony zestaw cech z drugiego przekształcenia.

Na przykład wartość domyślna 1 ustawia oba zestawy cech w równym stopniu. Wartość 0,5 oznacza, że cechy w drugim zestawie będą miały połowę wagi funkcji w pierwszym zestawie.
Opcjonalnie możesz dodać wystąpienie modułu Zastosuj transformację i zastosować przekształcenie do zestawu danych.

Przykłady

Przykłady sposobu, w jaki jest używany ten moduł, można znaleźć w Azure AI Gallery:

Edukacja z liczbami: Klasyfikacja binarna: pokazuje, jak używać uczenia z modułami counts do generowania funkcji z kolumn wartości kategorii dla binarnego modelu klasyfikacji.
Edukacja z counts: Multiclass classification with NYC taxi data (Klasyfikacja wieloklasowa z danymi taksówek w NYC): pokazuje, jak korzystać z modułów nauki z liczbami do wykonywania klasyfikacji wieloklasowej na publicznie dostępnym zestawie danych dotyczących taksówek w NYC. W przykładzie użyto wieloklasowej klasy uczenia regresji logistycznej do modelowania tego problemu.
Edukacja z liczbami: Klasyfikacja binarna z danymi dotyczących taksówek w NYC: pokazuje, jak używać modułów nauki z liczbami do przeprowadzania klasyfikacji binarnej na publicznie dostępnym zestawie danych dotyczących taksówek w NYC. W przykładzie użyto dwuklasowej klasy uczenia regresji logistycznej do modelowania problemu.

Oczekiwane dane wejściowe

Nazwa	Typ	Opis
Poprzednie przekształcenie zliczania	ITransform, interfejs	Przekształcenie zliczania do edycji
Nowe przekształcenie zliczania	ITransform, interfejs	Przekształcenie zliczania do dodania (opcjonalnie)

Parametry modułu

Nazwa	Typ	Zakres	Opcjonalne	Opis	Domyślny
Współczynnik rozkładu	Float		Wymagane	1,0f	Współczynnik rozkładu, który ma zostać pomnożony przez przekształcenie zliczania na odpowiednim porcie wejściowym

Dane wyjściowe

Nazwa	Typ	Opis
Scalone przekształcenie zliczania	ITransform, interfejs	Scalone przekształcenie

Wyjątki

Wyjątek	Opis
Błąd 0003	Wyjątek występuje, jeśli co najmniej jeden z wejść ma wartość null lub jest pusty.
Błąd 0086	Wyjątek występuje, gdy przekształcenie zliczania jest nieprawidłowe.

Zobacz też

Edukacja z liczbami

Udostępnij za pośrednictwem