Wybieranie przekształcenia kolumn
W tym artykule opisano sposób używania składnika Select Columns Transform w projektancie usługi Azure Machine Learning. Celem składnika Select Columns Transform jest zapewnienie, że przewidywalny, spójny zestaw kolumn jest używany w operacjach uczenia maszynowego podrzędnego.
Ten składnik jest przydatny w przypadku zadań, takich jak ocenianie, które wymagają określonych kolumn. Zmiany w dostępnych kolumnach mogą spowodować przerwanie potoku lub zmienić wyniki.
Użyj polecenia Select Columns Transform (Wybieranie przekształcenia kolumn), aby utworzyć i zapisać zestaw kolumn. Następnie użyj składnika Zastosuj transformację , aby zastosować te wybory do nowych danych.
Jak używać funkcji Select Columns Transform
W tym scenariuszu przyjęto założenie, że chcesz użyć wyboru funkcji do wygenerowania dynamicznego zestawu kolumn, które będą używane do trenowania modelu. Aby upewnić się, że wybory kolumn są takie same w procesie oceniania, należy użyć składnika Select Columns Transform (Wybieranie kolumn przekształcania kolumn), aby przechwycić wybrane kolumny i zastosować je w innym miejscu w potoku.
Dodaj wejściowy zestaw danych do potoku w projektancie.
Dodaj wystąpienie wyboru funkcji opartej na filtrze.
Połącz składniki i skonfiguruj składnik wyboru funkcji, aby automatycznie znaleźć wiele najlepszych funkcji w wejściowym zestawie danych.
Dodaj wystąpienie trenowania modelu i użyj danych wyjściowych opcji Wyboru funkcji opartej na filtrze jako danych wejściowych do trenowania.
Ważne
Ponieważ ważność funkcji jest oparta na wartościach w kolumnie, nie można z wyprzedzeniem wiedzieć, które kolumny mogą być dostępne dla danych wejściowych trenowania modelu.
Dołącz wystąpienie składnika Select Columns Transform (Przekształcanie kolumn).
Ten krok generuje wybór kolumn jako przekształcenie, które można zapisać lub zastosować do innych zestawów danych. Ten krok gwarantuje, że kolumny zidentyfikowane w zaznaczeniu funkcji zostaną zapisane w celu ponownego użycia innych składników.
Dodaj składnik Score Model (Generowanie wyników dla modelu ).
Nie należy łączyć wejściowego zestawu danych. Zamiast tego dodaj składnik Zastosuj transformację i połącz dane wyjściowe przekształcenia wyboru funkcji.
Struktura potoku powinna wyglądać następująco:
Ważne
Nie można oczekiwać zastosowania wyboru funkcji opartej na filtrze do zestawu danych oceniania i uzyskania tych samych wyników. Ponieważ wybór funkcji jest oparty na wartościach, może wybrać inny zestaw kolumn, co spowodowałoby niepowodzenie operacji oceniania.
Prześlij potok.
Ten proces zapisywania, a następnie stosowania zaznaczenia kolumny gwarantuje, że ten sam schemat danych jest dostępny do trenowania i oceniania.
Następne kroki
Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.