Wybieranie przekształcenia kolumn

W tym artykule opisano sposób używania składnika Select Columns Transform w projektancie usługi Azure Machine Learning. Celem składnika Select Columns Transform jest zapewnienie, że przewidywalny, spójny zestaw kolumn jest używany w operacjach uczenia maszynowego podrzędnego.

Ten składnik jest przydatny w przypadku zadań, takich jak ocenianie, które wymagają określonych kolumn. Zmiany w dostępnych kolumnach mogą spowodować przerwanie potoku lub zmienić wyniki.

Użyj polecenia Select Columns Transform (Wybieranie przekształcenia kolumn), aby utworzyć i zapisać zestaw kolumn. Następnie użyj składnika Zastosuj przekształcenie , aby zastosować te wybory do nowych danych.

Jak używać funkcji Select Columns Transform

W tym scenariuszu przyjęto założenie, że chcesz użyć wyboru funkcji, aby wygenerować dynamiczny zestaw kolumn, który będzie używany do trenowania modelu. Aby upewnić się, że wybory kolumn są takie same dla procesu oceniania, należy użyć składnika Select Columns Transform (Wybieranie kolumn przekształcania kolumn), aby przechwycić wybrane kolumny i zastosować je w innym miejscu w potoku.

  1. Dodaj wejściowy zestaw danych do potoku w projektancie.

  2. Dodaj wystąpienie wyboru funkcji opartej na filtrze.

  3. Połącz składniki i skonfiguruj składnik wyboru funkcji, aby automatycznie znaleźć wiele najlepszych funkcji w wejściowym zestawie danych.

  4. Dodaj wystąpienie trenowania modelu i użyj danych wyjściowych funkcji opartej na filtrach jako danych wejściowych do trenowania.

    Ważne

    Ponieważ ważność funkcji jest oparta na wartościach w kolumnie, nie możesz wcześniej wiedzieć, które kolumny mogą być dostępne dla danych wejściowych dla trenowania modelu.

  5. Dołącz wystąpienie składnika Przekształcanie kolumn select.

    Ten krok generuje wybór kolumny jako przekształcenie, które można zapisać lub zastosować do innych zestawów danych. Ten krok gwarantuje, że kolumny zidentyfikowane w zaznaczeniu funkcji zostaną zapisane w celu ponownego użycia innych składników.

  6. Dodaj składnik Score Model (Generowanie wyników dla modelu ).

    Nie należy łączyć wejściowego zestawu danych. Zamiast tego dodaj składnik Zastosuj przekształcenie i połącz dane wyjściowe przekształcenia wyboru funkcji.

    Struktura potoku powinna wyglądać następująco:

    Przykładowy potok

    Ważne

    Nie można oczekiwać zastosowania wyboru funkcji opartej na filtrach do zestawu danych oceniania i uzyskania tych samych wyników. Ponieważ wybór funkcji jest oparty na wartościach, może wybrać inny zestaw kolumn, co spowodowałoby niepowodzenie operacji oceniania.

  7. Prześlij potok.

Ten proces zapisywania, a następnie stosowania zaznaczenia kolumny gwarantuje, że ten sam schemat danych jest dostępny do trenowania i oceniania.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.