Transformace pro výběr sloupců

Tento článek popisuje, jak používat komponentu Select Columns Transform v návrháři služby Azure Machine Learning. Účelem komponenty Vybrat transformaci sloupců je zajistit, aby se v operacích podřízeného strojového učení používala předvídatelná a konzistentní sada sloupců.

Tato komponenta je užitečná pro úlohy, jako je bodování, které vyžadují konkrétní sloupce. Změny v dostupných sloupcích můžou narušit kanál nebo změnit výsledky.

Pomocí funkce Vybrat transformaci sloupců vytvoříte a uložíte sadu sloupců. Potom použijte komponentu Použít transformaci k použití těchto výběrů na nová data.

Jak používat transformaci Vybrat sloupce

Tento scénář předpokládá, že chcete použít výběr funkce k vygenerování dynamické sady sloupců, které budou použity pro trénování modelu. Chcete-li zajistit, aby výběry sloupců byly stejné pro proces bodování, použijete komponentu Vybrat transformaci sloupců k zachycení výběrů sloupců a jejich použití jinde v kanálu.

  1. Přidejte do kanálu v návrháři vstupní datovou sadu.

  2. Přidejte instanci výběru funkce na základě filtru.

  3. Připojte komponenty a nakonfigurujte komponentu pro výběr funkcí, abyste automaticky našli řadu nejlepších funkcí ve vstupní datové sadě.

  4. Přidejte instanci trénovacího modelu a jako vstup pro trénování použijte výstup výběru funkce na základě filtru .

    Důležité

    Vzhledem k tomu, že důležitost funkce je založená na hodnotách ve sloupci, nemůžete předem vědět, které sloupce můžou být k dispozici pro vstup do trénování modelu.

  5. Připojte instanci komponenty Vybrat transformaci sloupců.

    Tento krok vygeneruje výběr sloupce jako transformaci, kterou je možné uložit nebo použít u jiných datových sad. Tento krok zajistí, že sloupce identifikované při výběru funkce budou uloženy pro další komponenty, které se dají znovu použít.

  6. Přidejte komponentu Score Model (Skóre modelu ).

    Nepřipojíte vstupní datovou sadu. Místo toho přidejte komponentu Použít transformaci a připojte výstup transformace výběru funkce.

    Struktura kanálu by měla vypadat takto:

    Ukázkový kanál

    Důležité

    Nemůžete očekávat, že u bodovací datové sady použijete výběr funkce na základě filtru a získáte stejné výsledky. Vzhledem k tomu, že výběr funkce je založený na hodnotách, může zvolit jinou sadu sloupců, což by způsobilo selhání operace vyhodnocování.

  7. Odešlete kanál.

Tento proces uložení a následného použití výběru sloupce zajistí, že pro trénování a vyhodnocování bude k dispozici stejné schéma dat.

Další kroky

Projděte si sadu komponent dostupných pro Azure Machine Learning.