Výběr sloupců v komponentě datové sady

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Pomocí této komponenty můžete zvolit podmnožinu sloupců, které se mají použít v podřízených operacích. Komponenta fyzicky neodebere sloupce ze zdrojové datové sady. místo toho vytvoří podmnožinu sloupců, podobně jako zobrazení nebo projekci databáze.

Tato komponenta je užitečná, když potřebujete omezit sloupce dostupné pro podřízenou operaci nebo pokud chcete zmenšit velikost datové sady odebráním nepotřebných sloupců.

Sloupce v datové sadě jsou výstupem ve stejném pořadí jako v původních datech, i když je zadáte v jiném pořadí.

Způsob použití

Tato komponenta nemá žádné parametry. Pomocí selektoru sloupců můžete zvolit sloupce, které chcete zahrnout nebo vyloučit.

Výběr sloupců podle názvu

V komponentě je několik možností pro výběr sloupců podle názvu:

  • Filtrování a vyhledávání

    Klikněte na možnost BY NAME .

    Pokud jste připojili datovou sadu, která už je naplněná, měl by se zobrazit seznam dostupných sloupců. Pokud se nezobrazí žádné sloupce, možná budete muset spustit upstreamové komponenty, aby se zobrazil seznam sloupců.

    Pokud chcete seznam filtrovat, zadejte do vyhledávacího pole. Pokud například zadáte písmeno w do vyhledávacího pole, v seznamu se vyfiltrují názvy sloupců, které obsahují písmeno w.

    Vyberte sloupce a kliknutím na tlačítko se šipkou doprava přesuňte vybrané sloupce do seznamu v pravém podokně.

    • Pokud chcete vybrat souvislou oblast názvů sloupců, stiskněte shift + kliknutí.
    • Pokud chcete do výběru přidat jednotlivé sloupce, stiskněte ctrl a kliknutí.

    Kliknutím na tlačítko zaškrtnutí je uložte a zavřete.

  • Použití názvů v kombinaci s jinými pravidly

    Klikněte na možnost S PRAVIDLY .

    Zvolte pravidlo, například zobrazení sloupců určitého datového typu.

    Potom klikněte na jednotlivé sloupce tohoto typu podle názvu a přidejte je do seznamu výběru.

  • Zadejte nebo vložte seznam názvů sloupců oddělených čárkami.

    Pokud je vaše datová sada široká, může být jednodušší použít indexy nebo vygenerované seznamy názvů, než vybírat sloupce jednotlivě. Za předpokladu, že jste seznam připravili předem:

    1. Klikněte na možnost S PRAVIDLY .
    2. Vyberte Žádné sloupce, vyberte Zahrnout a potom klikněte do textového pole s červeným vykřičníkem.
    3. Vložte nebo zadejte seznam dříve ověřených názvů sloupců oddělených čárkami. Pokud má některý sloupec neplatný název, nelze komponentu uložit, proto si názvy nezapomeňte zkontrolovat předem.

    Tuto metodu můžete použít také k určení seznamu sloupců pomocí hodnot jejich indexu.

Zvolit podle typu

Pokud použijete možnost S PRAVIDLY , můžete u výběru sloupců použít více podmínek. Můžete například potřebovat získat pouze sloupce funkce číselného datového typu.

Možnost ZAČÍT S určuje váš výchozí bod a je důležitá pro pochopení výsledků.

  • Pokud vyberete možnost VŠECHNY SLOUPCE , přidají se do seznamu všechny sloupce. Potom musíte použít možnost Vyloučit a odebrat sloupce, které splňují určité podmínky.

    Můžete například začít se všemi sloupci a pak odebrat sloupce podle názvu nebo typu.

  • Pokud vyberete možnost ŽÁDNÉ SLOUPCE , začne seznam sloupců prázdný. Pak zadáte podmínky pro přidání sloupců do seznamu.

    Pokud použijete více pravidel, každá podmínka bude sčítat. Řekněme například, že začnete bez sloupců a pak přidáte pravidlo pro získání všech číselných sloupců. Výsledkem je v datové sadě Automobile price (Cena automobilu) 16 sloupců. Potom kliknutím na znaménko + přidáte novou podmínku a vyberete Zahrnout všechny funkce. Výsledná datová sada obsahuje všechny číselné sloupce a také všechny sloupce funkcí, včetně některých sloupců s funkcemi řetězců.

Zvolit podle indexu sloupce

Index sloupce odkazuje na pořadí sloupce v původní datové sadě.

  • Sloupce se číslují postupně počínaje číslem 1.
  • Pokud chcete získat rozsah sloupců, použijte spojovník.
  • Otevřené specifikace, jako 1- jsou nebo -3 , nejsou povoleny.
  • Duplicitní hodnoty indexů (nebo názvy sloupců) nejsou povoleny a mohou vést k chybě.

Například za předpokladu, že datová sada obsahuje alespoň osm sloupců, můžete vložit některý z následujících příkladů a vrátit více nesousežných sloupců:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

konečný příklad nemá za následek chybu; vrátí však jednu instanci sloupce 4.

Změna pořadí sloupců

Možnost Povolit duplicity a zachovat pořadí sloupců ve výběru začíná prázdným seznamem a přidává sloupce, které zadáte podle názvu nebo podle indexu. Na rozdíl od jiných možností, které vždy vrací sloupce v přirozeném pořadí, tato možnost vypíše sloupce v pořadí, ve kterém je pojmenujete nebo vypíšete.

Například v datové sadě se sloupci Col1, Col2, Col3 a Col4 můžete pořadí sloupců obrátit a vynechat sloupec 2 zadáním některého z následujících seznamů:

  • Col4, Col3, Col1
  • 4,3,1

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.