Převod na hodnoty indikátoru

Tento článek popisuje komponentu návrháře služby Azure Machine Učení.

Pomocí komponenty Convert to Indicator Values (Převést na hodnoty indikátoru) v Návrháři služby Azure Machine Učení můžete převést sloupce obsahující kategorické hodnoty na řadu sloupců binárního ukazatele.

Operace Převést na hodnoty ukazatele umožňuje převod dat kategorií na hodnoty ukazatele reprezentované binárními nebo více hodnotami. Tento proces je jedním z kroků předběžného zpracování dat, které se často používají pro klasifikační modely.

Tato komponenta také vypíše definici transformace použité k převodu na hodnoty ukazatele. Tuto transformaci můžete znovu použít u jiných datových sad, které mají stejné schéma, pomocí komponenty Použít transformaci .

Postup konfigurace převodu na hodnoty ukazatele

  1. Najděte hodnotu Převést na hodnoty ukazatele a přetáhněte ji do konceptu kanálu. Tuto komponentu najdete v kategorii Transformace dat.

    Poznámka:

    Před komponentou Convert to Indiciator Values můžete použít komponentu Upravit metadata a označit cílové sloupce jako kategorické.

  2. PřipojeníPřevést na komponentu Hodnoty ukazatele na datovou sadu obsahující sloupce, které chcete převést.

  3. Vyberte Upravit sloupec a zvolte jeden nebo více sloupců kategorií.

  4. Pokud chcete vypsat pouze nové logické sloupce, vyberte možnost Přepsat sloupce kategorií. Tento parametr je standardně vypnutý.

    Tip

    Pokud zvolíte možnost přepsání, zdrojový sloupec se ve skutečnosti neodstraní ani nezmění. Místo toho se vygenerují a zobrazí nové sloupce ve výstupní datové sadě a zdrojový sloupec zůstane dostupný v pracovním prostoru. Pokud potřebujete zobrazit původní data, můžete k přidání zdrojového sloupce kdykoli použít komponentu Přidat sloupce .

  5. Odešlete kanál.

Výsledky

Předpokládejme, že máte sloupec s skóre, který označuje, jestli má server vysokou, střední nebo nízkou pravděpodobnost selhání.

ID serveru Skóre selhání
10301 Nízká
10302 Střední
10303 Vysoká

Když použijete příkaz Převést na hodnoty ukazatele, návrhář převede jeden sloupec popisků na více sloupců obsahujících logické hodnoty:

ID serveru Skóre selhání – Nízké Skóre selhání – střední Skóre selhání – vysoké
10301 0 0 0
10302 0 1 0
10303 0 0 1

Jak převod funguje:

  • Ve sloupci Skóre selhání, který popisuje riziko, existují pouze tři možné hodnoty (Vysoká, Střední a Nízká) a žádné chybějící hodnoty. Takže se vytvoří přesně tři nové sloupce.

  • Nové sloupce indikátoru jsou pojmenované na základě záhlaví sloupců a hodnot zdrojového sloupce pomocí tohoto vzoru: <zdrojová> hodnota> sloupce a <dat.

  • V přesně jednom sloupci ukazatele by měla být hodnota 1 a 0 ve všech ostatních sloupcích indikátorů, protože každý server může mít pouze jedno rizikové hodnocení.

Teď můžete jako funkce v modelu strojového učení použít tři sloupce indikátorů.

Komponenta vrátí dva výstupy:

  • Datová sada výsledků: Datová sada se sloupci převedených hodnot ukazatele. Sloupce, které nejsou vybrány pro čištění, jsou také "předány".
  • Transformace hodnot ukazatele: Transformace dat použitá k převodu na hodnoty ukazatele, která se dá uložit do pracovního prostoru a použít na nová data později.

Použití operace uložených hodnot ukazatele na nová data

Pokud potřebujete často opakovat operace s hodnotami ukazatele, můžete uložit kroky manipulace s daty jako transformaci a znovu je použít se stejnou datovou sadou. To je užitečné, pokud je nutné často znovu importovat a pak vyčistit data, která mají stejné schéma.

  1. Přidejte do kanálu komponentu Použít transformaci .

  2. Přidejte datovou sadu, kterou chcete vyčistit, a připojte datovou sadu k pravému vstupnímu portu.

  3. Rozbalte skupinu Transformace dat v levém podokně návrháře. Vyhledejte uloženou transformaci a přetáhněte ji do kanálu.

  4. Připojení uloženou transformaci na levý vstupní port Použít transformaci.

    Když použijete uloženou transformaci, nemůžete vybrat sloupce, které se mají transformovat. Důvodem je to, že transformace byla definována a automaticky se vztahuje na datové typy zadané v původní operaci.

  5. Odešlete kanál.

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

Tipy k používání

  • Na sloupce indikátorů lze převést pouze sloupce, které jsou označené jako kategorické. Pokud se zobrazí následující chyba, je pravděpodobné, že některý z vybraných sloupců není kategorický:

    Chyba 0056: Sloupec s názvem <> sloupce není v povolené kategorii.

    Ve výchozím nastavení se většina sloupců řetězců zpracovává jako řetězcové funkce, takže je musíte explicitně označit jako kategorické pomocí funkce Upravit metadata.

  • Počet sloupců, které můžete převést na sloupce indikátorů, není nijak omezený. Vzhledem k tomu, že každý sloupec hodnot může přinést více sloupců indikátorů, můžete chtít převést a zkontrolovat jenom několik sloupců najednou.

  • Pokud sloupec obsahuje chybějící hodnoty, vytvoří se pro chybějící kategorii samostatný sloupec indikátoru s tímto názvem: <zdrojový sloupec> – Chybí.

  • Pokud sloupec, který převedete na hodnoty ukazatele, obsahuje čísla, musí být označený jako kategorický jako jakýkoli jiný sloupec funkce. Po dokončení se čísla považují za diskrétní hodnoty. Pokud máte například číselný sloupec s hodnotami MPG v rozsahu od 25 do 30, vytvoří se nový sloupec indikátoru pro každou diskrétní hodnotu:

    Značka Dálnice mpg -25 Dálnice mpg -26 Dálnice mpg -27 Dálniční mpg -28 Dálniční mpg -29 Dálnice mpg -30
    Contoso Cars 0 0 0 0 0 1
  • Abyste se vyhnuli přidávání příliš mnoha dimenzí do datové sady. Doporučujeme nejprve zkontrolovat počet hodnot ve sloupci a odpovídajícím způsobem data vyčíslit nebo kvantifikovat.

Další kroky

Podívejte se na sadu komponent dostupných pro Učení Azure Machine.