Sdílet prostřednictvím


Import tabulky count (Počet importů)

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Importuje dříve vytvořenou tabulku počtů.

Kategorie: Učení s počty

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Přehled modulu

Tento článek popisuje, jak používat modul Import Count Table v Machine Learning Studiu (classic).

Účelem modulu Import Count Table (Tabulka počtu importů) je umožnit zákazníkům, kteří vytvořili tabulku statistik založených na počtu pomocí starší Machine Learning k upgradu experimentu. Tento modul sloučí existující tabulky počtu s novými daty.

Obecné informace o tabulkách počtu a způsobu jejich použití k vytváření funkcí najdete v Učení s počty.

Důležité

Tento modul je poskytován výhradně pro zpětnou kompatibilitu s experimenty, které používají zastaralou tabulku počtu sestavení a zastaralé moduly Count Featurizer. Pokud chcete využívat nové funkce, doporučujeme experiment upgradovat tak, aby se využily novější moduly.

Pro všechny nové experimenty doporučujeme použít následující moduly:

Jak nakonfigurovat tabulku importu počtu

  1. V Machine Learning Studio (classic) otevřete experiment, který obsahuje tabulku count vytvořenou pomocí zastaralého modulu Tabulka počtu sestavení.

  2. Přidejte do experimentu modul Import Count Table ( Importovat tabulku počtu).

  3. Připojení dva výstupy modulu Tabulka počtu sestavení (zastaralé) na odpovídající vstupní porty tabulky importu počtu.

    Pokud máte jinou datovou sadu počtů, které chcete sloučit s importovou tabulkou count, připojte ji k vstupu nejvíce vpravo pro modul Import Count Table (Importovat tabulku počtu).

  4. Pomocí možnosti Typ počtu určete, kde a jak se tabulka count uloží:

    • Datová sada: Data použitá k vytvoření počtů se uloží jako datová sada v Machine Learning Studiu (klasickém).

    • Objekt blob: Data použitá k počtům sestavení se ukládají jako objekt blob bloku Windows Azure Storage.

    • MapReduce: Data používaná k sestavení se ukládají jako objekt blob ve Windows Azure Storage.

      Tato možnost se obvykle upřednostní u velmi velkých datových sad. Pokud chcete získat přístup k počtům, musíte aktivovat cluster HDInsight. Spustí MapReduce úlohy, která provede počítání. Za obě tyto aktivity mohou být účtovány náklady na úložiště a výpočetní prostředky.

      Další informace najdete v tématu HDInsight v Azure.

    Po zadání režimu úložiště dat možná budete muset zadat další informace o připojení k datům, i když jste dříve pro přístup k datům použili modul Import dat v experimentu. Je to proto, že modul Count Featurizer (zastaralé) přistupuje k úložišti dat samostatně, aby mohl číst data a sestavovat požadované tabulky.

  5. Pomocí možnosti Typ tabulky Počet můžete určit formát a režim úložiště tabulky použité k ukládání počtů.

    • Slovník: Používá tabulku počtu slovníků.

      Všechny hodnoty sloupců ve vybraných sloupcích jsou považovány za řetězce a jsou zatřiďovány pomocí bitového pole o velikosti až 31 bitů. Proto jsou všechny hodnoty sloupců reprezentovány nezá záporným 32bitovým celým číslem.

    • CMSketch: Používá tabulku uloženou v tabulce minimálního náčrtu počtu.

      V tomto formátu se ke zlepšení efektivity paměti a omezení pravděpodobnosti kolize hodnot hash používá více nezávislých funkcí hash s menším rozsahem.

    Obecně platí, že byste měli použít možnost Slovník pro menší datové sady (<1 GB) a pro větší datové sady použít možnost CMSketch .

  6. Spusťte experiment.

  7. Po dokončení klikněte pravým tlačítkem na výstup modulu Import Count Table (Importovat tabulku počtu), vyberte Save as Transform (Uložit jako transformaci) a zadejte název transformace. V takovém případě se sloučené tabulky počtu a všechny parametry featurizace, které jste mohli použít, uloží ve formátu, který lze použít pro novou datovou sadu.

Příklady

Prozkoumejte příklady featurizace na základě počtu pomocí těchto ukázkových experimentů v Azure AI Gallery:

Poznámka

Všechny tyto experimenty v galerii byly vytvořeny pomocí předchozí verze a nyní jsou zastaralé verze modulu Učení s moduly Počty. Když experiment otevřete v nástroji Studio (classic), experiment se automaticky upgradune tak, aby se používají novější moduly.

Očekávané vstupy

Název Typ Description
Počet metadat Tabulka dat Metadata počtů
Tabulka count (Počet) Tabulka dat Tabulka count
Počítaná datová sada Tabulka dat Datová sada používaná pro počítání

Parametry modulu

Název Typ Rozsah Volitelné Výchozí Description
Typ počtu Typ počítání Vyžadováno Typ počtu

Výstupy

Název Typ Description
Transformace počtu ITransform – rozhraní Transformace počtu

Výjimky

Výjimka Description
Chyba 0003 K výjimce dochází v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdný.
Chyba 0018 K výjimce dochází v případě, že vstupní datová sada není platná.

Seznam chyb specifických pro moduly sady Studio (classic) najdete v Machine Learning kódy chyb.

Seznam výjimek rozhraní API najdete v tématu Machine Learning REST API kódy chyb.

Viz také

Učení s počty