Zadat komponentu Data ručně

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Pomocí komponenty Zadat data ručně vytvořte malou datovou sadu zadáním hodnot. Datová sada může mít více sloupců.

Tato komponenta může být užitečná v těchto scénářích:

  • Generování malé sady hodnot pro testování
  • Vytvoření krátkého seznamu popisků
  • Zadání seznamu názvů sloupců pro vložení do datové sady

Vytvoření datové sady

  1. Přidejte do kanálu komponentu Zadat data ručně . Tuto komponentu najdete v kategorii Vstup a výstup dat ve službě Azure Machine Learning.

  2. V části DataFormat vyberte jednu z následujících možností. Tyto možnosti určují, jak se mají zadávat data, která chcete analyzovat. Požadavky na jednotlivé formáty se výrazně liší, proto si nezapomeňte přečíst související témata.

    • ARFF: Formát souboru s relací atributů, který weka používá.
    • CSV: Formát hodnot oddělených čárkami. Další informace najdete v tématu Převod na csv.
    • SVMLight: Formát používaný Vowpal Wabbitem a dalšími architekturami strojového učení.
    • TSV: Formát hodnot oddělených tabulátory

    Pokud zvolíte formát a neposkytnete data, která splňují specifikace formátu, dojde k chybě za běhu.

  3. Kliknutím do textového pole Data začněte zadávat data. Zvláštní pozornost vyžadují následující formáty:

    • CSV: Pokud chcete vytvořit více sloupců, vložte text oddělený čárkami nebo zadejte více sloupců pomocí čárek mezi poli.

      Pokud vyberete možnost HasHeader , můžete jako záhlaví sloupce použít první řádek hodnot.

      Pokud výběr této možnosti zrušíte, použijí se názvy sloupců (Col1, Col2 atd.). Názvy sloupců můžete přidat nebo změnit později pomocí možnosti Upravit metadata.

    • TSV: Pokud chcete vytvořit více sloupců, vložte text oddělený tabulátory nebo zadejte více sloupců pomocí tabulátorů mezi poli.

      Pokud vyberete možnost HasHeader , můžete jako záhlaví sloupce použít první řádek hodnot.

      Pokud výběr této možnosti zrušíte, použijí se názvy sloupců (Col1, Col2 atd.). Názvy sloupců můžete přidat nebo změnit později pomocí možnosti Upravit metadata.

    • ARFF: Vložte existující soubor formátu ARFF. Pokud zadáváte hodnoty přímo, nezapomeňte na začátek dat přidat volitelná pole hlaviček a požadovaných atributů.

      Do jednoduchého seznamu lze například přidat následující řádky záhlaví a atributu. Záhlaví sloupce by bylo SampleText. Všimněte si, že typ String se nepodporuje.

      % Title: SampleText.ARFF  
      % Source: Enter Data component  
      @ATTRIBUTE SampleText NUMERIC  
      @DATA  
      \<type first data row here>  
      
    • SVMLight: Zadejte nebo vložte hodnoty pomocí formátu SVMLight.

      Například následující ukázka představuje prvních pár řádků datové sady Darování krve ve formátu SVMLight:

      # features are [Recency], [Frequency], [Monetary], [Time]  
      1 1:2 2:50 3:12500 4:98   
      1 1:0 2:13 3:3250 4:28   
      

      Při spuštění komponenty Zadat data ručně se tyto řádky převedou na datovou sadu sloupců a indexových hodnot následujícím způsobem:

      Sloupec 1 Sloupec 2 Sloupec 3 Sloupec 4 Popisky
      0.00016 0.004 0.999961 0.00784 1
      0 0.004 0.999955 0.008615 1
  4. Stisknutím klávesy Enter za každým řádkem začněte nový řádek.

    Pokud několikrát vyberete Enter a přidáte více prázdných koncových řádků, prázdné řádky se odeberou nebo oříznou.

    Pokud vytvoříte řádky s chybějícími hodnotami, můžete je kdykoli později vyfiltrovat.

  5. Připojte výstupní port k jiným komponentám a spusťte kanál.

    Pokud chcete datovou sadu zobrazit, klikněte pravým tlačítkem na komponentu a vyberte Vizualizovat.

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.