Udostępnij za pośrednictwem


Ręczne wprowadzanie danych

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Umożliwia wprowadzanie i edytowanie małych zestawów danych przez wpisywanie wartości

Kategoria: Przekształcanie/manipulowanie danymi

Uwaga

Dotyczy: Machine Learning Studio (wersja klasyczna)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób użycia modułu Enter Data Manually in Machine Learning Studio (classic) (Wprowadzanie danych ręcznie w programie Machine Learning Studio —model klasyczny) w celu utworzenia małego zestawu danych przez wpisanie wartości. Zestaw danych może mieć wiele kolumn.

Ten moduł może być przydatny w takich scenariuszach jak:

  • Generowanie małego zestawu wartości do testowania

  • Tworzenie krótkiej listy etykiet

  • Wprowadzanie wartości do użycia w operacji matematycznej Zastosuj

  • Określanie wartości zastępczych do użycia w zastąp wartości dyskretnych

  • Wpisywanie listy nazw kolumn do wstawienia do zestawu danych

Jak używać ręcznego wprowadzania danych

  1. Dodaj moduł Enter Data Manually ( Wprowadź dane ręcznie) do eksperymentu. Ten moduł można znaleźć w kategorii Dane wejściowe i Wyjściowe w programie Machine Learning Studio (wersja klasyczna).

  2. W przypadku formatu DataFormat wybierz jedną z następujących opcji. Te opcje określają sposób analizowania danych, które należy podać. Wymagania dotyczące poszczególnych formatów różnią się znacznie, dlatego należy przeczytać powiązane tematy.

    Jeśli wybierzesz format i nie pobędziesz danych spełniających specyfikacje formatu, wystąpi błąd czasu uruchomienia.

  3. Kliknij wewnątrz pola tekstowego Dane , aby rozpocząć wprowadzanie danych. Następujące formaty wymagają szczególnej uwagi:

    • CSV: aby utworzyć wiele kolumn, wklej tekst rozdzielany przecinkami lub wpisz wiele kolumn przy użyciu przecinków między polami.

      Jeśli wybierzesz opcję HasHeader , możesz użyć pierwszego wiersza wartości jako nagłówka kolumny.

      Jeśli ta opcja zostanie odznaczony, używane są nazwy kolumn Col1, Col2 i tak dalej. Nazwy kolumn można później dodawać lub zmieniać przy użyciu funkcji Edytuj metadane.

    • TSV: aby utworzyć wiele kolumn, wklej tekst rozdzielany tabulatorami lub wpisz wiele kolumn przy użyciu kart między polami.

      Jeśli wybierzesz opcję HasHeader , możesz użyć pierwszego wiersza wartości jako nagłówka kolumny.

      Jeśli ta opcja zostanie odznaczony, używane są nazwy kolumn Col1, Col2 i tak dalej. Nazwy kolumn można później dodawać lub zmieniać przy użyciu funkcji Edytuj metadane.

    • ARFF: wklej istniejący plik formatu ARFF. Jeśli wpisujesz wartości bezpośrednio, pamiętaj, aby dodać opcjonalne pola nagłówka i wymaganego atrybutu na początku danych.

      Na przykład następujące wiersze nagłówka i atrybutu można dodać do prostej listy. Nagłówek kolumny to SampleText.

      % Title: SampleText.ARFF  
      % Source: Enter Data module  
      @ATTRIBUTE SampleText STRING  
      @DATA  
      \<type first data row here>  
      
    • SVMLight: wpisz lub wklej wartości przy użyciu formatu SVMLight.

      Na przykład poniższy przykład przedstawia kilka pierwszych wierszy zestawu danych dodawania do krwi w formacie SVMight:

      # features are [Recency], [Frequency], [Monetary], [Time]  
      1 1:2 2:50 3:12500 4:98   
      1 1:0 2:13 3:3250 4:28   
      

      Po uruchomieniu modułu Enter Data Manually (Wprowadź dane ręcznie) te wiersze są konwertowane na zestaw danych kolumn i wartości indeksu w następujący sposób:

      Col1 Col2 Col3 Col4 Etykiety
      0.00016 0.004 0.999961 0.00784 1
      0 0.004 0.999955 0.008615 1
  4. Naciśnij klawisz ENTER po każdym wierszu, aby rozpocząć nowy wiersz.

    Pamiętaj, aby nacisnąć klawisz ENTER po ostatnim wierszu.

    Jeśli wielokrotnie naciśniesz klawisz ENTER, aby dodać wiele pustych wierszy końcowych, ostatni pusty wiersz zostanie usunięty, ale inne puste wiersze będą traktowane jako brakujące wartości.

    Jeśli utworzysz wiersze z brakującymi wartościami, zawsze możesz je później odfiltrować.

  5. Kliknij prawym przyciskiem myszy moduł i wybierz pozycję Uruchom wybraną, aby analizowanie danych i ładowanie ich do obszaru roboczego jako zestawu danych.

    Aby wyświetlić zestaw danych, kliknij port wyjściowy i wybierz pozycję Visualize (Wizualizacja).

Przykłady

Aby uzyskać przykłady dotyczące sposobu, w jaki ten moduł jest używany w uczeniu maszynowym, zobacz Azure AI Gallery:

  • Pobierz przykładowe dane: pobiera dane z repozytorium UCI Machine Learning, a następnie używa klawisza Enter Data Manually do utworzenia nazw kolumn. Podano również przykładowy kod R, którego można użyć do scalenia wprowadzonych wierszy z zestawem danych.

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

  • Niezależnie od zapisanego formatu dane, które wprowadzasz, są niejawnie konwertowane na format zestawu danych (tabela danych) do użycia w eksperymentach. Jednak dane nie są utrwalane jako zapisany zestaw danych, chyba że jawnie wybierzesz opcję Zapisz jako zestaw danych.

    Jeśli nie zapiszemy danych w sekcji Wprowadź dane ręcznie jako zestaw danych, zostaną one usunięte z pamięci podręcznej obszaru roboczego po zakończeniu sesji. Możesz jednak ponownie uruchomić eksperyment, aby udostępnić dane.

  • Jeśli połączysz dane z sekcji Wprowadź dane ręcznie z innym zestawem danych, połączony zestaw danych nie może mieć dwóch kolumn o tej samej nazwie. Jeśli istnieją zduplikowane nazwy kolumn, do kolumny z prawego zestawu danych jest dołączany sufiks liczbowy, aby nazwy kolumn były unikatowe.

    Załóżmy na przykład, że masz dwa wystąpienia funkcji Enter Data Manually (Wprowadź dane ręcznie), które zawierają kolumnę TestData, i użyj modułu Add Columns (Dodaj kolumny), aby je scalić. Kolumna z lewego wystąpienia tabeli Enter Data Manually (Wprowadź dane ręcznie) pozostanie w kolumnie TestData, a kolumna z prawego wystąpienia tabeli Enter Data Manually (Wprowadź dane ręcznie) będzie miała nazwę TestData (2).

Zobacz też

Dane wejściowe i wyjściowe
Lista modułów A–Z