Wybieranie kolumn w składniku Zestawu danych

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Użyj tego składnika, aby wybrać podzestaw kolumn do użycia w operacjach podrzędnych. Składnik nie usuwa fizycznie kolumn ze źródłowego zestawu danych; Zamiast tego tworzy podzbiór kolumn, podobnie jak widok bazy danych lub projekcja.

Ten składnik jest przydatny, gdy konieczne jest ograniczenie kolumn dostępnych dla operacji podrzędnej lub zmniejszenie rozmiaru zestawu danych przez usunięcie niepotrzebnych kolumn.

Kolumny w zestawie danych są wyjściowe w tej samej kolejności co w oryginalnych danych, nawet jeśli określisz je w innej kolejności.

Sposób użycia

Ten składnik nie ma parametrów. Selektor kolumn służy do wybierania kolumn do uwzględnienia lub wykluczenia.

Wybieranie kolumn według nazwy

Istnieje wiele opcji w składniku do wybierania kolumn według nazwy:

  • Filtrowanie i wyszukiwanie

    Kliknij opcję BY NAME (WEDŁUG NAZWY ).

    Jeśli połączono zestaw danych, który został już wypełniony, powinna zostać wyświetlona lista dostępnych kolumn. Jeśli nie pojawią się żadne kolumny, może być konieczne uruchomienie składników nadrzędnych w celu wyświetlenia listy kolumn.

    Aby filtrować listę, wpisz w polu wyszukiwania. Jeśli na przykład wpiszesz literę w w polu wyszukiwania, lista zostanie przefiltrowana w celu wyświetlenia nazw kolumn zawierających literę w.

    Wybierz kolumny i kliknij przycisk strzałki w prawo, aby przenieść wybrane kolumny do listy w okienku po prawej stronie.

    • Aby wybrać ciągły zakres nazw kolumn, naciśnij klawisze Shift + Kliknij.
    • Aby dodać poszczególne kolumny do zaznaczenia, naciśnij klawisze Ctrl + Kliknij.

    Kliknij przycisk znacznika wyboru, aby zapisać i zamknąć.

  • Używanie nazw w połączeniu z innymi regułami

    Kliknij opcję WITH RULES (Z REGUŁAMI ).

    Wybierz regułę, taką jak pokazywanie kolumn określonego typu danych.

    Następnie kliknij poszczególne kolumny tego typu według nazwy, aby dodać je do listy wyboru.

  • Wpisz lub wklej rozdzielaną przecinkami listę nazw kolumn

    Jeśli zestaw danych jest szeroki, użycie indeksów lub wygenerowanych list nazw może być łatwiejsze, a nie pojedyncze wybieranie kolumn. Zakładając, że masz przygotowaną listę z wyprzedzeniem:

    1. Kliknij opcję WITH RULES (Z REGUŁAMI ).
    2. Wybierz pozycję Brak kolumn, wybierz pozycję Uwzględnij, a następnie kliknij wewnątrz pola tekstowego z czerwonym wykrzyknikiem.
    3. Wklej lub wpisz rozdzielaną przecinkami listę wcześniej zweryfikowanych nazw kolumn. Nie można zapisać składnika, jeśli jakakolwiek kolumna ma nieprawidłową nazwę, dlatego przedtem sprawdź nazwy.

    Można również użyć tej metody, aby określić listę kolumn przy użyciu ich wartości indeksu.

Wybierz według typu

Jeśli używasz opcji WITH RULES , możesz zastosować wiele warunków w zaznaczonych kolumnach. Na przykład może być konieczne pobranie tylko kolumn funkcji typu danych liczbowych.

Opcja BEGIN WITH określa punkt wyjścia i jest ważna w celu zrozumienia wyników.

  • Jeśli wybierzesz opcję WSZYSTKIE KOLUMNY, wszystkie kolumny zostaną dodane do listy. Następnie należy użyć opcji Wyklucz , aby usunąć kolumny spełniające określone warunki.

    Na przykład możesz zacząć od wszystkich kolumn, a następnie usunąć kolumny według nazwy lub według typu.

  • Jeśli wybierzesz opcję BRAK KOLUMN , lista kolumn zaczyna się pusta. Następnie należy określić warunki dodawania kolumn do listy.

    Jeśli stosujesz wiele reguł, każdy warunek jest addytywne. Załóżmy na przykład, że zaczynasz od braku kolumn, a następnie dodaj regułę, aby uzyskać wszystkie kolumny liczbowe. W zestawie danych Ceny samochodów wynikowe zawiera 16 kolumn. Następnie kliknij znak, aby dodać nowy warunek, a następnie wybierz pozycję Uwzględnij +wszystkie funkcje. Wynikowy zestaw danych zawiera wszystkie kolumny liczbowe oraz wszystkie kolumny funkcji, w tym kolumny funkcji ciągu.

Wybieranie według indeksu kolumn

Indeks kolumny odnosi się do kolejności kolumny w oryginalnym zestawie danych.

  • Kolumny są numerowane sekwencyjnie rozpoczynające się od 1.
  • Aby uzyskać zakres kolumn, użyj łącznika.
  • Specyfikacje otwarte, takie jak 1- lub -3 niedozwolone.
  • Zduplikowane wartości indeksu (lub nazwy kolumn) są niedozwolone i mogą spowodować błąd.

Załóżmy na przykład, że zestaw danych ma co najmniej osiem kolumn, możesz wkleić dowolny z poniższych przykładów, aby zwrócić wiele kolumn innych niż ciągłe:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

końcowy przykład nie powoduje błędu; zwraca jednak pojedyncze wystąpienie kolumny 4.

Zmienianie kolejności kolumn

Opcja Zezwalaj na duplikaty i zachowaj kolejność kolumn w zaznaczeniu rozpoczyna się od pustej listy i dodaje kolumny określone według nazwy lub indeksu. W przeciwieństwie do innych opcji, które zawsze zwracają kolumny w ich "kolejności naturalnej", ta opcja zwraca kolumny w kolejności, w jakiej je nazywasz lub wyświetlasz.

Na przykład w zestawie danych z kolumnami Col1, Col2, Col3 i Col4 można cofnąć kolejność kolumn i pozostawić kolumnę 2, określając jedną z następujących list:

  • Col4, Col3, Col1
  • 4,3,1

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.