Wybieranie kolumn w składniku zestawu danych
W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.
Ten składnik służy do wybierania podzestawu kolumn do użycia w operacjach podrzędnych. Składnik nie usuwa fizycznie kolumn ze źródłowego zestawu danych; Zamiast tego tworzy podzbiór kolumn, podobnie jak widok bazy danych lub projekcja.
Ten składnik jest przydatny, gdy trzeba ograniczyć kolumny dostępne dla operacji podrzędnej lub jeśli chcesz zmniejszyć rozmiar zestawu danych przez usunięcie niepotrzebnych kolumn.
Kolumny w zestawie danych są danymi wyjściowymi w takiej samej kolejności, jak w przypadku oryginalnych danych, nawet jeśli określisz je w innej kolejności.
Jak stosować
Ten składnik nie ma parametrów. Selektor kolumn służy do wybierania kolumn do uwzględnienia lub wykluczenia.
Wybieranie kolumn według nazwy
Istnieje wiele opcji w składniku do wybierania kolumn według nazwy:
Filtrowanie i wyszukiwanie
Kliknij opcję BY NAME (WEDŁUG NAZWY).
Jeśli zestaw danych został już wypełniony, powinna zostać wyświetlona lista dostępnych kolumn. Jeśli nie są wyświetlane żadne kolumny, może być konieczne uruchomienie składników nadrzędnych, aby wyświetlić listę kolumn.
Aby filtrować listę, wpisz w polu wyszukiwania. Jeśli na przykład wpiszesz literę
w
w polu wyszukiwania, lista zostanie przefiltrowana w celu wyświetlenia nazw kolumn zawierających literęw
.Wybierz kolumny i kliknij przycisk strzałki w prawo, aby przenieść wybrane kolumny do listy w okienku po prawej stronie.
- Aby wybrać ciągły zakres nazw kolumn, naciśnij Shift + Kliknij.
- Aby dodać poszczególne kolumny do zaznaczenia, naciśnij Ctrl + Kliknij.
Kliknij przycisk znacznika wyboru, aby zapisać i zamknąć.
Używanie nazw w połączeniu z innymi regułami
Kliknij opcję WITH RULES (Z REGUŁAMI).
Wybierz regułę, taką jak wyświetlanie kolumn określonego typu danych.
Następnie kliknij poszczególne kolumny tego typu według nazwy, aby dodać je do listy wyboru.
Wpisz lub wklej rozdzielaną przecinkami listę nazw kolumn
Jeśli zestaw danych jest szeroki, może być łatwiej używać indeksów lub wygenerowanych list nazw, zamiast wybierać kolumny indywidualnie. Zakładając, że lista jest przygotowana z wyprzedzeniem:
- Kliknij opcję WITH RULES (Z REGUŁAMI).
- Wybierz pozycję Brak kolumn, wybierz pozycję Dołącz, a następnie kliknij wewnątrz pola tekstowego z czerwonym wykrzyknikiem.
- Wklej lub wpisz rozdzielaną przecinkami listę wcześniej zweryfikowanych nazw kolumn. Nie można zapisać składnika, jeśli jakakolwiek kolumna ma nieprawidłową nazwę, dlatego pamiętaj, aby wcześniej sprawdzić nazwy.
Można również użyć tej metody, aby określić listę kolumn przy użyciu ich wartości indeksu.
Wybierz według typu
Jeśli używasz opcji Z REGUŁAMI , możesz zastosować wiele warunków w zaznaczonych kolumnach. Na przykład może być konieczne pobranie tylko kolumn funkcji typu danych liczbowych.
Opcja ROZPOCZNIJ OD określa punkt początkowy i jest ważna dla zrozumienia wyników.
Jeśli wybierzesz opcję WSZYSTKIE KOLUMNY, wszystkie kolumny zostaną dodane do listy. Następnie należy użyć opcji Wyklucz , aby usunąć kolumny spełniające określone warunki.
Na przykład możesz zacząć od wszystkich kolumn, a następnie usunąć kolumny według nazwy lub według typu.
Jeśli wybierzesz opcję BRAK KOLUMN , lista kolumn zaczyna się pusta. Następnie należy określić warunki dodawania kolumn do listy.
W przypadku zastosowania wielu reguł każdy warunek jest addytywne. Załóżmy na przykład, że zaczynasz od braku kolumn, a następnie dodajesz regułę, aby pobrać wszystkie kolumny liczbowe. W zestawie danych Automobile price (Cena samochodów) wynikiem jest 16 kolumn. Następnie kliknij + znak, aby dodać nowy warunek, i wybierz pozycję Uwzględnij wszystkie funkcje. Wynikowy zestaw danych zawiera wszystkie kolumny liczbowe oraz wszystkie kolumny funkcji, w tym niektóre kolumny funkcji ciągu.
Wybieranie według indeksu kolumn
Indeks kolumny odnosi się do kolejności kolumny w oryginalnym zestawie danych.
- Kolumny są numerowane sekwencyjnie rozpoczynające się od 1.
- Aby uzyskać zakres kolumn, użyj łącznika.
- Specyfikacje otwarte, takie jak
1-
lub-3
niedozwolone. - Zduplikowane wartości indeksu (lub nazwy kolumn) są niedozwolone i mogą powodować błąd.
Na przykład przy założeniu, że zestaw danych ma co najmniej osiem kolumn, możesz wkleić dowolny z poniższych przykładów, aby zwrócić wiele nieznajdących się kolumn:
8,1-4,6
1,3-8
1,3-6,4
końcowy przykład nie powoduje błędu; zwraca jednak pojedyncze wystąpienie kolumny 4
.
Zmienianie kolejności kolumn
Opcja Zezwalaj na duplikaty i zachowywanie kolejności kolumn w zaznaczeniu rozpoczyna się od pustej listy i dodaje kolumny określone według nazwy lub indeksu. W przeciwieństwie do innych opcji, które zawsze zwracają kolumny w ich "kolejności naturalnej", ta opcja zwraca kolumny w kolejności, w jakiej są one nazwane lub wyświetlone.
Na przykład w zestawie danych z kolumnami Col1, Col2, Col3 i Col4 można odwrócić kolejność kolumn i pozostawić kolumnę 2, określając jedną z następujących list:
Col4, Col3, Col1
4,3,1
Następne kroki
Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.