Udostępnij za pośrednictwem


Konwertowanie na wartości wskaźnika

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Konwertuje wartości kategorii w kolumnach na wartości wskaźników

Kategoria: Przekształcanie/manipulowanie danymi

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób używania modułu Konwertuj na wartości wskaźnika w programie Machine Learning Studio (wersja klasyczna). Celem tego modułu jest przekonwertowanie kolumn zawierających wartości kategorii na serię kolumn wskaźników binarnych, które mogą być łatwiej używane jako funkcje w modelu uczenia maszynowego.

How to configure Convert to Indicator Values

  1. Dodaj moduł Konwertuj na wartości wskaźnika do eksperymentu Machine Learning i połącz go z zestawem danych zawierającym kolumny, które chcesz przekonwertować. Ten moduł można znaleźć w obszarze Przekształcenia danych w kategorii Manipulowanie .

  2. Użyj selektora kolumn , aby wybrać co najmniej jedną kolumnę kategorii.

    Aby upewnić się, że wybrane kolumny są podzielone na kategorii, użyj opcji Edytuj metadane przed konwersją na wartości wskaźnika w eksperymencie, aby oznaczyć kolumnę docelową jako podzielone na grupy.

  3. Wybierz opcję Zastąp kolumny podzielone na kategorii, jeśli chcesz wyprowadzić tylko nowe kolumny logiczne.

    Domyślnie ta opcja jest wyłączona, co pozwala zobaczyć kolumnę kategorii, która jest źródłem, wraz z powiązanymi kolumnami wskaźników.

    Porada

    Jeśli wybierzesz opcję zastąpienia, kolumna źródłowa nie zostanie w rzeczywistości usunięta ani zmodyfikowana. Zamiast tego nowe kolumny są generowane i prezentowane w wyjściowym zestawie danych, a kolumna źródłowa pozostaje dostępna w obszarze roboczym. Jeśli chcesz zobaczyć oryginalne dane, możesz w dowolnym momencie użyć modułu Dodaj kolumny, aby ponownie dodać kolumnę źródłową.

  4. Uruchom eksperyment.

Wyniki

Załóżmy na przykład, że masz kolumnę z wynikami wskazującymi, czy serwer ma wysokie, średnie lub niskie prawdopodobieństwo awarii.

Identyfikator serwera Wynik niepowodzenia
10301 Niski
10302 Śred.
10303 Wys.

Po zastosowaniu opcji Konwertuj na wartości wskaźnika pojedyncza kolumna etykiet jest konwertowana na wiele kolumn zawierających wartości logiczne:

Identyfikator serwera Ocena niepowodzenia — niska Wynik niepowodzenia — średni Wynik niepowodzenia — wysoki
10301 1 0 0
10302 0 1 0
10303 0 0 1

Oto jak działa konwersja:

  • W kolumnie Ocena niepowodzenia , która opisuje ryzyko, istnieją tylko trzy możliwe wartości (Wysoki, Średni i Niski) i brak brakujących wartości. W związku z tym tworzone są dokładnie trzy nowe kolumny.

  • Nowe kolumny wskaźników są nazwane na podstawie nagłówków kolumn i wartości kolumny źródłowej przy użyciu tego wzorca: kolumna<> źródłowa — <wartość danych>.

  • We wszystkich pozostałych kolumnach wskaźników powinna być liczba 1 w dokładnie jednej kolumnie wskaźnika i 0. Wynika to z tego, że każdy serwer może mieć tylko jedną ocenę ryzyka.

Możesz teraz używać trzech kolumn wskaźników jako cech i analizować ich korelację z innymi właściwościami, które są skojarzone z innym poziomem ryzyka.

Przykłady

Aby zobaczyć przykłady sposobu, w jaki ten moduł jest używany, zobacz Azure AI Gallery:

  • Wykrywanie raka choroby: Pacjenci są rozkładani na grupy na podstawie numerów identyfikacyjnych pacjentów, a następnie wartości wskaźnika są używane do oznaczania grupy, do której należy pacjent. Później wskaźniki grupy są używane podczas oceniania modeli.

  • Marketing bezpośredni: Prawdopodobieństwa są porównywane ze stałą przy użyciu operacji matematycznych Zastosuj, a wartości Tak/Nie, które wskazują, czy wynik był powyżej, czy poniżej stałej, są przekształcone w nowe kolumny wskaźników.

  • Wykrywanie włamań do sieci: dane dziennika są ładowane z usługi Azure Storage. Zmienna klasy (która opisuje na przykład, jeśli atak jest zestawem głównym lub przepełnienie buforu) jest konwertowana na kolumnę kategorii, a następnie rozwijana do wielu wartości wskaźników.

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

Porady dotyczące użycia

  • Tylko kolumny oznaczone jako podzielone na kategorii można przekonwertować na kolumny wskaźników. Jeśli zostanie wyświetlony ten błąd, prawdopodobnie jedna z wybranych kolumn nie jest kategorii:

    Błąd 0056: Kolumna o nazwie nazwa <kolumny> nie należy do dozwolonej kategorii.

    Domyślnie większość kolumn ciągów jest obsługiwanych jako funkcje ciągów, dlatego należy jawnie oznaczyć je jako podzielone na grupy przy użyciu funkcji Edytuj metadane.

  • Jeśli nie wybierzesz co najmniej jednej kolumny kategorii, zostanie wyświetlony błąd.

  • Nie ma żadnego limitu liczby kolumn, które można przekonwertować na kolumny wskaźników. Jednak ze względu na to, że każda kolumna wartości może uzyskać wiele kolumn wskaźników, warto przekonwertować i przejrzeć tylko kilka kolumn jednocześnie.

  • Jeśli kolumna zawiera brakujące wartości, zostanie utworzona oddzielna kolumna wskaźnika dla brakującej kategorii o nazwie: kolumna< źródłowa> — Brak

  • Jeśli kolumna, która jest konwertowana na wartości wskaźnika, zawiera liczby, muszą być oznaczone jako podzielone na kategorii, tak jak każda inna kolumna funkcji. Po zakończeniu liczby są traktowane jako wartości dyskretne. Jeśli na przykład masz kolumnę liczbową z wartościami MPG z zakresu od 25 do 30, dla każdej odrębnej wartości zostanie utworzona nowa kolumna wskaźnika:

    Marka Highway mpg -25 Highway mpg -26 Highway mpg -27 Highway mpg -28 Highway mpg -29 Highway mpg -30
    Alfa Alfao 0 0 0 0 0 1

    Aby uniknąć uzyskania ogromnej liczby kolumn wskaźników, zalecamy, aby najpierw sprawdzić liczbę wartości w kolumnie i odpowiednio określić pojemnik lub kwantyfikować dane.

Oczekiwane dane wejściowe

Nazwa Typ Opis
Zestaw danych Tabela danych Zestaw danych z kolumnami kategorii

Parametry modułu

Nazwa Zakres Typ Domyślny Opis
Kolumny podzielone na kategorii do konwersji Dowolne ColumnSelection Wybierz kolumny podzielone na kategorii, aby przekonwertować na macierze wskaźników.
Zastępowanie kolumn kategorii Dowolne Boolean fałsz W przypadku wartości True zastąp wybrane kolumny kategorii. W przeciwnym razie dołącz macierze wynikowych wskaźników do zestawu danych.

Dane wyjściowe

Nazwa Typ Opis
Zestaw danych wyników Tabela danych Zestaw danych z kolumnami kategorii przekonwertowane na macierze wskaźników.

Zobacz też

Manipulacji
Przekształcanie danych
Lista modułów A–Z