Przekształcanie danych

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

W tym artykule wymieniono moduły dostępne w programie Machine Learning Studio (wersja klasyczna) na temat przekształcania danych. W przypadku uczenia maszynowego transformacja danych wiąże się z pewnymi bardzo ogólnymi zadaniami, takimi jak łączenie zestawów danych lub zmienianie nazw kolumn. Jednak obejmuje również wiele zadań specyficznych dla uczenia maszynowego, takich jak normalizacja, nning i grupowanie oraz wnioskowanie brakujących wartości.

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Ważne

Dane, których używasz w programie Machine Learning Studio (wersja klasyczna), zazwyczaj powinny być "schludne" przed zaimportowaniem ich do programu Machine Learning Studio (wersja klasyczna). Przygotowywanie danych może obejmować na przykład zapewnienie, że dane wykorzystują poprawne kodowanie i sprawdzanie, czy dane mają spójny schemat.

Moduły przekształcania danych są pogrupowane w następujące kategorie oparte na zadaniach:

  • Tworzenie filtrów do cyfrowego przetwarzania sygnału: Cyfrowe filtry sygnałów można stosować do danych liczbowych w celu obsługi zadań uczenia maszynowego, takich jak rozpoznawanie obrazów, rozpoznawanie głosu i analiza fal.
  • Generowanie i używanie funkcji opartych na liczbach: moduły cechowania oparte na liczbach ułatwiają opracowywanie kompaktowych funkcji do użycia w uczeniu maszynowym.
  • Ogólne manipulowanie danymi i ich przygotowywanie: scalanie zestawów danych, czyszczenie brakujących wartości, grupowanie i podsumowanie danych, zmienianie nazw kolumn i typów danych lub wskazywanie, która kolumna jest etykietą lub funkcją.
  • Próbkowanie i dzielenie zestawów danych: podziel dane na zestawy treningowe i testowe, podziel zestawy danych według wartości procentowej lub przez warunek filtru albo wykonaj próbkowanie.
  • Skalowanie i zmniejszanie ilości danych: przygotuj dane liczbowe do analizy przez zastosowanie normalizacji lub przez skalowanie. Bin data into groups, remove or replace odliers, or perform principal component analysis (PCA).

Lista modułów

W kategorii Przekształcanie danych znajdują się następujące kategorie modułów:

Zobacz też