Czyszczenie brakujących danych
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Określa sposób obsługi wartości brakujących w zestawie danych
Kategoria: Przekształcanie/manipulowanie danymi
Uwaga
Dotyczy: Machine Learning Studio (wersja klasyczna)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano sposób użycia modułu Clean Missing Data (Czyszczenie brakujących danych) w programie Machine Learning Studio (wersja klasyczna) w celu usunięcia, zastąpienia lub wywłaszczenia brakujących wartości.
Badacze danych często sprawdzają dane pod względu na brakujące wartości, a następnie wykonują różne operacje w celu naprawienia danych lub wstawienia nowych wartości. Celem takich operacji czyszczenia jest zapobieganie problemom spowodowanym przez brakujące dane, które mogą wystąpić podczas trenowania modelu.
Ten moduł obsługuje wiele typów operacji na "czyszczenie" brakujących wartości, w tym:
- Zastępowanie brakujących wartości symbolem zastępczym, średnią lub inną wartością
- Całkowite usuwanie wierszy i kolumn z brakującymi wartościami
- Wnioskowanie wartości na podstawie metod statystycznych
Porada
Uczenie maszynowe to dla Nas nowość? Ten artykuł zawiera dobre wyjaśnienie, dlaczego należy użyć każdej z różnych metod zastępowania brakujących wartości: Metody obsługi brakujących wartości
Użycie tego modułu nie powoduje zmiany źródłowego zestawu danych. Zamiast tego tworzy nowy zestaw danych w obszarze roboczym, który będzie można wykorzystać w kolejnym przepływie pracy. Możesz również zapisać nowy, oczyszczony zestaw danych do ponownego użycia.
Ten moduł zawiera również definicję przekształcenia używaną do czyszczenia brakujących wartości. Możesz ponownie użyć tego przekształcenia w innych zestawach danych, które mają ten sam schemat, przy użyciu modułu Zastosuj przekształcenie .
Jak używać czyszczenia brakujących danych
Ten moduł umożliwia zdefiniowanie operacji czyszczenia. Możesz również zapisać operację czyszczenia, aby można było zastosować ją później do nowych danych. Zapoznaj się z poniższymi linkami, aby uzyskać opis sposobu tworzenia i zapisywania procesu czyszczenia:
Ważne
Metoda czyszczenia, która służy do obsługi brakujących wartości, może znacząco wpłynąć na wyniki. Zalecamy eksperymentowanie z różnymi metodami. Należy wziąć pod uwagę zarówno uzasadnienie zastosowania określonej metody, jak i jakość wyników.
Zastępowanie brakujących wartości
Za każdym razem, gdy moduł Clean Missing Data (Czyszczenie brakujących danych) jest stosowany do zestawu danych, ta sama operacja czyszczenia jest stosowana do wszystkich wybranych kolumn. W związku z tym, jeśli musisz wyczyścić różne kolumny przy użyciu różnych metod, użyj oddzielnych wystąpień modułu.
Dodaj moduł Clean Missing Data (Czyszczenie brakujących danych) do eksperymentu i połącz zestaw danych, w których brakuje wartości.
W przypadku kolumn do wyczyszczenia wybierz kolumny zawierające brakujące wartości, które chcesz zmienić. Możesz wybrać wiele kolumn, ale musisz użyć tej samej metody zastępowania we wszystkich wybranych kolumnach. W związku z tym zazwyczaj należy oddzielnie wyczyścić kolumny ciągów i kolumny liczbowe.
Aby na przykład sprawdzić brakujące wartości we wszystkich kolumnach liczbowych:
Otwórz selektora kolumn i wybierz pozycję WITH RULES (Z REGUŁAMI).
W przypadku opcji BEGIN WITH (ROZPOCZNIJ OD) wybierz pozycję NO COLUMNS (BRAK KOLUMN).
Możesz również rozpocząć od tekstu WSZYSTKIE KOLUMNy, a następnie wykluczyć kolumny. Początkowo reguły nie są wyświetlane, jeśli najpierw klikniesz pozycję WSZYSTKIE KOLUMNY, ale możesz kliknąć pozycję BRAK KOLUMN, a następnie ponownie kliknąć pozycję WSZYSTKIE KOLUMNy, aby rozpocząć od wszystkich kolumn, a następnie odfiltrować (wykluczyć) kolumny na podstawie nazwy, typu danych lub indeksu kolumn.
W przypadku opcjiUwzględnij wybierz pozycję Typ kolumny z listy rozwijanej, a następnie wybierz pozycję Numeryczne lub bardziej specyficzny typ liczbowy.
Wszelkie wybrane metody czyszczenia lub zamiany muszą mieć zastosowanie do wszystkich kolumn w zaznaczeniu. Jeśli dane w dowolnej kolumnie są niezgodne z określoną operacją, moduł zwraca błąd i zatrzymuje eksperyment.
W przypadku ustawienia Minimalny współczynnik brakujących wartości określ minimalną liczbę brakujących wartości wymaganych do wykonania operacji.
Tej opcji należy używać w połączeniu z opcją Maksymalny współczynnik brakujących wartości, aby zdefiniować warunki, w których na zestawie danych jest wykonywana operacja czyszczenia. Jeśli brakuje zbyt wielu lub zbyt kilku wierszy, nie można wykonać operacji.
W wprowadzana liczba reprezentuje stosunek brakujących wartości do wszystkich wartości w kolumnie. Domyślnie właściwość Minimalny współczynnik brakujących wartości jest ustawiona na 0. Oznacza to, że brakujące wartości są czyszczone, nawet jeśli brakuje tylko jednej wartości. Aby uzyskać przykład sposobu użycia tej opcji, zobacz Ustawianie progu dla operacji czyszczenia.
Ostrzeżenie
Ten warunek musi być spełniony przez każdą kolumnę, aby można było zastosować określoną operację. Załóżmy na przykład, że wybrano trzy kolumny, a następnie ustawiono minimalny współczynnik brakujących wartości na .2 (20%), ale tylko jedna kolumna faktycznie ma 20% brakujących wartości. W takim przypadku operacja oczyszczania będzie miała zastosowanie tylko do kolumny z ponad 20% brakującymi wartościami. W związku z tym pozostałe kolumny pozostaną niezmienione.
Jeśli masz wątpliwości co do tego, czy brakujące wartości zostały zmienione, wybierz opcję Generuj brakującą kolumnę wskaźnika wartości. Kolumna jest dołączana do zestawu danych, aby wskazać, czy każda kolumna spełnia określone kryteria dla minimalnych i maksymalnych zakresów.
W przypadku ustawienia Maksymalny współczynnik brakujących wartości określ maksymalną liczbę brakujących wartości, które mogą być obecne dla operacji do wykonania.
Na przykład możesz chcieć wykonać podstawianie brakujących wartości tylko wtedy, gdy 30% lub mniej wierszy zawiera brakujące wartości, ale pozostaw wartości bez żadnych wartości, jeśli więcej niż 30% wierszy ma brakujące wartości.
Należy zdefiniować liczbę jako stosunek brakujących wartości do wszystkich wartości w kolumnie. Domyślnie maksymalny współczynnik brakujących wartości jest ustawiony na 1. Oznacza to, że brakujące wartości są czyszczone nawet wtedy, gdy brakuje 100% wartości w kolumnie.
Uwaga
W przypadku ustawienia progu przy użyciu opcji Minimalny współczynnik brakujących wartości lub Maksymalny współczynnik brakujących wartości nie można wykonać operacji czyszczenia, jeśli nawet jedna z wybranych kolumn nie spełnia kryteriów.
W przypadku opcji Tryb czyszczenia wybierz jedną z następujących opcji zastępowania lub usuwania brakujących wartości:
Zastąp przy użyciu mice: dla każdej brakującej wartości ta opcja przypisuje nową wartość, która jest obliczana przy użyciu metody opisanej w literaturze statystycznej jako "Imputation using Chained Equations" (Imputation using Chained Equations) lub "Multiple Imputation by Chained Equations" (Imputation by Chained Equations). W przypadku wielu metod imputacji każda zmienna z brakującymi danymi jest modelowana warunkowo przy użyciu innych zmiennych w danych przed wypełnieniem brakujących wartości. Z kolei w jednej metodzie imputacji (na przykład zastąpieniu brakującej wartości średnią kolumnową) na danych jest dokonywane pojedyncze przejście w celu określenia wartości wypełnienia.
Wszystkie metody imputacji wprowadzają pewien błąd lub stronniczość, ale wiele imputacji lepiej symuluje proces generowania danych i rozkład prawdopodobieństwa danych.
Aby uzyskać ogólne wprowadzenie do metod obsługi brakujących wartości, zobacz Missing Data: the state of the art (Brakujące dane: najnowocześniejsze dane). Schafer i Graham, 2002.
Ostrzeżenie
Tej opcji nie można zastosować do całkowicie pustych kolumn. Takie kolumny muszą zostać usunięte lub przekazane do danych wyjściowych w takiej sytuacji.
Niestandardowa wartość podstawienia: użyj tej opcji, aby określić wartość symbolu zastępczego (taką jak 0 lub NA), która ma zastosowanie do wszystkich brakujących wartości. Wartość określana jako wartość zastępcza musi być zgodna z typem danych kolumny.
Zastąp wartością średnią: oblicza średnią kolumny i używa średniej jako wartości zastępczej dla każdej brakującej wartości w kolumnie.
Dotyczy tylko kolumn, które mają typy danych Integer, Double lub Boolean. Aby uzyskać więcej informacji , zobacz sekcję Uwagi techniczne.
Zastąp wartością medianą: oblicza wartość mediany kolumny i używa mediany jako wartości zastępczej dla każdej brakującej wartości w kolumnie.
Dotyczy tylko kolumn, które mają typy danych Integer lub Double. Aby uzyskać więcej informacji , zobacz sekcję Uwagi techniczne.
Zastąp element trybem: oblicza tryb dla kolumny i używa trybu jako wartości zastępczej dla każdej brakującej wartości w kolumnie.
Dotyczy kolumn, które mają typy danych Integer, Double, Boolean lub Categorical. Aby uzyskać więcej informacji , zobacz sekcję Uwagi techniczne.
Usuń cały wiersz: całkowicie usuwa dowolny wiersz w zestawie danych, który ma co najmniej jedną brakującą wartość. Jest to przydatne, jeśli brakujące wartości można uznać za brakujące losowo.
Usuń całą kolumnę: całkowicie usuwa wszystkie kolumny w zestawie danych, w których brakuje co najmniej jednej wartości.
Zastąp przy użyciu probabilistycznej analizy pcabilistycznej: zastępuje brakujące wartości przy użyciu modelu liniowego, który analizuje korelacje między kolumnami i szacuje niskie przybliżenie danych, na którym są rekonstruowane pełne dane. Redukcja wymiarów podstawowych jest probabilistyczną formą analizy głównych składników (PCA) i implementuje wariant modelu proponowanych w dzienniku "Journal of TheLar Statistical Society", seria B 21(3), 611–622 autorstwa Tipping andGar.
W porównaniu z innymi opcjami, takimi jak wiele imputacji przy użyciu równań łańcuchowych (MICE), ta opcja ma tę zaletę, że nie wymaga zastosowania predyktorów dla każdej kolumny. Zamiast tego przybliżona jest kowariancja pełnego zestawu danych. W związku z tym może ona oferować lepszą wydajność w przypadku zestawów danych, w których w wielu kolumnach brakuje wartości.
Kluczowymi ograniczeniami tej metody jest to, że rozszerza kolumny kategorii do wskaźników liczbowych i oblicza gęstą macierz kowariancji wynikowych danych. Nie jest również zoptymalizowany pod kątem rozrzednych reprezentacji. Z tego powodu zestawy danych z dużą liczbę kolumn i/lub duże domeny kategorii (dziesiątki tysięcy) nie są obsługiwane z powodu zbyt dużego zużycia miejsca.
Porada
Pamiętaj, że wybierana metoda jest stosowana do wszystkich kolumn w zaznaczeniu. Dlatego jeśli chcesz zastąpić niektóre brakujące wartości zerami w niektórych kolumnach, ale wstawić symbol zastępczy w innych kolumnach, użyj funkcji Select Columns in Dataset (Wybieranie kolumn w zestawie danych), aby oddzielić dane i użyć różnych wystąpień modułu Clean Missing Data (Czyszczenie brakujących danych).
Opcja Wartość zastępcza jest dostępna, jeśli wybrano opcję Niestandardowa wartość podstawienia. Wpisz nową wartość do użycia jako wartość zastępczą dla wszystkich brakujących wartości w kolumnie.
Należy pamiętać, że tej opcji można używać tylko w kolumnach, które mają typy danych Integer, Double, Boolean lub Date. W przypadku kolumn dat wartość zastępczą można również wprowadzić jako liczbę takt 100-nanosekundowych od 1/1/0001 12:00
Wygeneruj kolumnę wskaźnika brakującej wartości: wybierz tę opcję, jeśli chcesz uzyskać pewne wskazanie, czy wartości w kolumnie spełniają kryteria czyszczenia brakujących wartości. Ta opcja jest szczególnie przydatna podczas konfigurowania nowej operacji czyszczenia i chcesz upewnić się, że działa zgodnie z projektami.
Uruchom eksperyment lub wybierz moduł Clean Missing Data (Czyszczenie brakujących danych) i kliknij pozycję Run selected (Uruchom wybraną).
Wyniki
Moduł zwraca dwa dane wyjściowe:
Oczyszczony zestaw danych: zestaw danych składający się z wybranych kolumn z brakującymi wartościami obsługiwanymi zgodnie z określonymi wartościami wraz z kolumną wskaźnika, jeśli wybrano tę opcję.
Kolumny, które nie zostały wybrane do czyszczenia, również są "przekazywane".
Przekształcanie czyszczenia: przekształcenie danych używane do czyszczenia, które można zapisać w obszarze roboczym i zastosować do nowych danych później.
Stosowanie zapisanej operacji czyszczenia do nowych danych
Jeśli musisz często powtarzać operacje czyszczenia, zalecamy zapisanie przepisu na czyszczenie danych jako przekształcenia w celu ponownego użycia z tym samym zestawem danych. Zapisywanie transformacji czyszczenia jest szczególnie przydatne, jeśli trzeba często ponownie importować, a następnie czyścić dane o tym samym schemacie.
Dodaj moduł Apply Transformation (Zastosuj transformację) do eksperymentu.
Dodaj zestaw danych, który chcesz wyczyścić, i połącz zestaw danych z portem wejściowym po prawej stronie.
Rozwiń grupę Przekształcenia w okienku po lewej stronie w programie Studio (wersja klasyczna). Znajdź zapisane przekształcenie i przeciągnij je do eksperymentu.
Połączenie zapisane przekształcenie do lewego portu wejściowego zastosuj przekształcenie.
Po zastosowaniu zapisanego przekształcenia nie można wybrać kolumn, do których zastosowano przekształcenie. Wynika to z tego, że przekształcenie zostało już zdefiniowane i jest automatycznie stosowane do typów danych określonych w oryginalnej operacji.
Załóżmy jednak, że utworzono przekształcenie dla podzestawu kolumn liczbowych. To przekształcenie można zastosować do zestawu danych z mieszanymi typami kolumn bez zwracania błędu, ponieważ brakujące wartości są zmieniane tylko w pasujących kolumnach liczbowych.
Uruchom eksperyment.
Przykłady
Zobacz przykłady sposobu, w jaki ten moduł jest używany w Azure AI Gallery:
Przewidywanie wydajności studentów: w tym przykładzie są wstawiane zera dla brakujących wartości.
Krzyżowa walidacja przykładu klasyfikatora binarnego: zera są używane do wypełniania brakujących wartości, a kolumna wskaźnika jest tworzona w celu śledzenia zmian. Kolumny ze wszystkimi brakującymi wartościami również są zachowywane.
Przetwarzanie i analiza zestawu danych: W tym przykładzie różne gałęzie eksperymentu używają różnych metod podstawiania brakujących wartości, a zestawy danych są następnie oceniane przy użyciu funkcji Podsumuj dane i Obliczaj korelację liniową.
Przykład przewidywania opóźnień lotów: Puste wiersze są całkowicie usuwane.
Uwagi techniczne
Ta sekcja zawiera szczegóły implementacji, a także znane problemy i często zadawane pytania.
Błąd występuje, jeśli opcja średniej lub mediany jest używana po wybraniu dowolnej kolumny ciągu. Jeśli potrzebujesz przetwarzać kolumny różnych typów danych, utwórz dwa wystąpienia obiektu Clean Missing Data (Czyszczenie brakujących danych).
W przypadku zastępowania brakujących wartości średnią wartością w kolumnach typami danych Boolean, Integer, DateTime lub TimeSpan kolumna jest najpierw konwertowana na liczby zmiennoprzecinkowej, średnia jest obliczana, a następnie wynik jest zaokrąglany do najbliższej wartości oryginalnego typu danych.
Podczas wpisywania wartości zastępczej wartość musi być zgodna z typem danych w wybranej kolumnie.
Wartości ,
NaN
iInf
są dozwolone dla–Inf
kolumn, w których typ danych to Double.W przypadku korzystania z metody MICE wartość zastępcza jest przewidywana przy użyciu przeszkolonego modelu MICE.
Funkcja Clean Missing Data (Czyszczenie brakujących danych ) umożliwia resetowanie innych typów kolumn do funkcji. Jeśli dane zawierają inne typy kolumn, takie jak etykiety, użyj funkcji Edytuj metadane , aby poprawić typy kolumn.
Ograniczenia dotyczące używania przekształceń czyszczenia
W przypadku korzystania z zapisanych przekształceń (na podstawie czyszczenia brakujących danych) do nowych danych obowiązują następujące ograniczenia:
Zapisane przekształcenie nie może wygenerować wartości wskaźnika, nawet jeśli ta opcja została użyta w pierwotnej operacji czyszczenia. Wartości wskaźników należy uznać za najbardziej przydatne podczas testowania nowej transformacji.
Przekształcenie nie oblicza nowych wartości na podstawie nowego zestawu danych. Innymi słowy, jeśli w zestawie danych A zostanie użyta wartość Clean Missing Data (Czyszczenie brakujących danych) i wygenerowano średnią wartość 0,5, ta sama wartość zostanie zastosowana jako średnia do zastąpienia brakujących wartości w zestawie danych B, niezależnie od rzeczywistych wartości w zestawie danych B.
Typ danych kolumn w nowym zestawie danych musi odpowiadać typowi danych kolumn, w których pierwotnie utworzono przekształcenie. Jeśli na kolumnie są wykonywane jakiekolwiek operacje, które niejawnie zmieniają typ danych, jest zwracany błąd.
Załóżmy na przykład, że tworzysz średnią dla kolumny danych liczb całkowitych [Col1] i zapisujesz przekształcenie. Teraz chcesz zastosować przekształcenie oczyszczania do kopii kolumny [Col1], która została dostosowana przy użyciu formuły, takiej jak ([Col1] /1.5). Aby upewnić się, że wynik jest liczbą całkowitą, zaokrąglasz wynik w górę, ale nadal występuje błąd podczas stosowania przekształcenia. Jeśli jednak dostosujemy wartość przy użyciu formuły takiej jak ([Col 1] * 10), żaden błąd nie zostanie podniesiony!
Aby uniknąć takich problemów, użyj funkcji Edytuj metadane , aby jawnie zresetować typ danych do liczby całkowitej. Ogólnie rzecz biorąc, operacje w module Zastosuj operację matematyczne niejawnie zmieniają kolumny liczbowe na
double
.
Ustawianie i interpretowanie wartości progowych
Po określeniu progu dla operacji czyszczenia przy użyciu opcji Minimalny współczynnik brakujących wartości lub Maksymalny współczynnik brakujących wartości wyniki mogą być nieoczekiwane lub mylące. Aby zilustrować, jak działają opcje maksymalnej i minimalnej brakującej wartości, podaliśmy kilka przykładów z przykładowego zestawu danych Automobile Prices (Ceny samochodów), który zawiera wiele kolumn z brakującymi wartościami.
W poniższej tabeli przedstawiono liczbę brakujących wartości dla kilku kolumn w tym zestawie danych wraz z proporcją brakujących wartości obliczonych na zestawie danych. Stosunek brakujących wartości (w prawej kolumnie) to wartość, która zostanie użyta do obliczenia zestawu danych względem określonych wartości progowych.
Załóżmy, że dla ustawienia Minimalny współczynnik brakujących wartości ustawiono wartość 0,019, a dla ustawienia Maksymalny współczynnik brakujących wartości ustawiono wartość 0,020. Biorąc pod uwagę następującą tabelę wartości, niektóre kolumny spełniają kryteria progowe, a niektóre nie:
- Kolumny
bore
i spełniająstroke
kryteria progowe. - Kolumny
normalized-losses
icompression-ratio
nie spełniają kryteriów progowych.
Nazwa kolumny | Liczba brakujących wartości | Stosunek brakujących wartości |
---|---|---|
Znormalizowane straty | 41 | 0,2 |
Otworu | 4 | 0.019512195 |
Obrysu | 4 | 0.019512195 |
Sprężania | 0 | 0 |
Ponieważ niektóre kolumny w zaznaczeniu nie spełniają określonych kryteriów, żadna operacja czyszczenia nie została wykonana dla żadnej kolumny. Aby ułatwić ustalić, co się stało, moduł zwraca wartość FALSE w dwóch kolumnach wskaźników i bore_IsMissing
stroke_IsMissing
.
Jeśli jednak zmienisz próg z powrotem na wartości domyślne 0 dla opcji Minimalny współczynnik brakujących wartości i 1 dla opcji Maksymalny współczynnik brakujących wartości, dla wszystkich wybranych kolumn zostanie zwrócona kolumna wskaźnika i zostanie wykonana określona operacja.
Porada
Jeśli nie masz pewności, czy czyszczenie brakujących wartości działa zgodnie z oczekiwaniami, wybierz opcję Generuj brakującą kolumnę wskaźnika wartości .
Znane problemy
Jeśli używasz metody MICE do czyszczenia danych, a następnie przetwarzania zestawu danych zawierającego brakujące wartości, może wystąpić następujący błąd: "Wyjątek biblioteki biblioteki AFx: Model nie jest wytrenowany. (Błąd 1000 )"
Ten błąd występuje tylko wtedy, gdy wybrano metodę MICE, a zestaw danych treningowych nie zawiera brakujących wartości, ale testowy zestaw danych.
Oczekiwane dane wejściowe
Nazwa | Typ | Opis |
---|---|---|
Zestaw danych | Tabela danych | Zestaw danych do wyczyszczenia |
Parametry modułu
Nazwa | Zakres | Typ | Domyślny | Opis |
---|---|---|---|---|
Kolumny do wyczyszczenia | Dowolne | ColumnSelection | Wszystko | Wybierz kolumny dla operacji czyszczenia brakujących wartości. |
Minimalny współczynnik brakujących wartości | [0.0;1.0] | Float | 0,0 | Wyczyść tylko kolumnę z brakującym współczynnikiem wartości powyżej określonej wartości z zestawu wszystkich zaznaczonych kolumn. |
Maksymalny współczynnik brakujących wartości | [0.0;1.0] | Float | 1.0 | Wyczyść tylko kolumny z brakującym współczynnikiem wartości poniżej określonej wartości z zestawu wszystkich zaznaczonych kolumn. |
Tryb czyszczenia | Lista | Obsługa zasad | Niestandardowa wartość podstawienia | Wybierz algorytm, który ma być używany podczas czyszczenia brakujących wartości. |
Wartość zastąpienia | Dowolne | Ciąg | „0” | Wpisz wartość, aby zająć miejsce brakujących wartości. Ta wartość jest opcjonalna. |
Kolumny ze wszystkimi brakującymi wartościami | Dowolne | ColumnsWithAllValuesMissing | Usuń | Wskaż, czy kolumny wszystkich brakujących wartości powinny zostać zachowane w danych wyjściowych. |
Generowanie kolumny wskaźnika braku wartości | Dowolne | Boolean | fałsz | Wygeneruj kolumnę, która wskazuje, które wiersze zostały oczyszczone. |
Liczba iteracji | [1;10] | Liczba całkowita | 5 | Określ liczbę iteracji podczas korzystania z mice. |
Liczba iteracji dla przewidywania PCA | [1;50] | Liczba całkowita | 10 | Określ liczbę iteracji podczas korzystania z przewidywania PCA. |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Oczyszczony zestaw danych | Tabela danych | Oczyszczony zestaw danych |
Przekształcanie czyszczenia | ITransform, interfejs | Przekształcenie, które ma zostać przekazane do modułu Zastosuj transformację w celu oczyszczenia nowych danych. |
Wyjątki
Wyjątek | Opis |
---|---|
Błąd 0002 | Wyjątek występuje, jeśli co najmniej jeden parametr nie może zostać analizowany lub przekonwertowany z określonego typu na typ wymagany przez metodę docelową. |
Błąd 0003 | Wyjątek występuje, jeśli co najmniej jeden wejściowy zestaw danych ma wartość null lub jest pusty. |
Błąd 0008 | Wyjątek występuje, gdy parametr nie znajduje się w zakresie. |
Błąd 0013 | Wyjątek występuje, gdy zuchybka przekazana do modułu ma nieprawidłowy typ. |
Błąd 0018 | Wyjątek występuje, jeśli wejściowy zestaw danych jest nieprawidłowy. |
Błąd 0039 | Jeśli operacja zakończy się niepowodzeniem, wystąpi wyjątek. |
Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kodów błędów.
Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).