Dokumentacja algorytmów i składników projektanta usługi Azure Machine Learning
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
Uwaga
Projektant obsługuje dwa typy składników, klasyczne wstępnie utworzone składniki i składniki niestandardowe. Te dwa typy składników nie są zgodne.
Klasyczne wstępnie utworzone składniki udostępniają wstępnie utworzone składniki na potrzeby przetwarzania danych i tradycyjnych zadań uczenia maszynowego, takich jak regresja i klasyfikacja. Ten typ składników nadal jest obsługiwany, ale nie będą do niego dodawane żadne nowego składniki.
Składniki niestandardowe umożliwiają podanie własnego kodu jako składnika. Obsługują udostępnianie między obszarami roboczymi i bezproblemowe tworzenie w programie Studio, interfejsie wiersza polecenia i interfejsach zestawu SDK.
Ten artykuł dotyczy klasycznych wstępnie utworzonych składników.
Ta zawartość referencyjna zawiera techniczne tło dla każdego z klasycznych wstępnie utworzonych składników dostępnych w projektancie usługi Azure Machine Learning.
Każdy składnik reprezentuje zestaw kodu, który można uruchomić niezależnie i wykonać zadanie uczenia maszynowego, biorąc pod uwagę wymagane dane wejściowe. Składnik może zawierać określony algorytm lub wykonać zadanie, które jest ważne w uczeniu maszynowym, takie jak brak zamiany wartości lub analiza statystyczna.
Aby uzyskać pomoc dotyczącą wybierania algorytmów, zobacz
Napiwek
W dowolnym potoku w projektancie można uzyskać informacje o określonym składniku. Wybierz link Dowiedz się więcej na karcie składnika po umieszczeniu wskaźnika myszy na składniku na liście składników lub w okienku po prawej stronie składnika.
Składniki przygotowywania danych
Funkcjonalność | opis | składnik |
---|---|---|
Wejście i wyjście danych | Przenoszenie danych ze źródeł chmury do potoku. Zapisz wyniki lub dane pośrednie w usłudze Azure Storage lub w usłudze SQL Database podczas uruchamiania potoku lub użyj magazynu w chmurze do wymiany danych między potokami. | Ręczne wprowadzanie danych Eksportowanie danych Importowanie danych |
Przekształcanie danych | Operacje na danych, które są unikatowe dla uczenia maszynowego, takie jak normalizacja lub kwantowanie danych, redukcja wymiarów i konwertowanie danych między różnymi formatami plików. | Dodawanie kolumn Dodawanie wierszy Zastosuj operację matematyczną Stosowanie przekształcenia SQL Czyszczenie brakujących danych Wartości wycinków Konwertowanie na plik CSV Konwertowanie na zestaw danych Konwertowanie na wartości wskaźnika Edytowanie metadanych Grupowanie danych do pojemników Łączenie danych Normalizacja danych Partycjonowanie i przykład Usuń zduplikowane wiersze SMOTE Wybieranie przekształcenia kolumn Wybieranie kolumn w zestawie danych Spil Data (Podziel dane) |
Wybieranie funkcji | Wybierz podzbiór odpowiednich, przydatnych funkcji do utworzenia modelu analitycznego. | Wybór funkcji opartej na filtrze Ważność funkcji permutacji |
Funkcje statystyczne | Udostępniaj szeroką gamę metod statystycznych związanych z nauką o danych. | Podsumowywanie danych |
Algorytmy uczenia maszynowego
Funkcjonalność | opis | składnik |
---|---|---|
Regresja | Przewidywanie wartości. | Regresja wzmocnionego drzewa decyzyjnego Regresja lasu decyzyjnego Szybka regresja kwantylu lasu Regresja liniowa Regresja sieci neuronowej Regresja Poissona |
Klastrowanie | Grupuj dane razem. | Klaster k-średnich |
Klasyfikacja | Przewidywanie klasy. Wybierz algorytmy binarne (dwuklasowe) lub wieloklasowe. | Wieloklasowe wzmocnione drzewo decyzyjne Wieloklasowy las decyzyjny Regresja logistyczna w wielu klasach Wieloklasowa sieć neuronowa Jeden a wszystkie wieloklasy Jedna a jedna wieloklasowa Dwuklasowa średnia perceptron Two-Class Boosted Decision Tree (Dwuklasowe wzmocnione drzewo decyzyjne) Dwuklasowy las decyzyjny Regresja logistyczna dwuklasowa Dwuklasowa sieć neuronowa Maszyna wektorów nośnych dwóch klas |
Składniki do tworzenia i oceniania modeli
Usługa sieci Web
Dowiedz się więcej o składnikach usługi internetowej, które są niezbędne do wnioskowania w czasie rzeczywistym w projektancie usługi Azure Machine Learning.
Komunikaty o błędach
Dowiedz się więcej o komunikatach o błędach i kodach wyjątków , które mogą wystąpić przy użyciu składników w projektancie usługi Azure Machine Learning.
Środowisko składników
Wszystkie wbudowane składniki w projektancie będą wykonywane w stałym środowisku udostępnianym przez firmę Microsoft.
Wcześniej to środowisko bazowało na języku Python 3.6. Teraz zostało uaktualnione do języka Python 3.8. To uaktualnienie jest niewidoczne, ponieważ składniki będą automatycznie uruchamiane w środowisku języka Python 3.8 i nie jest wymagana żadna akcja od użytkownika. Aktualizacja środowiska może mieć wpływ na dane wyjściowe składników i wdrażanie punktu końcowego w czasie rzeczywistym z wnioskowania w czasie rzeczywistym, zobacz poniższe sekcje, aby dowiedzieć się więcej.
Dane wyjściowe składników różnią się od poprzednich wyników
Po uaktualnieniu wersji języka Python z wersji 3.6 do 3.8 zależności wbudowanych składników mogą zostać odpowiednio uaktualnione. W związku z tym niektóre dane wyjściowe składników mogą się różnić od poprzednich wyników.
Jeśli używasz składnika Execute Python Script i masz wcześniej zainstalowane pakiety powiązane z językiem Python 3.6, mogą wystąpić błędy, takie jak:
- "Nie można znaleźć wersji, która spełnia wymaganie."
- "Nie znaleziono pasującego rozkładu". Następnie należy określić wersję pakietu dostosowaną do środowiska Python 3.8 i ponownie uruchomić potok.
Problem z wdrażaniem punktu końcowego w czasie rzeczywistym z potoku wnioskowania w czasie rzeczywistym
Jeśli bezpośrednio wdrożysz punkt końcowy w czasie rzeczywistym z poprzedniego ukończonego potoku wnioskowania w czasie rzeczywistym, może to spowodować błędy.
Zalecenie: sklonuj potok wnioskowania i prześlij go ponownie, a następnie wdróż go w punkcie końcowym czasu rzeczywistego.