Dokumentacja składników algorytmu & dla projektanta usługi Azure Machine Learning
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
Uwaga
Projektant obsługuje dwa typy składników, wstępnie utworzone składniki klasyczne i składniki niestandardowe. Te dwa typy składników nie są zgodne.
Klasyczne wstępnie utworzone składniki udostępniają wstępnie utworzone składniki na potrzeby przetwarzania danych i tradycyjnych zadań uczenia maszynowego, takich jak regresja i klasyfikacja. Ten typ składników nadal jest obsługiwany, ale nie będą do niego dodawane żadne nowego składniki.
Składniki niestandardowe umożliwiają podanie własnego kodu jako składnika. Obsługują udostępnianie między obszarami roboczymi i bezproblemowe tworzenie w programie Studio, interfejsie wiersza polecenia i interfejsach zestawu SDK.
Ten artykuł dotyczy klasycznych wstępnie utworzonych składników.
Ta zawartość referencyjna zawiera podstawowe informacje techniczne dotyczące poszczególnych wstępnie utworzonych składników klasycznych dostępnych w projektancie usługi Azure Machine Learning.
Każdy składnik reprezentuje zestaw kodu, który można uruchomić niezależnie i wykonać zadanie uczenia maszynowego, biorąc pod uwagę wymagane dane wejściowe. Składnik może zawierać określony algorytm lub wykonać zadanie, które jest ważne w uczeniu maszynowym, takie jak zastąpienie brakującej wartości lub analiza statystyczna.
Aby uzyskać pomoc dotyczącą wybierania algorytmów, zobacz
Porada
W dowolnym potoku w projektancie można uzyskać informacje o określonym składniku. Wybierz link Dowiedz się więcej na karcie składnika po umieszczeniu wskaźnika myszy na składniku na liście składników lub w okienku po prawej stronie składnika.
Składniki przygotowywania danych
Funkcjonalność | Opis | składnik |
---|---|---|
Dane wejściowe i wyjściowe | Przenoszenie danych ze źródeł chmury do potoku. Zapisz wyniki lub dane pośrednie w usłudze Azure Storage lub SQL Database podczas uruchamiania potoku lub użyj magazynu w chmurze do wymiany danych między potokami. | Ręczne wprowadzanie danych Eksportowanie danych Importowanie danych |
Przekształcanie danych | Operacje na danych, które są unikatowe dla uczenia maszynowego, takie jak normalizacja lub kwantowanie danych, redukcja wymiarowości i konwertowanie danych między różnymi formatami plików. | Dodawanie kolumn Dodawanie wierszy Stosowanie operacji matematycznej Stosowanie przekształcenia SQL Czyszczenie brakujących danych Obcinanie wartości Konwertowanie na plik CSV Konwertowanie na zestaw danych Konwertowanie na wartości wskaźnika Edytowanie metadanych Grupowanie danych w pojemniki Łączenie danych Normalizowanie danych Partycjonowanie i próbkowanie Usuwanie zduplikowanych wierszy SMOTE Wybieranie przekształcenia kolumn Wybieranie kolumn w zestawie danych Dzielenie danych |
Wybór funkcji | Wybierz podzbiór odpowiednich, przydatnych funkcji do utworzenia modelu analitycznego. | Wybór funkcji oparty na filtrze Ważność funkcji permutacji |
Funkcje statystyczne | Udostępniaj szeroką gamę metod statystycznych związanych z nauką o danych. | Podsumowywanie danych |
Algorytmy uczenia maszynowego
Funkcjonalność | Opis | składnik |
---|---|---|
Regresja | Przewidywanie wartości. | Regresja wzmocnionego drzewa decyzyjnego Regresja lasu decyzyjnego Szybka regresja kwantylowa lasu decyzyjnego Regresja liniowa Regresja sieci neuronowej Regresja Poissona |
Klastrowanie | Grupuj dane razem. | Klastrowanie metodą k-średnich |
Klasyfikacja | Przewidywanie klasy. Wybierz jeden z algorytmów binarnych (dwuklasowych) lub wieloklasowych. | Wieloklasowe wzmocnione drzewo decyzyjne Wieloklasowy las decyzyjny Wieloklasowa regresja logistyczna Wieloklasowa sieć neuronowa Jeden przeciw wszystkim — moduł wieloklasowy Jeden przeciw Wiele multiklas Dwuklasowy uśredniony perceptron Two-Class Boosted Decision Tree (Dwuklasowe wzmocnione drzewo decyzyjne) Dwuklasowy las decyzyjny Dwuklasowa regresja logistyczna Dwuklasowa sieć neuronowa Dwuklasowa maszyna wektorów nośnych |
Składniki do tworzenia i oceniania modeli
Usługa internetowa
Dowiedz się więcej o składnikach usługi internetowej, które są niezbędne do wnioskowania w czasie rzeczywistym w projektancie usługi Azure Machine Learning.
Komunikaty o błędach
Dowiedz się więcej o komunikatach o błędach i kodach wyjątków , które mogą wystąpić przy użyciu składników w projektancie usługi Azure Machine Learning.
Środowisko składników
Wszystkie wbudowane składniki w projektancie będą wykonywane w stałym środowisku udostępnianym przez firmę Microsoft.
Wcześniej to środowisko bazowało na języku Python 3.6. Teraz zostało uaktualnione do języka Python 3.8. To uaktualnienie jest niewidoczne, ponieważ składniki będą automatycznie uruchamiane w środowisku języka Python 3.8 i nie jest wymagana żadna akcja od użytkownika. Aktualizacja środowiska może mieć wpływ na dane wyjściowe składników i wdrażanie punktu końcowego w czasie rzeczywistym z wnioskowania w czasie rzeczywistym, zobacz poniższe sekcje, aby dowiedzieć się więcej.
Dane wyjściowe składników różnią się od poprzednich wyników
Po uaktualnieniu wersji języka Python z wersji 3.6 do 3.8 zależności wbudowanych składników mogą zostać odpowiednio uaktualnione. W związku z tym niektóre dane wyjściowe składników mogą się różnić od poprzednich wyników.
Jeśli używasz składnika Execute Python Script i wcześniej zainstalowanych pakietów powiązanych z językiem Python 3.6, mogą wystąpić błędy, takie jak:
- "Nie można znaleźć wersji, która spełnia wymagania."
- "Nie znaleziono pasującego rozkładu". Następnie należy określić wersję pakietu dostosowaną do języka Python 3.8 i ponownie uruchomić potok.
Problem z wdrażaniem punktu końcowego w czasie rzeczywistym z potoku wnioskowania w czasie rzeczywistym
Jeśli bezpośrednio wdrożysz punkt końcowy w czasie rzeczywistym z poprzedniego ukończonego potoku wnioskowania w czasie rzeczywistym, może to spowodować błędy.
Zalecenie: sklonuj potok wnioskowania i prześlij go ponownie, a następnie wdróż go w punkcie końcowym czasu rzeczywistego.