Dokumentacja algorytmów i składników dla projektanta usługi Azure Machine Edukacja

Artykuł
01/10/2024

DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

Uwaga

Projektant obsługuje dwa typy składników, wstępnie utworzone składniki klasyczne i składniki niestandardowe. Te dwa typy składników nie są zgodne.

Klasyczne wstępnie utworzone składniki udostępniają wstępnie utworzone składniki na potrzeby przetwarzania danych i tradycyjnych zadań uczenia maszynowego, takich jak regresja i klasyfikacja. Ten typ składników nadal jest obsługiwany, ale nie będą do niego dodawane żadne nowego składniki.

Składniki niestandardowe umożliwiają podanie własnego kodu jako składnika. Obsługują udostępnianie między obszarami roboczymi i bezproblemowe tworzenie w programie Studio, interfejsie wiersza polecenia i interfejsach zestawu SDK.

Ten artykuł dotyczy klasycznych wstępnie utworzonych składników.

Ta zawartość referencyjna zawiera techniczne tło dla każdego z klasycznych wstępnie utworzonych składników dostępnych w projektancie usługi Azure Machine Edukacja.

Każdy składnik reprezentuje zestaw kodu, który można uruchomić niezależnie i wykonać zadanie uczenia maszynowego, biorąc pod uwagę wymagane dane wejściowe. Składnik może zawierać określony algorytm lub wykonać zadanie, które jest ważne w uczeniu maszynowym, takie jak brak zamiany wartości lub analiza statystyczna.

Aby uzyskać pomoc dotyczącą wybierania algorytmów, zobacz

Napiwek

W dowolnym potoku w projektancie można uzyskać informacje o określonym składniku. Wybierz link Dowiedz się więcej na karcie składnika po umieszczeniu wskaźnika myszy na składniku na liście składników lub w okienku po prawej stronie składnika.

Składniki przygotowywania danych

Funkcjonalność	opis	składnik
Wejście i wyjście danych	Przenoszenie danych ze źródeł chmury do potoku. Zapisz wyniki lub dane pośrednie w usłudze Azure Storage lub w usłudze SQL Database podczas uruchamiania potoku lub użyj magazynu w chmurze do wymiany danych między potokami.	Ręczne wprowadzanie danych Eksportowanie danych Importowanie danych
Przekształcanie danych	Operacje na danych, które są unikatowe dla uczenia maszynowego, takie jak normalizacja lub kwantowanie danych, redukcja wymiarów i konwertowanie danych między różnymi formatami plików.	Dodawanie kolumn Dodawanie wierszy Zastosuj operację matematyczną Stosowanie przekształcenia SQL Czyszczenie brakujących danych Wartości wycinków Konwertowanie na plik CSV Konwertowanie na zestaw danych Konwertowanie na wartości wskaźnika Edytowanie metadanych Grupowanie danych do pojemników Łączenie danych Normalizacja danych Partycjonowanie i przykład Usuń zduplikowane wiersze SMOTE Wybieranie przekształcenia kolumn Wybieranie kolumn w zestawie danych Spil Data (Podziel dane)
Wybieranie funkcji	Wybierz podzbiór odpowiednich, przydatnych funkcji do utworzenia modelu analitycznego.	Wybór funkcji opartej na filtrze Ważność funkcji permutacji
Funkcje statystyczne	Udostępniaj szeroką gamę metod statystycznych związanych z nauką o danych.	Podsumowywanie danych

Algorytmy uczenia maszynowego

Funkcjonalność	opis	składnik
Regresja	Przewidywanie wartości.	Regresja wzmocnionego drzewa decyzyjnego Regresja lasu decyzyjnego Szybka regresja kwantylu lasu Regresja liniowa Regresja sieci neuronowej Regresja Poissona
Klastrowanie	Grupuj dane razem.	Klaster k-średnich
Klasyfikacja	Przewidywanie klasy. Wybierz algorytmy binarne (dwuklasowe) lub wieloklasowe.	Wieloklasowe wzmocnione drzewo decyzyjne Wieloklasowy las decyzyjny Regresja logistyczna w wielu klasach Wieloklasowa sieć neuronowa Jeden a wszystkie wieloklasy Jedna a jedna wieloklasowa Dwuklasowa średnia perceptron Two-Class Boosted Decision Tree (Dwuklasowe wzmocnione drzewo decyzyjne) Dwuklasowy las decyzyjny Regresja logistyczna dwuklasowa Dwuklasowa sieć neuronowa Maszyna wektorów nośnych dwóch klas

Składniki do tworzenia i oceniania modeli

Funkcjonalność	opis	składnik
Trenowanie modelu	Uruchamianie danych za pomocą algorytmu.	Trenowanie modelu klastrowania Train Model (Trenuj model) Trenowanie modelu Pytorch Dostrajanie hiperparametrów modelu
Ocenianie i ocena modelu	Mierzenie dokładności wytrenowanego modelu.	Stosowanie przekształcenia Przypisywanie danych do klastrów Krzyżowe weryfikowanie modelu Ocena modelu Generowanie wyników modelu obrazu Generowanie wyników w modelu
Język Python	Pisanie kodu i osadzanie go w składniku w celu zintegrowania języka Python z potokiem.	Tworzenie modelu języka Python Wykonywanie skryptu języka Python
Język R	Pisanie kodu i osadzanie go w składniku w celu zintegrowania języka R z potokiem.	Wykonywanie skryptu języka R
Analiza tekstu	Udostępniaj wyspecjalizowane narzędzia obliczeniowe do pracy z tekstem ustrukturyzowanym i nieustrukturyzowanym.	Konwertowanie programu Word na wektor Wyodrębnianie funkcji N Gram z tekstu Skróty funkcji Wstępne przetwarzanie tekstu Alokacja opóźnionego dirichletu Generowanie wyników modelu Vowpal Wabbit Trenowanie modelu Vowpal Wabbit
Przetwarzanie obrazów	Wstępne przetwarzanie danych obrazów i składniki powiązane z rozpoznawaniem obrazów.	Stosowanie przekształcenia obrazu Konwertowanie na katalog obrazów Przekształcanie obrazu init Podział katalogu obrazów Gęsta sieć Sieć resnet
Zalecenie	Tworzenie modeli rekomendacji.	Ocena modułu polecającego Score SVD Recommender Ocenianie szerokiego i głębokiego modułu polecającego Trenowanie modułu polecającego SVD Trenowanie szerokiego i głębokiego modułu polecającego
Wykrywanie anomalii	Tworzenie modeli wykrywania anomalii.	Wykrywanie anomalii opartej na pcA Trenowanie modelu wykrywania anomalii

Usługa sieci Web

Dowiedz się więcej o składnikach usługi internetowej, które są niezbędne do wnioskowania w czasie rzeczywistym w projektancie usługi Azure Machine Edukacja.

Komunikaty o błędach

Dowiedz się więcej o komunikatach o błędach i kodach wyjątków, które mogą wystąpić przy użyciu składników w projektancie usługi Azure Machine Edukacja.

Środowisko składników

Wszystkie wbudowane składniki w projektancie będą wykonywane w stałym środowisku udostępnianym przez firmę Microsoft.

Wcześniej to środowisko bazowało na języku Python 3.6. Teraz zostało uaktualnione do języka Python 3.8. To uaktualnienie jest niewidoczne, ponieważ składniki będą automatycznie uruchamiane w środowisku języka Python 3.8 i nie jest wymagana żadna akcja od użytkownika. Aktualizacja środowiska może mieć wpływ na dane wyjściowe składników i wdrażanie punktu końcowego w czasie rzeczywistym z wnioskowania w czasie rzeczywistym, zobacz poniższe sekcje, aby dowiedzieć się więcej.

Dane wyjściowe składników różnią się od poprzednich wyników

Po uaktualnieniu wersji języka Python z wersji 3.6 do 3.8 zależności wbudowanych składników mogą zostać odpowiednio uaktualnione. W związku z tym niektóre dane wyjściowe składników mogą się różnić od poprzednich wyników.

Jeśli używasz składnika Execute Python Script i masz wcześniej zainstalowane pakiety powiązane z językiem Python 3.6, mogą wystąpić błędy, takie jak:

"Nie można znaleźć wersji, która spełnia wymaganie."
"Nie znaleziono pasującego rozkładu". Następnie należy określić wersję pakietu dostosowaną do środowiska Python 3.8 i ponownie uruchomić potok.

Problem z wdrażaniem punktu końcowego w czasie rzeczywistym z potoku wnioskowania w czasie rzeczywistym

Jeśli bezpośrednio wdrożysz punkt końcowy w czasie rzeczywistym z poprzedniego ukończonego potoku wnioskowania w czasie rzeczywistym, może to spowodować błędy.

Zalecenie: sklonuj potok wnioskowania i prześlij go ponownie, a następnie wdróż go w punkcie końcowym czasu rzeczywistego.

Następne kroki

Samouczek: tworzenie modelu w projektancie w celu przewidywania cen samochodów