Dokumentacja algorytmów i składników dla projektanta usługi Azure Machine Edukacja

DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

Uwaga

Projektant obsługuje dwa typy składników, wstępnie utworzone składniki klasyczne i składniki niestandardowe. Te dwa typy składników nie są zgodne.

Klasyczne wstępnie utworzone składniki udostępniają wstępnie utworzone składniki na potrzeby przetwarzania danych i tradycyjnych zadań uczenia maszynowego, takich jak regresja i klasyfikacja. Ten typ składników nadal jest obsługiwany, ale nie będą do niego dodawane żadne nowego składniki.

Składniki niestandardowe umożliwiają podanie własnego kodu jako składnika. Obsługują udostępnianie między obszarami roboczymi i bezproblemowe tworzenie w programie Studio, interfejsie wiersza polecenia i interfejsach zestawu SDK.

Ten artykuł dotyczy klasycznych wstępnie utworzonych składników.

Ta zawartość referencyjna zawiera techniczne tło dla każdego z klasycznych wstępnie utworzonych składników dostępnych w projektancie usługi Azure Machine Edukacja.

Każdy składnik reprezentuje zestaw kodu, który można uruchomić niezależnie i wykonać zadanie uczenia maszynowego, biorąc pod uwagę wymagane dane wejściowe. Składnik może zawierać określony algorytm lub wykonać zadanie, które jest ważne w uczeniu maszynowym, takie jak brak zamiany wartości lub analiza statystyczna.

Aby uzyskać pomoc dotyczącą wybierania algorytmów, zobacz

Napiwek

W dowolnym potoku w projektancie można uzyskać informacje o określonym składniku. Wybierz link Dowiedz się więcej na karcie składnika po umieszczeniu wskaźnika myszy na składniku na liście składników lub w okienku po prawej stronie składnika.

Składniki przygotowywania danych

Funkcjonalność opis składnik
Wejście i wyjście danych Przenoszenie danych ze źródeł chmury do potoku. Zapisz wyniki lub dane pośrednie w usłudze Azure Storage lub w usłudze SQL Database podczas uruchamiania potoku lub użyj magazynu w chmurze do wymiany danych między potokami. Ręczne wprowadzanie danych
Eksportowanie danych
Importowanie danych
Przekształcanie danych Operacje na danych, które są unikatowe dla uczenia maszynowego, takie jak normalizacja lub kwantowanie danych, redukcja wymiarów i konwertowanie danych między różnymi formatami plików. Dodawanie kolumn
Dodawanie wierszy
Zastosuj operację matematyczną
Stosowanie przekształcenia SQL
Czyszczenie brakujących danych
Wartości wycinków
Konwertowanie na plik CSV
Konwertowanie na zestaw danych
Konwertowanie na wartości wskaźnika
Edytowanie metadanych
Grupowanie danych do pojemników
Łączenie danych
Normalizacja danych
Partycjonowanie i przykład
Usuń zduplikowane wiersze
SMOTE
Wybieranie przekształcenia kolumn
Wybieranie kolumn w zestawie danych
Spil Data (Podziel dane)
Wybieranie funkcji Wybierz podzbiór odpowiednich, przydatnych funkcji do utworzenia modelu analitycznego. Wybór funkcji opartej na filtrze
Ważność funkcji permutacji
Funkcje statystyczne Udostępniaj szeroką gamę metod statystycznych związanych z nauką o danych. Podsumowywanie danych

Algorytmy uczenia maszynowego

Funkcjonalność opis składnik
Regresja Przewidywanie wartości. Regresja wzmocnionego drzewa decyzyjnego
Regresja lasu decyzyjnego
Szybka regresja kwantylu lasu
Regresja liniowa
Regresja sieci neuronowej
Regresja Poissona
Klastrowanie Grupuj dane razem. Klaster k-średnich
Klasyfikacja Przewidywanie klasy. Wybierz algorytmy binarne (dwuklasowe) lub wieloklasowe. Wieloklasowe wzmocnione drzewo decyzyjne
Wieloklasowy las decyzyjny
Regresja logistyczna w wielu klasach
Wieloklasowa sieć neuronowa
Jeden a wszystkie wieloklasy
Jedna a jedna wieloklasowa
Dwuklasowa średnia perceptron
Two-Class Boosted Decision Tree (Dwuklasowe wzmocnione drzewo decyzyjne)
Dwuklasowy las decyzyjny
Regresja logistyczna dwuklasowa
Dwuklasowa sieć neuronowa
Maszyna wektorów nośnych dwóch klas

Składniki do tworzenia i oceniania modeli

Funkcjonalność opis składnik
Trenowanie modelu Uruchamianie danych za pomocą algorytmu. Trenowanie modelu klastrowania
Train Model (Trenuj model)
Trenowanie modelu Pytorch
Dostrajanie hiperparametrów modelu
Ocenianie i ocena modelu Mierzenie dokładności wytrenowanego modelu. Stosowanie przekształcenia
Przypisywanie danych do klastrów
Krzyżowe weryfikowanie modelu
Ocena modelu
Generowanie wyników modelu obrazu
Generowanie wyników w modelu
Język Python Pisanie kodu i osadzanie go w składniku w celu zintegrowania języka Python z potokiem. Tworzenie modelu języka Python
Wykonywanie skryptu języka Python
Język R Pisanie kodu i osadzanie go w składniku w celu zintegrowania języka R z potokiem. Wykonywanie skryptu języka R
Analiza tekstu Udostępniaj wyspecjalizowane narzędzia obliczeniowe do pracy z tekstem ustrukturyzowanym i nieustrukturyzowanym. Konwertowanie programu Word na wektor
Wyodrębnianie funkcji N Gram z tekstu
Skróty funkcji
Wstępne przetwarzanie tekstu
Alokacja opóźnionego dirichletu
Generowanie wyników modelu Vowpal Wabbit
Trenowanie modelu Vowpal Wabbit
Przetwarzanie obrazów Wstępne przetwarzanie danych obrazów i składniki powiązane z rozpoznawaniem obrazów. Stosowanie przekształcenia obrazu
Konwertowanie na katalog obrazów
Przekształcanie obrazu init
Podział katalogu obrazów
Gęsta sieć
Sieć resnet
Zalecenie Tworzenie modeli rekomendacji. Ocena modułu polecającego
Score SVD Recommender
Ocenianie szerokiego i głębokiego modułu polecającego
Trenowanie modułu polecającego SVD
Trenowanie szerokiego i głębokiego modułu polecającego
Wykrywanie anomalii Tworzenie modeli wykrywania anomalii. Wykrywanie anomalii opartej na pcA
Trenowanie modelu wykrywania anomalii

Usługa sieci Web

Dowiedz się więcej o składnikach usługi internetowej, które są niezbędne do wnioskowania w czasie rzeczywistym w projektancie usługi Azure Machine Edukacja.

Komunikaty o błędach

Dowiedz się więcej o komunikatach o błędach i kodach wyjątków, które mogą wystąpić przy użyciu składników w projektancie usługi Azure Machine Edukacja.

Środowisko składników

Wszystkie wbudowane składniki w projektancie będą wykonywane w stałym środowisku udostępnianym przez firmę Microsoft.

Wcześniej to środowisko bazowało na języku Python 3.6. Teraz zostało uaktualnione do języka Python 3.8. To uaktualnienie jest niewidoczne, ponieważ składniki będą automatycznie uruchamiane w środowisku języka Python 3.8 i nie jest wymagana żadna akcja od użytkownika. Aktualizacja środowiska może mieć wpływ na dane wyjściowe składników i wdrażanie punktu końcowego w czasie rzeczywistym z wnioskowania w czasie rzeczywistym, zobacz poniższe sekcje, aby dowiedzieć się więcej.

Dane wyjściowe składników różnią się od poprzednich wyników

Po uaktualnieniu wersji języka Python z wersji 3.6 do 3.8 zależności wbudowanych składników mogą zostać odpowiednio uaktualnione. W związku z tym niektóre dane wyjściowe składników mogą się różnić od poprzednich wyników.

Jeśli używasz składnika Execute Python Script i masz wcześniej zainstalowane pakiety powiązane z językiem Python 3.6, mogą wystąpić błędy, takie jak:

  • "Nie można znaleźć wersji, która spełnia wymaganie."
  • "Nie znaleziono pasującego rozkładu". Następnie należy określić wersję pakietu dostosowaną do środowiska Python 3.8 i ponownie uruchomić potok.

Problem z wdrażaniem punktu końcowego w czasie rzeczywistym z potoku wnioskowania w czasie rzeczywistym

Jeśli bezpośrednio wdrożysz punkt końcowy w czasie rzeczywistym z poprzedniego ukończonego potoku wnioskowania w czasie rzeczywistym, może to spowodować błędy.

Zalecenie: sklonuj potok wnioskowania i prześlij go ponownie, a następnie wdróż go w punkcie końcowym czasu rzeczywistego.

Następne kroki