Dokumentacja składników algorytmu & dla projektanta usługi Azure Machine Learning

DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

Uwaga

Projektant obsługuje dwa typy składników, wstępnie utworzone składniki klasyczne i składniki niestandardowe. Te dwa typy składników nie są zgodne.

Klasyczne wstępnie utworzone składniki udostępniają wstępnie utworzone składniki na potrzeby przetwarzania danych i tradycyjnych zadań uczenia maszynowego, takich jak regresja i klasyfikacja. Ten typ składników nadal jest obsługiwany, ale nie będą do niego dodawane żadne nowego składniki.

Składniki niestandardowe umożliwiają podanie własnego kodu jako składnika. Obsługują udostępnianie między obszarami roboczymi i bezproblemowe tworzenie w programie Studio, interfejsie wiersza polecenia i interfejsach zestawu SDK.

Ten artykuł dotyczy klasycznych wstępnie utworzonych składników.

Ta zawartość referencyjna zawiera podstawowe informacje techniczne dotyczące poszczególnych wstępnie utworzonych składników klasycznych dostępnych w projektancie usługi Azure Machine Learning.

Każdy składnik reprezentuje zestaw kodu, który można uruchomić niezależnie i wykonać zadanie uczenia maszynowego, biorąc pod uwagę wymagane dane wejściowe. Składnik może zawierać określony algorytm lub wykonać zadanie, które jest ważne w uczeniu maszynowym, takie jak zastąpienie brakującej wartości lub analiza statystyczna.

Aby uzyskać pomoc dotyczącą wybierania algorytmów, zobacz

Porada

W dowolnym potoku w projektancie można uzyskać informacje o określonym składniku. Wybierz link Dowiedz się więcej na karcie składnika po umieszczeniu wskaźnika myszy na składniku na liście składników lub w okienku po prawej stronie składnika.

Składniki przygotowywania danych

Funkcjonalność Opis składnik
Dane wejściowe i wyjściowe Przenoszenie danych ze źródeł chmury do potoku. Zapisz wyniki lub dane pośrednie w usłudze Azure Storage lub SQL Database podczas uruchamiania potoku lub użyj magazynu w chmurze do wymiany danych między potokami. Ręczne wprowadzanie danych
Eksportowanie danych
Importowanie danych
Przekształcanie danych Operacje na danych, które są unikatowe dla uczenia maszynowego, takie jak normalizacja lub kwantowanie danych, redukcja wymiarowości i konwertowanie danych między różnymi formatami plików. Dodawanie kolumn
Dodawanie wierszy
Stosowanie operacji matematycznej
Stosowanie przekształcenia SQL
Czyszczenie brakujących danych
Obcinanie wartości
Konwertowanie na plik CSV
Konwertowanie na zestaw danych
Konwertowanie na wartości wskaźnika
Edytowanie metadanych
Grupowanie danych w pojemniki
Łączenie danych
Normalizowanie danych
Partycjonowanie i próbkowanie
Usuwanie zduplikowanych wierszy
SMOTE
Wybieranie przekształcenia kolumn
Wybieranie kolumn w zestawie danych
Dzielenie danych
Wybór funkcji Wybierz podzbiór odpowiednich, przydatnych funkcji do utworzenia modelu analitycznego. Wybór funkcji oparty na filtrze
Ważność funkcji permutacji
Funkcje statystyczne Udostępniaj szeroką gamę metod statystycznych związanych z nauką o danych. Podsumowywanie danych

Algorytmy uczenia maszynowego

Funkcjonalność Opis składnik
Regresja Przewidywanie wartości. Regresja wzmocnionego drzewa decyzyjnego
Regresja lasu decyzyjnego
Szybka regresja kwantylowa lasu decyzyjnego
Regresja liniowa
Regresja sieci neuronowej
Regresja Poissona
Klastrowanie Grupuj dane razem. Klastrowanie metodą k-średnich
Klasyfikacja Przewidywanie klasy. Wybierz jeden z algorytmów binarnych (dwuklasowych) lub wieloklasowych. Wieloklasowe wzmocnione drzewo decyzyjne
Wieloklasowy las decyzyjny
Wieloklasowa regresja logistyczna
Wieloklasowa sieć neuronowa
Jeden przeciw wszystkim — moduł wieloklasowy
Jeden przeciw Wiele multiklas
Dwuklasowy uśredniony perceptron
Two-Class Boosted Decision Tree (Dwuklasowe wzmocnione drzewo decyzyjne)
Dwuklasowy las decyzyjny
Dwuklasowa regresja logistyczna
Dwuklasowa sieć neuronowa
Dwuklasowa maszyna wektorów nośnych

Składniki do tworzenia i oceniania modeli

Funkcjonalność Opis składnik
Trenowanie modelu Uruchamianie danych za pomocą algorytmu. Trenowanie modelu klastrowania
Trenowanie modelu
Trenowanie modelu Pytorch
Dostrajanie hiperparametrów modelu
Ocenianie i ocena modelu Zmierz dokładność wytrenowanego modelu. Stosowanie przekształcenia
Przypisywanie danych do klastrów
Krzyżowa weryfikacja modelu
Ocena modelu
Ocenianie modelu obrazów
Klasyfikacja modelu
Język Python Napisz kod i osadź go w składniku, aby zintegrować język Python z potokiem. Tworzenie modelu języka Python
Wykonywanie skryptu w języku Python
Język R Napisz kod i osadź go w składniku, aby zintegrować język R z potokiem. Wykonywanie skryptu języka R
Analiza tekstu Udostępnianie wyspecjalizowanych narzędzi obliczeniowych do pracy z tekstem ustrukturyzowanym i bez struktury. Konwertowanie słów na wektory
Wyodrębnianie cech n-gramów z tekstu
Tworzenie skrótów funkcji
Wstępne przetwarzanie tekstu
Alokacja ukrytej zmiennej Dirichleta
Ocenianie modelu Vowpal Wabbit
Trenowanie modelu Vowpal Wabbit
Przetwarzanie obrazów Składniki związane z przetwarzaniem danych obrazów i rozpoznawaniem obrazów. Stosowanie transformacji obrazów
Konwertowanie na katalog obrazów
Inicjowanie transformacji obrazów
Dzielenie katalogu obrazów
Model DenseNet
Model ResNet
Zalecenie Tworzenie modeli rekomendacji. Ocena modułu poleceń
Wynik modułu poleceń SVD
Wyniki modułu poleceń Wide and Deep
Trenowanie modułu poleceń SVD
Trenowanie modułu poleceń Wide and Deep
Wykrywanie anomalii Tworzenie modeli wykrywania anomalii. Wykrywanie anomalii oparte na analizie głównych składowych
Trenowanie modelu wykrywania anomalii

Usługa internetowa

Dowiedz się więcej o składnikach usługi internetowej, które są niezbędne do wnioskowania w czasie rzeczywistym w projektancie usługi Azure Machine Learning.

Komunikaty o błędach

Dowiedz się więcej o komunikatach o błędach i kodach wyjątków , które mogą wystąpić przy użyciu składników w projektancie usługi Azure Machine Learning.

Środowisko składników

Wszystkie wbudowane składniki w projektancie będą wykonywane w stałym środowisku udostępnianym przez firmę Microsoft.

Wcześniej to środowisko bazowało na języku Python 3.6. Teraz zostało uaktualnione do języka Python 3.8. To uaktualnienie jest niewidoczne, ponieważ składniki będą automatycznie uruchamiane w środowisku języka Python 3.8 i nie jest wymagana żadna akcja od użytkownika. Aktualizacja środowiska może mieć wpływ na dane wyjściowe składników i wdrażanie punktu końcowego w czasie rzeczywistym z wnioskowania w czasie rzeczywistym, zobacz poniższe sekcje, aby dowiedzieć się więcej.

Dane wyjściowe składników różnią się od poprzednich wyników

Po uaktualnieniu wersji języka Python z wersji 3.6 do 3.8 zależności wbudowanych składników mogą zostać odpowiednio uaktualnione. W związku z tym niektóre dane wyjściowe składników mogą się różnić od poprzednich wyników.

Jeśli używasz składnika Execute Python Script i wcześniej zainstalowanych pakietów powiązanych z językiem Python 3.6, mogą wystąpić błędy, takie jak:

  • "Nie można znaleźć wersji, która spełnia wymagania."
  • "Nie znaleziono pasującego rozkładu". Następnie należy określić wersję pakietu dostosowaną do języka Python 3.8 i ponownie uruchomić potok.

Problem z wdrażaniem punktu końcowego w czasie rzeczywistym z potoku wnioskowania w czasie rzeczywistym

Jeśli bezpośrednio wdrożysz punkt końcowy w czasie rzeczywistym z poprzedniego ukończonego potoku wnioskowania w czasie rzeczywistym, może to spowodować błędy.

Zalecenie: sklonuj potok wnioskowania i prześlij go ponownie, a następnie wdróż go w punkcie końcowym czasu rzeczywistego.

Następne kroki