Co to jest projektant usługi Azure Machine Edukacja (wersja 1)?

Projektant usługi Azure Machine Edukacja to interfejs przeciągania i upuszczania używany do trenowania i wdrażania modeli w usłudze Azure Machine Edukacja. W tym artykule opisano zadania, które można wykonać w projektancie.

Uwaga

Projektant obsługuje dwa typy składników, klasyczne składniki wstępnie utworzone (wersja 1) i składniki niestandardowe (wersja 2). Te dwa typy składników nie są zgodne.

Klasyczne wstępnie utworzone składniki zapewniają wstępnie utworzone składniki na potrzeby przetwarzania danych i tradycyjnych zadań uczenia maszynowego, takich jak regresja i klasyfikacja. Ten typ składników nadal jest obsługiwany, ale nie będą do niego dodawane żadne nowego składniki.

Składniki niestandardowe umożliwiają opakowywanie własnego kodu jako składnika. Obsługuje udostępnianie składników między obszarami roboczymi i bezproblemowe tworzenie w interfejsach programu Studio, interfejsu wiersza polecenia w wersji 2 i zestawu SDK w wersji 2.

W przypadku nowych projektów zdecydowanie zalecamy użycie składnika niestandardowego, który jest zgodny z językiem AzureML w wersji 2 i będzie nadal otrzymywać nowe aktualizacje.

Ten artykuł dotyczy klasycznych wstępnie utworzonych składników i nie jest zgodny z interfejsem wiersza polecenia w wersji 2 i zestawem SDK w wersji 2.

  • Aby rozpocząć pracę z projektantem, zobacz Samouczek: trenowanie modelu regresji bez kodu.
  • Aby dowiedzieć się więcej o składnikach dostępnych w projektancie, zobacz Informacje o algorytmie i składniku.

GIF of a building a pipeline in the designer.

Projektant używa obszaru roboczego usługi Azure Machine Edukacja do organizowania udostępnionych zasobów, takich jak:

Trenowanie i wdrażanie modelu

Tworzenie kompleksowego przepływu pracy uczenia maszynowego za pomocą kanwy wizualizacji. Trenowanie, testowanie i wdrażanie modeli w projektancie:

  • Przeciągnij i upuść zasoby danych i składniki na kanwę.
  • Połączenie składniki, aby utworzyć wersję roboczą potoku.
  • Prześlij przebieg potoku przy użyciu zasobów obliczeniowych w obszarze roboczym usługi Azure Machine Edukacja.
  • Przekonwertuj potoki trenowania na potoki wnioskowania.
  • Opublikuj potoki w punkcie końcowym potoku REST, aby przesłać nowy potok z różnymi parametrami i elementami zawartości danych.
    • Publikowanie potoku trenowania w celu ponownego użycia pojedynczego potoku w celu wytrenowania wielu modeli podczas zmieniania parametrów i zasobów danych.
    • Opublikuj potok wnioskowania wsadowego, aby przewidywać nowe dane przy użyciu wcześniej wytrenowanego modelu.
  • Wdróż potok wnioskowania w czasie rzeczywistym w punkcie końcowym online, aby przewidywać nowe dane w czasie rzeczywistym.

Workflow diagram for training, batch inference, and real-time inference in the designer.

Potok

Potok składa się z zasobów danych i składników analitycznych, z którymi nawiązujesz połączenie. Potoki mają wiele zastosowań: możesz utworzyć potok, który trenuje pojedynczy model lub jeden, który trenuje wiele modeli. Możesz utworzyć potok, który tworzy przewidywania w czasie rzeczywistym lub wsadowym, albo utworzyć potok, który czyści tylko dane. Potoki umożliwiają ponowne użycie pracy i organizowanie projektów.

Wersja robocza potoku

Podczas edytowania potoku w projektancie postęp jest zapisywany jako wersja robocza potoku. Wersję roboczą potoku można edytować w dowolnym momencie, dodając lub usuwając składniki, konfigurując docelowe obiekty obliczeniowe, tworząc parametry itd.

Prawidłowy potok ma następujące cechy:

  • Zasoby danych mogą łączyć się tylko ze składnikami.
  • składniki mogą łączyć się tylko z elementami zawartości danych lub innymi składnikami.
  • Wszystkie porty wejściowe dla składników muszą mieć pewne połączenie z przepływem danych.
  • Należy ustawić wszystkie wymagane parametry dla każdego składnika.

Gdy wszystko będzie gotowe do uruchomienia projektu potoku, należy przesłać zadanie potoku.

Zadanie potoku

Za każdym razem, gdy uruchamiasz potok, konfiguracja potoku i jego wyniki są przechowywane w obszarze roboczym jako zadanie potoku. Możesz wrócić do dowolnego zadania potoku, aby sprawdzić je pod kątem rozwiązywania problemów lub inspekcji. Sklonuj zadanie potoku, aby utworzyć nową wersję roboczą potoku do edycji.

Zadania potoku są grupowane w eksperymenty w celu organizowania historii zadań. Eksperyment można ustawić dla każdego zadania potoku.

Data

Zasób danych uczenia maszynowego ułatwia dostęp do danych i pracę z danymi. Kilka przykładowych zasobów danych jest uwzględnionych w projektancie do eksperymentowania. Możesz zarejestrować więcej zasobów danych w miarę ich potrzeb.

Składnik

Składnik to algorytm, który można wykonać na danych. Projektant ma kilka składników, od funkcji ruchu przychodzącego danych do procesów trenowania, oceniania i walidacji.

Składnik może mieć zestaw parametrów, których można użyć do skonfigurowania algorytmów wewnętrznych składnika. Po wybraniu składnika na kanwie parametry składnika są wyświetlane w okienku Właściwości po prawej stronie kanwy. Te parametry można modyfikować w okienku, aby dostosowywać model. Zasoby obliczeniowe dla poszczególnych składników można ustawić w projektancie.

Screenshot showing the component properties.

Aby uzyskać pomoc dotyczącą nawigowania po bibliotece dostępnych algorytmów uczenia maszynowego, zobacz Omówienie dokumentacji dotyczącej algorytmów i składników. Aby uzyskać pomoc dotyczącą wybierania algorytmu, zobacz ściągawkę dotyczącą algorytmu usługi Azure Machine Edukacja.

Zasoby obliczeniowe

Użyj zasobów obliczeniowych z obszaru roboczego, aby uruchomić potok i hostować wdrożone modele jako punkty końcowe online lub punkty końcowe potoku (na potrzeby wnioskowania wsadowego). Obsługiwane cele obliczeniowe to:

Docelowy zasób obliczeniowy Szkolenie Wdrożenie
Środowisko obliczeniowe usługi Azure Machine Edukacja
Azure Kubernetes Service

Docelowe obiekty obliczeniowe są dołączane do obszaru roboczego usługi Azure Machine Edukacja. Obiekty docelowe zasobów obliczeniowych można zarządzać w obszarze roboczym w usłudze Azure Machine Edukacja Studio.

Wdrażaj

Aby przeprowadzić wnioskowanie w czasie rzeczywistym, należy wdrożyć potok jako punkt końcowy online. Punkt końcowy online tworzy interfejs między aplikacją zewnętrzną a modelem oceniania. Wywołanie punktu końcowego online zwraca wyniki przewidywania do aplikacji w czasie rzeczywistym. Aby wywołać punkt końcowy online, należy przekazać klucz interfejsu API, który został utworzony podczas wdrażania punktu końcowego. Punkt końcowy jest oparty na architekturze REST, popularnym wyborem architektury dla projektów programowania internetowego.

Punkty końcowe online należy wdrożyć w klastrze usługi Azure Kubernetes Service.

Aby dowiedzieć się, jak wdrożyć model, zobacz Samouczek: wdrażanie modelu uczenia maszynowego za pomocą projektanta.

Publikowanie

Potok można również opublikować w punkcie końcowym potoku. Podobnie jak w przypadku punktu końcowego online punkt końcowy potoku umożliwia przesyłanie nowych zadań potoku z aplikacji zewnętrznych przy użyciu wywołań REST. Nie można jednak wysyłać ani odbierać danych w czasie rzeczywistym przy użyciu punktu końcowego potoku.

Opublikowane potoki są elastyczne, mogą służyć do trenowania lub ponownego trenowania modeli, wykonywania wnioskowania wsadowego, przetwarzania nowych danych i wiele innych. Możesz opublikować wiele potoków w jednym punkcie końcowym potoku i określić wersję potoku do uruchomienia.

Opublikowany potok jest uruchamiany na zasobach obliczeniowych zdefiniowanych w wersji roboczej potoku dla każdego składnika.

Projektant tworzy ten sam obiekt PublishedPipeline co zestaw SDK.

Następne kroki