Zarządzanie wystąpieniem obliczeniowym usługi Azure Machine Learning
DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)
Dowiedz się, jak zarządzać wystąpieniem obliczeniowym w obszarze roboczym usługi Azure Machine Learning.
Użyj wystąpienia obliczeniowego jako w pełni skonfigurowanego i zarządzanego środowiska programistycznego w chmurze. Na potrzeby programowania i testowania można również użyć wystąpienia jako celu obliczeniowego trenowania. Wystąpienie obliczeniowe może uruchamiać wiele zadań równolegle i ma kolejkę zadań. Jako środowisko programistyczne wystąpienie obliczeniowe nie może być współużytkowane przez innych użytkowników w obszarze roboczym.
Z tego artykułu dowiesz się, jak uruchomić, zatrzymać, uruchomić ponownie, usunąć wystąpienie obliczeniowe. Aby dowiedzieć się, jak utworzyć wystąpienie obliczeniowe, zobacz Tworzenie wystąpienia obliczeniowego usługi Azure Machine Learning.
Uwaga
W tym artykule przedstawiono interfejs wiersza polecenia w wersji 2 w poniższych sekcjach. Jeśli nadal używasz interfejsu wiersza polecenia w wersji 1, zobacz Tworzenie interfejsu wiersza polecenia klastra obliczeniowego usługi Azure Machine Learning w wersji 1.
Wymagania wstępne
- Obszar roboczy usługi Azure Machine Learning. Aby uzyskać więcej informacji, zobacz Zarządzanie obszarami roboczymi usługi Azure Machine Learning.
Wybierz odpowiednią kartę dla pozostałych wymagań wstępnych w oparciu o preferowaną metodę zarządzania wystąpieniem obliczeniowym.
Jeśli nie uruchamiasz kodu w wystąpieniu obliczeniowym, zainstaluj zestaw SDK języka Python usługi Azure Machine Learning. Ten zestaw SDK jest już zainstalowany w wystąpieniu obliczeniowym.
Dołącz do obszaru roboczego w skrypsie języka Python:
Uruchom ten kod, aby nawiązać połączenie z obszarem roboczym usługi Azure Machine Learning.
Zastąp identyfikator subskrypcji, nazwę grupy zasobów i nazwę obszaru roboczego w poniższym kodzie. Aby znaleźć następujące wartości:
- Zaloguj się do usługi Azure Machine Learning Studio.
- Otwórz obszar roboczy, którego chcesz użyć.
- Wybierz nazwę obszaru roboczego na pasku narzędzi usługi Azure Machine Learning Studio w prawym górnym rogu.
- Skopiuj wartość obszaru roboczego, grupy zasobów i identyfikatora subskrypcji do kodu.
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
# Enter details of your AML workspace subscription_id = "<SUBSCRIPTION_ID>" resource_group = "<RESOURCE_GROUP>" workspace = "<AML_WORKSPACE_NAME>"
# get a handle to the workspace from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential ml_client = MLClient( DefaultAzureCredential(), subscription_id, resource_group, workspace )
ml_client
jest procedurą obsługi obszaru roboczego używanego do zarządzania innymi zasobami i zadaniami.
Zarządzanie
Uruchamianie, zatrzymywanie, ponowne uruchamianie i usuwanie wystąpienia obliczeniowego. Wystąpienie obliczeniowe nie zawsze jest automatycznie skalowane w dół, dlatego pamiętaj, aby zatrzymać zasób, aby zapobiec trwającym opłatom. Zatrzymanie wystąpienia obliczeniowego powoduje cofnięcie jego przydziału. Następnie uruchom go ponownie, gdy będzie potrzebny. Zatrzymanie wystąpienia obliczeniowego zatrzymuje naliczanie opłat za godziny obliczeniowe, nadal jednak są naliczane opłaty za dysk, publiczny adres IP i standardowy moduł równoważenia obciążenia.
Możesz włączyć automatyczne zamykanie , aby automatycznie zatrzymać wystąpienie obliczeniowe po upływie określonego czasu.
Możesz również utworzyć harmonogram dla wystąpienia obliczeniowego, aby automatycznie uruchamiać i zatrzymywać się na podstawie godziny i dnia tygodnia.
Napiwek
Wystąpienie obliczeniowe korzysta z dysku systemu operacyjnego o pojemności 120 GB. Jeśli zabraknie miejsca na dysku, użyj terminalu, aby wyczyścić co najmniej 5 GB przed zatrzymaniem lub ponownym uruchomieniem wystąpienia obliczeniowego. Nie należy zatrzymywać wystąpienia obliczeniowego, wydając polecenie sudo shutdown z terminalu. Rozmiar dysku tymczasowego w wystąpieniu obliczeniowym zależy od wybranego rozmiaru maszyny wirtualnej i jest zainstalowany na /mnt.
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
W tych przykładach nazwa wystąpienia obliczeniowego jest przechowywana w zmiennej ci_basic_name
.
Uzyskiwanie stanu
from azure.ai.ml.entities import ComputeInstance, AmlCompute # Get compute ci_basic_state = ml_client.compute.get(ci_basic_name)
Zatrzymaj
from azure.ai.ml.entities import ComputeInstance, AmlCompute # Stop compute ml_client.compute.begin_stop(ci_basic_name).wait()
Rozpocznij
from azure.ai.ml.entities import ComputeInstance, AmlCompute # Start compute ml_client.compute.begin_start(ci_basic_name).wait()
Uruchom ponownie
from azure.ai.ml.entities import ComputeInstance, AmlCompute # Restart compute ml_client.compute.begin_restart(ci_basic_name).wait()
Delete
from azure.ai.ml.entities import ComputeInstance, AmlCompute ml_client.compute.begin_delete(ci_basic_name).wait()
Kontrola dostępu oparta na rolach platformy Azure umożliwia kontrolowanie, którzy użytkownicy w obszarze roboczym mogą tworzyć, usuwać, uruchamiać, zatrzymywać, uruchamiać ponownie wystąpienie obliczeniowe. Wszyscy użytkownicy z roli współautora obszaru roboczego i właściciela mogą tworzyć, usuwać, uruchamiać, zatrzymywać i ponownie uruchamiać wystąpienia obliczeniowe w obszarze roboczym. Jednak tylko twórca określonego wystąpienia obliczeniowego lub użytkownik przypisany, jeśli został utworzony w ich imieniu, może uzyskać dostęp do programu Jupyter, JupyterLab i RStudio w tym wystąpieniu obliczeniowym. Wystąpienie obliczeniowe jest przeznaczone dla pojedynczego użytkownika, który ma dostęp główny. Ten użytkownik ma dostęp do aplikacji Jupyter/JupyterLab/RStudio uruchomionej w wystąpieniu. Wystąpienie obliczeniowe ma logowanie jednokrotne użytkownika i wszystkie akcje używają tożsamości tego użytkownika dla kontroli dostępu opartej na rolach platformy Azure i przypisywania zadań eksperymentu. Dostęp za pomocą protokołu SSH jest kontrolowany za pomocą mechanizmu klucza publicznego/prywatnego.
Te akcje można kontrolować za pomocą kontroli dostępu opartej na rolach platformy Azure:
- Microsoft.MachineLearningServices/workspaces/computes/read
- Microsoft.MachineLearningServices/workspaces/computes/write
- Microsoft.MachineLearningServices/workspaces/computes/delete
- Microsoft.MachineLearningServices/workspaces/computes/start/action
- Microsoft.MachineLearningServices/workspaces/computes/stop/action
- Microsoft.MachineLearningServices/workspaces/computes/restart/action
- Microsoft.MachineLearningServices/workspaces/computes/updateSchedules/action
Aby utworzyć wystąpienie obliczeniowe, musisz mieć uprawnienia do następujących akcji:
- Microsoft.MachineLearningServices/workspaces/computes/write
- Microsoft.MachineLearningServices/workspaces/checkComputeNameAvailability/action
Inspekcja i obserwowanie wersji wystąpienia obliczeniowego
Po wdrożeniu wystąpienia obliczeniowego nie zostanie ono automatycznie zaktualizowane. Firma Microsoft wydaje nowe obrazy maszyn wirtualnych co miesiąc. Aby poznać opcje przechowywania najnowszych wersji, zobacz zarządzanie lukami w zabezpieczeniach.
Aby śledzić, czy wersja systemu operacyjnego wystąpienia jest aktualna, możesz wykonać zapytanie dotyczące jego wersji przy użyciu interfejsu wiersza polecenia, zestawu SDK lub interfejsu użytkownika programu Studio.
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
from azure.ai.ml.entities import ComputeInstance, AmlCompute
# Display operating system version
instance = ml_client.compute.get("myci")
print instance.os_image_metadata
Aby uzyskać więcej informacji na temat klas, metod i parametrów używanych w tym przykładzie, zobacz następujące dokumenty referencyjne:
- Klasa
AmlCompute
- Klasa
ComputeInstance
Administratorzy IT mogą używać usługi Azure Policy do monitorowania spisu wystąpień w obszarach roboczych w portalu zgodności usługi Azure Policy. Przypisz wbudowane zasady Audit Azure Machine Learning Compute Instances z nieaktualnym systemem operacyjnym w subskrypcji platformy Azure lub w zakresie grupy zarządzania platformy Azure.