Zarządzanie wystąpieniem obliczeniowym usługi Azure Machine Learning
DOTYCZY:Rozszerzenie uczenia maszynowego platformy Azure w wersji 2 (bieżąca)Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
Dowiedz się, jak zarządzać wystąpieniem obliczeniowym w obszarze roboczym usługi Azure Machine Learning.
Użyj wystąpienia obliczeniowego jako w pełni skonfigurowanego i zarządzanego środowiska programistycznego w chmurze. Na potrzeby programowania i testowania można również użyć wystąpienia jako docelowego obiektu obliczeniowego trenowania. Wystąpienie obliczeniowe może uruchamiać wiele zadań równolegle i ma kolejkę zadań. Jako środowisko programistyczne wystąpienie obliczeniowe nie może być współużytkowane z innymi użytkownikami w obszarze roboczym.
Z tego artykułu dowiesz się, jak uruchomić, zatrzymać, ponownie uruchomić, usunąć wystąpienie obliczeniowe. Zobacz Tworzenie wystąpienia obliczeniowego usługi Azure Machine Learning , aby dowiedzieć się, jak utworzyć wystąpienie obliczeniowe.
Uwaga
W tym artykule przedstawiono interfejs wiersza polecenia w wersji 2 w poniższych sekcjach. Jeśli nadal używasz interfejsu wiersza polecenia w wersji 1, zobacz Tworzenie interfejsu wiersza polecenia klastra obliczeniowego usługi Azure Machine Learning w wersji 1.
Wymagania wstępne
Obszar roboczy usługi Azure Machine Learning. Aby uzyskać więcej informacji, zobacz Tworzenie obszaru roboczego usługi Azure Machine Learning. Na koncie magazynu należy włączyć opcję "Zezwalaj na dostęp do klucza konta magazynu", aby tworzenie wystąpienia obliczeniowego zakończyło się pomyślnie.
Rozszerzenie interfejsu wiersza polecenia platformy Azure dla usługi Machine Learning Service (wersja 2),zestaw SDK języka Python usługi Azure Machine Learning (wersja 2) lub rozszerzenie usługi Azure Machine Learning Visual Studio Code.
Jeśli używasz zestawu SDK języka Python, skonfiguruj środowisko programistyczne z obszarem roboczym. Po skonfigurowaniu środowiska dołącz do obszaru roboczego w skrypsie języka Python:
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
Uruchom ten kod, aby nawiązać połączenie z obszarem roboczym usługi Azure ML.
Zastąp identyfikator subskrypcji, nazwę grupy zasobów i nazwę obszaru roboczego w poniższym kodzie. Aby znaleźć następujące wartości:
- Zaloguj się do Azure Machine Learning studio.
- Otwórz obszar roboczy, którego chcesz użyć.
- W prawym górnym rogu paska narzędzi Azure Machine Learning studio wybierz nazwę obszaru roboczego.
- Skopiuj wartość obszaru roboczego, grupy zasobów i identyfikatora subskrypcji do kodu.
- Jeśli używasz notesu wewnątrz programu Studio, musisz skopiować jedną wartość, zamknąć obszar i wkleić, a następnie wrócić do następnego.
# Enter details of your AML workspace subscription_id = "<SUBSCRIPTION_ID>" resource_group = "<RESOURCE_GROUP>" workspace = "<AML_WORKSPACE_NAME>"
# get a handle to the workspace from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential ml_client = MLClient( DefaultAzureCredential(), subscription_id, resource_group, workspace )
ml_client
to program obsługi obszaru roboczego, który będzie używany do zarządzania innymi zasobami i zadaniami.
Zarządzanie
Uruchamianie, zatrzymywanie, ponowne uruchamianie i usuwanie wystąpienia obliczeniowego. Wystąpienie obliczeniowe nie zawsze jest automatycznie skalowane w dół, dlatego upewnij się, że zatrzymaj zasób, aby zapobiec bieżącym opłatom. Zatrzymanie wystąpienia obliczeniowego powoduje cofnięcie jego przydziału. Następnie uruchom go ponownie, gdy będzie potrzebny. Zatrzymanie wystąpienia obliczeniowego zatrzymuje naliczanie opłat za godziny obliczeniowe, nadal jednak są naliczane opłaty za dysk, publiczny adres IP i standardowy moduł równoważenia obciążenia.
Możesz włączyć automatyczne zamykanie , aby automatycznie zatrzymać wystąpienie obliczeniowe po upływie określonego czasu.
Możesz również utworzyć harmonogram dla wystąpienia obliczeniowego, aby automatycznie uruchamiać i zatrzymywać się na podstawie godziny i dnia tygodnia.
Porada
Wystąpienie obliczeniowe korzysta z dysku systemu operacyjnego o pojemności 120 GB. Jeśli zabraknie miejsca na dysku, użyj terminalu , aby wyczyścić co najmniej 1–2 GB przed zatrzymaniem lub ponownym uruchomieniem wystąpienia obliczeniowego. Nie należy zatrzymywać wystąpienia obliczeniowego, wydając polecenie sudo shutdown z terminalu. Rozmiar dysku tymczasowego w wystąpieniu obliczeniowym zależy od wybranego rozmiaru maszyny wirtualnej i jest instalowany na /mnt.
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
W poniższych przykładach nazwa wystąpienia obliczeniowego jest przechowywana w zmiennej ci_basic_name
.
Uzyskiwanie stanu
from azure.ai.ml.entities import ComputeInstance, AmlCompute # Get compute ci_basic_state = ml_client.compute.get(ci_basic_name)
Stop
from azure.ai.ml.entities import ComputeInstance, AmlCompute # Stop compute ml_client.compute.begin_stop(ci_basic_name).wait()
Rozpocznij
from azure.ai.ml.entities import ComputeInstance, AmlCompute # Start compute ml_client.compute.begin_start(ci_basic_name).wait()
Uruchom ponownie
from azure.ai.ml.entities import ComputeInstance, AmlCompute # Restart compute ml_client.compute.begin_restart(ci_basic_name).wait()
Usuń
from azure.ai.ml.entities import ComputeInstance, AmlCompute ml_client.compute.begin_delete(ci_basic_name).wait()
Kontrola dostępu oparta na rolach platformy Azure umożliwia kontrolowanie, którzy użytkownicy w obszarze roboczym mogą tworzyć, usuwać, uruchamiać, zatrzymywać, uruchamiać ponownie wystąpienie obliczeniowe. Wszyscy użytkownicy z roli współautora i właściciela obszaru roboczego mogą tworzyć, usuwać, uruchamiać, zatrzymywać i ponownie uruchamiać wystąpienia obliczeniowe w obszarze roboczym. Jednak tylko twórca określonego wystąpienia obliczeniowego lub użytkownik przypisany, jeśli został utworzony w ich imieniu, może uzyskać dostęp do programu Jupyter, JupyterLab i RStudio w tym wystąpieniu obliczeniowym. Wystąpienie obliczeniowe jest przeznaczone dla pojedynczego użytkownika, który ma dostęp do konta głównego. Ten użytkownik ma dostęp do aplikacji Jupyter/JupyterLab/RStudio działającej w wystąpieniu. Wystąpienie obliczeniowe będzie miało logowanie jednokrotne użytkownika, a wszystkie akcje będą używać tożsamości tego użytkownika na potrzeby kontroli dostępu opartej na rolach platformy Azure i przypisywania zadań eksperymentu. Dostęp za pomocą protokołu SSH jest kontrolowany za pomocą mechanizmu kluczy publicznych/prywatnych.
Te akcje mogą być kontrolowane przez kontrolę dostępu opartą na rolach platformy Azure:
- Microsoft.MachineLearningServices/workspaces/computes/read
- Microsoft.MachineLearningServices/workspaces/computes/write
- Microsoft.MachineLearningServices/workspaces/computes/delete
- Microsoft.MachineLearningServices/workspaces/computes/start/action
- Microsoft.MachineLearningServices/workspaces/computes/stop/action
- Microsoft.MachineLearningServices/workspaces/computes/restart/action
- Microsoft.MachineLearningServices/workspaces/computes/updateSchedules/action
Aby utworzyć wystąpienie obliczeniowe, musisz mieć uprawnienia do następujących akcji:
- Microsoft.MachineLearningServices/workspaces/computes/write
- Microsoft.MachineLearningServices/workspaces/checkComputeNameAvailability/action
Inspekcja i obserwowanie wersji wystąpienia obliczeniowego
Po wdrożeniu wystąpienia obliczeniowego nie zostanie ono automatycznie zaktualizowane. Firma Microsoft publikuje nowe obrazy maszyn wirtualnych co miesiąc. Aby poznać opcje utrzymywania najnowszej wersji, zobacz Zarządzanie lukami w zabezpieczeniach.
Aby śledzić, czy wersja systemu operacyjnego wystąpienia jest aktualna, możesz wykonać zapytanie dotyczące jego wersji przy użyciu interfejsu wiersza polecenia, zestawu SDK lub interfejsu użytkownika programu Studio.
- Interfejs użytkownika programu Studio
- Zestaw SDK dla języka Python
- Interfejs wiersza polecenia platformy Azure
DOTYCZY: Zestaw SDK języka Python azure-ai-ml w wersji 2 (bieżący)
from azure.ai.ml.entities import ComputeInstance, AmlCompute
# Display operating system version
instance = ml_client.compute.get("myci")
print instance.os_image_metadata
Aby uzyskać więcej informacji na temat klas, metod i parametrów używanych w tym przykładzie, zobacz następujące dokumenty referencyjne:
- Klasa
AmlCompute
- Klasa
ComputeInstance
Administratorzy IT mogą używać Azure Policy do monitorowania spisu wystąpień w obszarach roboczych w portalu zgodności Azure Policy. Przypisz wbudowane zasady Audit Azure Machine Learning Compute Instances z nieaktualnym systemem operacyjnym w ramach subskrypcji platformy Azure lub zakresu grupy zarządzania platformy Azure.