Zarządzanie wystąpieniem obliczeniowym usługi Azure Machine Learning

Artykuł
09/02/2024

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)

Dowiedz się, jak zarządzać wystąpieniem obliczeniowym w obszarze roboczym usługi Azure Machine Learning.

Użyj wystąpienia obliczeniowego jako w pełni skonfigurowanego i zarządzanego środowiska programistycznego w chmurze. Na potrzeby programowania i testowania można również użyć wystąpienia jako celu obliczeniowego trenowania. Wystąpienie obliczeniowe może uruchamiać wiele zadań równolegle i ma kolejkę zadań. Jako środowisko programistyczne wystąpienie obliczeniowe nie może być współużytkowane przez innych użytkowników w obszarze roboczym.

Z tego artykułu dowiesz się, jak uruchomić, zatrzymać, uruchomić ponownie, usunąć wystąpienie obliczeniowe. Aby dowiedzieć się, jak utworzyć wystąpienie obliczeniowe, zobacz Tworzenie wystąpienia obliczeniowego usługi Azure Machine Learning.

Uwaga

W tym artykule przedstawiono interfejs wiersza polecenia w wersji 2 w poniższych sekcjach. Jeśli nadal używasz interfejsu wiersza polecenia w wersji 1, zobacz Tworzenie interfejsu wiersza polecenia klastra obliczeniowego usługi Azure Machine Learning w wersji 1.

Wymagania wstępne

Obszar roboczy usługi Azure Machine Learning. Aby uzyskać więcej informacji, zobacz Zarządzanie obszarami roboczymi usługi Azure Machine Learning.

Wybierz odpowiednią kartę dla pozostałych wymagań wstępnych w oparciu o preferowaną metodę zarządzania wystąpieniem obliczeniowym.

Jeśli nie uruchamiasz kodu w wystąpieniu obliczeniowym, zainstaluj zestaw SDK języka Python usługi Azure Machine Learning. Ten zestaw SDK jest już zainstalowany w wystąpieniu obliczeniowym.
Dołącz do obszaru roboczego w skrypsie języka Python:

Uruchom ten kod, aby nawiązać połączenie z obszarem roboczym usługi Azure Machine Learning.

Zastąp identyfikator subskrypcji, nazwę grupy zasobów i nazwę obszaru roboczego w poniższym kodzie. Aby znaleźć następujące wartości:
1. Zaloguj się do usługi Azure Machine Learning Studio.
2. Otwórz obszar roboczy, którego chcesz użyć.
3. Wybierz nazwę obszaru roboczego na pasku narzędzi usługi Azure Machine Learning Studio w prawym górnym rogu.
4. Skopiuj wartość obszaru roboczego, grupy zasobów i identyfikatora subskrypcji do kodu.
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)
```
# Enter details of your AML workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AML_WORKSPACE_NAME>"
```
```
# get a handle to the workspace
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)
```
ml_client jest procedurą obsługi obszaru roboczego używanego do zarządzania innymi zasobami i zadaniami.

Jeśli nie uruchamiasz tych poleceń w wystąpieniu obliczeniowym, zainstaluj rozszerzenie interfejsu wiersza polecenia platformy Azure dla usługi Machine Learning Service (wersja 2). To rozszerzenie jest już zainstalowane w wystąpieniu obliczeniowym.
Uwierzytelnianie i ustawianie domyślnego obszaru roboczego i grupy zasobów. Pozostaw otwarty terminal, aby uruchomić pozostałe polecenia w tym artykule.
- Jeśli korzystasz z wystąpienia obliczeniowego:
```
az login --identity
# next line needed only if you have multiple subscriptions:
az account set --subscription "<SUBSCRIPTION-NAME>" # replace with your subscription name
az configure --defaults group=$CI_RESOURCE_GROUP workspace=$CI_WORKSPACE
```
- Jeśli uruchamiasz polecenia lokalnie, pomiń --identity i postępuj zgodnie z instrukcjami dotyczącymi uwierzytelniania. Zastąp $CI_RESOURCE_GROUP również wartościami i $CI_WORKSPACE .

Zarządzanie

Uruchamianie, zatrzymywanie, ponowne uruchamianie i usuwanie wystąpienia obliczeniowego. Wystąpienie obliczeniowe nie zawsze jest automatycznie skalowane w dół, dlatego pamiętaj, aby zatrzymać zasób, aby zapobiec trwającym opłatom. Zatrzymanie wystąpienia obliczeniowego powoduje cofnięcie jego przydziału. Następnie uruchom go ponownie, gdy będzie potrzebny. Zatrzymanie wystąpienia obliczeniowego zatrzymuje naliczanie opłat za godziny obliczeniowe, nadal jednak są naliczane opłaty za dysk, publiczny adres IP i standardowy moduł równoważenia obciążenia.

Możesz włączyć automatyczne zamykanie , aby automatycznie zatrzymać wystąpienie obliczeniowe po upływie określonego czasu.

Możesz również utworzyć harmonogram dla wystąpienia obliczeniowego, aby automatycznie uruchamiać i zatrzymywać się na podstawie godziny i dnia tygodnia.

Napiwek

Wystąpienie obliczeniowe korzysta z dysku systemu operacyjnego o pojemności 120 GB. Jeśli zabraknie miejsca na dysku, użyj terminalu, aby wyczyścić co najmniej 5 GB przed zatrzymaniem lub ponownym uruchomieniem wystąpienia obliczeniowego. Nie należy zatrzymywać wystąpienia obliczeniowego, wydając polecenie sudo shutdown z terminalu. Rozmiar dysku tymczasowego w wystąpieniu obliczeniowym zależy od wybranego rozmiaru maszyny wirtualnej i jest zainstalowany na /mnt.

DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

W tych przykładach nazwa wystąpienia obliczeniowego jest przechowywana w zmiennej ci_basic_name.

Uzyskiwanie stanu

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Get compute
ci_basic_state = ml_client.compute.get(ci_basic_name)

Zatrzymaj

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Stop compute
ml_client.compute.begin_stop(ci_basic_name).wait()

Rozpocznij

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Start compute
ml_client.compute.begin_start(ci_basic_name).wait()

Uruchom ponownie

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Restart compute
ml_client.compute.begin_restart(ci_basic_name).wait()

Delete

from azure.ai.ml.entities import ComputeInstance, AmlCompute

ml_client.compute.begin_delete(ci_basic_name).wait()

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure ml w wersji 2 (bieżąca)

W tych przykładach nazwa wystąpienia obliczeniowego to wystąpienie.

Zatrzymaj
```
az ml compute stop --name instance 
```
Rozpocznij
```
az ml compute start --name instance 
```
Uruchom ponownie
```
az ml compute restart --name instance 
```
Delete
```
az ml compute delete --name instance 
```

W obszarze roboczym w usłudze Azure Machine Learning Studio wybierz pozycję Obliczenia, a następnie wybierz pozycję Wystąpienie obliczeniowe u góry.

Możesz wykonać następujące czynności:

Tworzenie nowego wystąpienia obliczeniowego
Odśwież kartę wystąpienia obliczeniowe.
Uruchamianie, zatrzymywanie i ponowne uruchamianie wystąpienia obliczeniowego. Płacisz za wystąpienie za każdym razem, gdy jest ono uruchomione. Zatrzymaj wystąpienie obliczeniowe, gdy nie używasz go do obniżenia kosztów. Zatrzymanie wystąpienia obliczeniowego powoduje cofnięcie jego przydziału. Następnie uruchom go ponownie, gdy będzie potrzebny. Możesz również zaplanować czas uruchamiania i zatrzymywania wystąpienia obliczeniowego.
Usuwanie wystąpienia obliczeniowego.
Przefiltruj listę wystąpień obliczeniowych, aby wyświetlić tylko utworzone wystąpienia.

Dla każdego wystąpienia obliczeniowego w utworzonym obszarze roboczym (lub utworzonym dla Ciebie) możesz:

Uzyskaj dostęp do programu Jupyter, JupyterLab, RStudio w wystąpieniu obliczeniowym.
Połączenie SSH z wystąpieniem obliczeniowym. Dostęp SSH jest domyślnie wyłączony, ale można go włączyć w czasie tworzenia wystąpienia obliczeniowego. Dostęp za pomocą protokołu SSH odbywa się za pośrednictwem mechanizmu klucza publicznego/prywatnego. Karta zawiera szczegółowe informacje dotyczące połączenia SSH, takie jak adres IP, nazwa użytkownika i numer portu. We wdrożeniu sieci wirtualnej wyłączenie protokołu SSH uniemożliwia dostęp do protokołu SSH z publicznego Internetu. Nadal można sSH z sieci wirtualnej przy użyciu prywatnego adresu IP węzła wystąpienia obliczeniowego i portu 22.

Napiwek

Jeśli wystąpienia obliczeniowe są w zarządzanej sieci wirtualnej, a publiczny adres IP jest wyłączony, użyj az ml compute connect-ssh polecenia , aby nawiązać połączenie z wystąpieniem obliczeniowym.
Wybierz nazwę obliczeniową do:
- Wyświetl szczegółowe informacje o konkretnym wystąpieniu obliczeniowym, takim jak adres IP i region.
- Utwórz lub zmodyfikuj harmonogram uruchamiania i zatrzymywania wystąpienia obliczeniowego. Przewiń w dół do dołu strony, aby edytować harmonogram.

Kontrola dostępu oparta na rolach platformy Azure umożliwia kontrolowanie, którzy użytkownicy w obszarze roboczym mogą tworzyć, usuwać, uruchamiać, zatrzymywać, uruchamiać ponownie wystąpienie obliczeniowe. Wszyscy użytkownicy z roli współautora obszaru roboczego i właściciela mogą tworzyć, usuwać, uruchamiać, zatrzymywać i ponownie uruchamiać wystąpienia obliczeniowe w obszarze roboczym. Jednak tylko twórca określonego wystąpienia obliczeniowego lub użytkownik przypisany, jeśli został utworzony w ich imieniu, może uzyskać dostęp do programu Jupyter, JupyterLab i RStudio w tym wystąpieniu obliczeniowym. Wystąpienie obliczeniowe jest przeznaczone dla pojedynczego użytkownika, który ma dostęp główny. Ten użytkownik ma dostęp do aplikacji Jupyter/JupyterLab/RStudio uruchomionej w wystąpieniu. Wystąpienie obliczeniowe ma logowanie jednokrotne użytkownika i wszystkie akcje używają tożsamości tego użytkownika dla kontroli dostępu opartej na rolach platformy Azure i przypisywania zadań eksperymentu. Dostęp za pomocą protokołu SSH jest kontrolowany za pomocą mechanizmu klucza publicznego/prywatnego.

Te akcje można kontrolować za pomocą kontroli dostępu opartej na rolach platformy Azure:

Microsoft.MachineLearningServices/workspaces/computes/read
Microsoft.MachineLearningServices/workspaces/computes/write
Microsoft.MachineLearningServices/workspaces/computes/delete
Microsoft.MachineLearningServices/workspaces/computes/start/action
Microsoft.MachineLearningServices/workspaces/computes/stop/action
Microsoft.MachineLearningServices/workspaces/computes/restart/action
Microsoft.MachineLearningServices/workspaces/computes/updateSchedules/action

Aby utworzyć wystąpienie obliczeniowe, musisz mieć uprawnienia do następujących akcji:

Microsoft.MachineLearningServices/workspaces/computes/write
Microsoft.MachineLearningServices/workspaces/checkComputeNameAvailability/action

Inspekcja i obserwowanie wersji wystąpienia obliczeniowego

Po wdrożeniu wystąpienia obliczeniowego nie zostanie ono automatycznie zaktualizowane. Firma Microsoft wydaje nowe obrazy maszyn wirtualnych co miesiąc. Aby poznać opcje przechowywania najnowszych wersji, zobacz zarządzanie lukami w zabezpieczeniach.

Aby śledzić, czy wersja systemu operacyjnego wystąpienia jest aktualna, możesz wykonać zapytanie dotyczące jego wersji przy użyciu interfejsu wiersza polecenia, zestawu SDK lub interfejsu użytkownika programu Studio.

DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Display operating system version
instance = ml_client.compute.get("myci")
print instance.os_image_metadata

Aby uzyskać więcej informacji na temat klas, metod i parametrów używanych w tym przykładzie, zobacz następujące dokumenty referencyjne:

Klasa AmlCompute
Klasa ComputeInstance

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure ml w wersji 2 (bieżąca)

az ml compute show --name "myci"

# query outdated compute instances:
az ml compute list --query "[?os_image_metadata.is_latest_os_image_version == ``false``].name"

Administratorzy IT mogą używać usługi Azure Policy do monitorowania spisu wystąpień w obszarach roboczych w portalu zgodności usługi Azure Policy. Przypisz wbudowane zasady Audit Azure Machine Learning Compute Instances z nieaktualnym systemem operacyjnym w subskrypcji platformy Azure lub w zakresie grupy zarządzania platformy Azure.

Udostępnij za pośrednictwem

Zarządzanie wystąpieniem obliczeniowym usługi Azure Machine Learning

Wymagania wstępne

Zarządzanie

Inspekcja i obserwowanie wersji wystąpienia obliczeniowego

Następne kroki

Opinia

Dodatkowe zasoby