AksServiceDeploymentConfiguration Klasa

Reprezentuje informacje o konfiguracji wdrożenia dla usługi wdrożonej na Azure Kubernetes Service.

Utwórz obiekt AksServiceDeploymentConfiguration przy użyciu deploy_configuration metody AksWebservice klasy .

Zainicjuj obiekt konfiguracji do wdrożenia w docelowym obiekcie obliczeniowym usługi AKS.

Dziedziczenie
AksServiceDeploymentConfiguration

Konstruktor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parametry

cpu_cores_limit
Wymagane

Maksymalna liczba rdzeni procesora CPU, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna.

memory_gb_limit
Wymagane

Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna.

autoscale_enabled
bool
Wymagane

Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web. Wartość domyślna to True, jeśli num_replicas ma wartość None.

autoscale_min_replicas
int
Wymagane

Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.

autoscale_max_replicas
int
Wymagane

Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10

autoscale_refresh_seconds
int
Wymagane

Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.

autoscale_target_utilization
int
Wymagane

Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.

collect_model_data
bool
Wymagane

Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.

auth_enabled
bool
Wymagane

Określa, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.

cpu_cores
float
Wymagane

Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1

memory_gb
float
Wymagane

Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5

enable_app_insights
bool
Wymagane

Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to Fałsz

scoring_timeout_ms
int
Wymagane

Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web. Wartość domyślna to 60000.

replica_max_concurrent_requests
int
Wymagane

Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie to poinstruowane przez pomoc techniczną firmy Microsoft lub członka zespołu usługi Azure Machine Learning.

max_request_wait_time
int
Wymagane

Maksymalny czas oczekiwania żądania pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.

num_replicas
int
Wymagane

Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.

primary_key
str
Wymagane

Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web.

secondary_key
str
Wymagane

Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web.

tags
dict[str, str]
Wymagane

Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web.

properties
dict[str, str]
Wymagane

Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Tych właściwości nie można zmienić po wdrożeniu, jednak można dodać nowe pary wartości klucza.

description
str
Wymagane

Opis umożliwiający nadanie tej usłudze sieci Web.

gpu_cores
int
Wymagane

Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.

period_seconds
int
Wymagane

Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.

initial_delay_seconds
int
Wymagane

Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond żywotności. Wartość domyślna to 310.

timeout_seconds
int
Wymagane

Liczba sekund, po których upłynął limit czasu sondy utrzymania. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.

success_threshold
int
Wymagane

Minimalna liczba kolejnych sukcesów sondy utrzymania, która ma zostać uznana za pomyślną po niepowieść. Wartość domyślna to 1. Wartość minimalna to 1.

failure_threshold
int
Wymagane

Gdy zasobnik zostanie uruchomiony, a sonda aktualności zakończy się niepowodzeniem, platforma Kubernetes spróbuje kilka razy failureThreshold przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.

namespace
str
Wymagane

Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.

token_auth_enabled
bool
Wymagane

Czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi internetowej. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.

cpu_cores_limit
Wymagane

Maksymalna liczba rdzeni procesora CPU, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna.

memory_gb_limit
Wymagane

Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna.

blobfuse_enabled
bool
wartość domyślna: None

Czy włączyć system blobfuse na potrzeby pobierania modelu dla tej usługi sieci Web. Wartość domyślna to True

autoscale_enabled
bool
Wymagane

Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web. Wartość domyślna to True, jeśli num_replicas ma wartość None.

autoscale_min_replicas
int
Wymagane

Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.

autoscale_max_replicas
int
Wymagane

Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10

autoscale_refresh_seconds
int
Wymagane

Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.

autoscale_target_utilization
int
Wymagane

Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.

collect_model_data
bool
Wymagane

Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.

auth_enabled
bool
Wymagane

Określa, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.

cpu_cores
float
Wymagane

Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1

memory_gb
float
Wymagane

Ilość pamięci (w GB), która ma być przydzielana dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5

enable_app_insights
bool
Wymagane

Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartości domyślne to False

scoring_timeout_ms
int
Wymagane

Limit czasu wymuszania wywołań oceniania dla tej usługi sieci Web. Wartość domyślna to 60000.

replica_max_concurrent_requests
int
Wymagane

Liczba maksymalnie współbieżnych żądań na replikę, która umożliwia korzystanie z tej usługi sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie poinstruowany przez pomoc techniczną firmy Microsoft lub członek zespołu usługi Azure Machine Learning.

max_request_wait_time
int
Wymagane

Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.

num_replicas
int
Wymagane

Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie ma wartości domyślnej, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.

primary_key
str
Wymagane

Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web.

secondary_key
str
Wymagane

Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web.

tags
dict[str, str]
Wymagane

Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web.

properties
dict[str, str]
Wymagane

Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Nie można zmienić tych właściwości po wdrożeniu, jednak można dodać nowe pary wartości klucza.

description
str
Wymagane

Opis, który ma nadać tej usłudze sieci Web.

gpu_cores
int
Wymagane

Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.

period_seconds
int
Wymagane

Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.

initial_delay_seconds
int
Wymagane

Liczba sekund po uruchomieniu kontenera przed zainicjowanymi sondami aktualności. Wartość domyślna to 310.

timeout_seconds
int
Wymagane

Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.

success_threshold
int
Wymagane

Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1.

failure_threshold
int
Wymagane

Gdy zasobnik zostanie uruchomiony, a sonda liveness zakończy się niepowodzeniem, platforma Kubernetes spróbuje failureThreshold kilka razy przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.

namespace
str
Wymagane

Przestrzeń nazw platformy Kubernetes, w której ma zostać wdrożona ta usługa sieci Web: do 63 małych liter alfanumeryczne ('a'-'z', '0'-'9') i łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.

token_auth_enabled
bool
Wymagane

Niezależnie od tego, czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi sieci Web, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.

compute_target_name
str
Wymagane

Nazwa docelowego obiektu obliczeniowego do wdrożenia

cpu_cores_limit
float
Wymagane

Maksymalna liczba rdzeni procesora cpu, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna.

memory_gb_limit
float
Wymagane

Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna.

blobfuse_enabled
bool
Wymagane

Czy włączyć blobfuse na potrzeby pobierania modelu dla tej usługi sieci Web. Wartość domyślna to True

Zmienne

autoscale_enabled
bool

Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web. Wartość domyślna to True, jeśli num_replicas ma wartość None.

autoscale_min_replicas
int

Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.

autoscale_max_replicas
int

Maksymalna liczba kontenerów do użycia podczas automatycznego skalowania tej usługi sieci Web. Wartość domyślna to 10

autoscale_refresh_seconds
int

Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.

autoscale_target_utilization
int

Użycie docelowe (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.

collect_model_data
bool

Czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.

auth_enabled
bool

Niezależnie od tego, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.

cpu_cores
float

Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1

memory_gb
float

Ilość pamięci (w GB), która ma być przydzielana dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5

enable_app_insights
bool

Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartości domyślne to False

scoring_timeout_ms
int

Limit czasu wymuszania wywołań oceniania dla tej usługi sieci Web. Wartość domyślna to 60000.

replica_max_concurrent_requests
int

Liczba maksymalnie współbieżnych żądań na replikę, która umożliwia korzystanie z tej usługi sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie poinstruowany przez pomoc techniczną firmy Microsoft lub członek zespołu usługi Azure Machine Learning.

max_request_wait_time
int

Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.

num_replicas
int

Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie ma wartości domyślnej, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.

primary_key
str

Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web.

secondary_key
str

Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Nie można zmienić tych właściwości po wdrożeniu, jednak można dodać nowe pary wartości klucza.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Opis, który ma nadać tej usłudze sieci Web.

gpu_cores
int

Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.

period_seconds
int

Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.

initial_delay_seconds
int

Liczba sekund po uruchomieniu kontenera przed zainicjowanymi sondami aktualności. Wartość domyślna to 310.

timeout_seconds
int

Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.

success_threshold
int

Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1.

failure_threshold
int

Gdy zasobnik zostanie uruchomiony, a sonda aktualności zakończy się niepowodzeniem, platforma Kubernetes spróbuje kilka razy failureThreshold przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.

token_auth_enabled
bool

Czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi internetowej. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.

Metody

print_deploy_configuration

Wydrukuj konfigurację wdrożenia.

validate_configuration

Sprawdź, czy określone wartości konfiguracji są prawidłowe.

Jeśli walidacja nie powiedzie się, zgłosi wyjątek WebserviceException.

print_deploy_configuration

Wydrukuj konfigurację wdrożenia.

print_deploy_configuration()

validate_configuration

Sprawdź, czy określone wartości konfiguracji są prawidłowe.

Jeśli walidacja nie powiedzie się, zgłosi wyjątek WebserviceException.

validate_configuration()

Wyjątki