AksServiceDeploymentConfiguration Klasa
Reprezentuje informacje o konfiguracji wdrożenia dla usługi wdrożonej na Azure Kubernetes Service.
Utwórz obiekt AksServiceDeploymentConfiguration przy użyciu deploy_configuration
metody AksWebservice klasy .
Zainicjuj obiekt konfiguracji do wdrożenia w docelowym obiekcie obliczeniowym usługi AKS.
- Dziedziczenie
-
AksServiceDeploymentConfiguration
Konstruktor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parametry
- cpu_cores_limit
Maksymalna liczba rdzeni procesora CPU, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna.
- memory_gb_limit
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna.
- autoscale_enabled
- bool
Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web.
Wartość domyślna to True, jeśli num_replicas
ma wartość None.
- autoscale_min_replicas
- int
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.
- autoscale_max_replicas
- int
Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10
- autoscale_refresh_seconds
- int
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.
- autoscale_target_utilization
- int
Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.
- collect_model_data
- bool
Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.
- auth_enabled
- bool
Określa, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.
- cpu_cores
- float
Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1
- memory_gb
- float
Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5
- enable_app_insights
- bool
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to Fałsz
- scoring_timeout_ms
- int
Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web. Wartość domyślna to 60000.
- replica_max_concurrent_requests
- int
Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie to poinstruowane przez pomoc techniczną firmy Microsoft lub członka zespołu usługi Azure Machine Learning.
- max_request_wait_time
- int
Maksymalny czas oczekiwania żądania pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.
- num_replicas
- int
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Tych właściwości nie można zmienić po wdrożeniu, jednak można dodać nowe pary wartości klucza.
- gpu_cores
- int
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.
- period_seconds
- int
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.
- initial_delay_seconds
- int
Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond żywotności. Wartość domyślna to 310.
- timeout_seconds
- int
Liczba sekund, po których upłynął limit czasu sondy utrzymania. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.
- success_threshold
- int
Minimalna liczba kolejnych sukcesów sondy utrzymania, która ma zostać uznana za pomyślną po niepowieść. Wartość domyślna to 1. Wartość minimalna to 1.
- failure_threshold
- int
Gdy zasobnik zostanie uruchomiony, a sonda aktualności zakończy się niepowodzeniem, platforma Kubernetes spróbuje kilka razy failureThreshold
przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.
- namespace
- str
Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.
- token_auth_enabled
- bool
Czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi internetowej. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.
- cpu_cores_limit
Maksymalna liczba rdzeni procesora CPU, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna.
- memory_gb_limit
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna.
- blobfuse_enabled
- bool
Czy włączyć system blobfuse na potrzeby pobierania modelu dla tej usługi sieci Web. Wartość domyślna to True
- autoscale_enabled
- bool
Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web.
Wartość domyślna to True, jeśli num_replicas
ma wartość None.
- autoscale_min_replicas
- int
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.
- autoscale_max_replicas
- int
Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10
- autoscale_refresh_seconds
- int
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.
- autoscale_target_utilization
- int
Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.
- collect_model_data
- bool
Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.
- auth_enabled
- bool
Określa, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.
- cpu_cores
- float
Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1
- memory_gb
- float
Ilość pamięci (w GB), która ma być przydzielana dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5
- enable_app_insights
- bool
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartości domyślne to False
- scoring_timeout_ms
- int
Limit czasu wymuszania wywołań oceniania dla tej usługi sieci Web. Wartość domyślna to 60000.
- replica_max_concurrent_requests
- int
Liczba maksymalnie współbieżnych żądań na replikę, która umożliwia korzystanie z tej usługi sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie poinstruowany przez pomoc techniczną firmy Microsoft lub członek zespołu usługi Azure Machine Learning.
- max_request_wait_time
- int
Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.
- num_replicas
- int
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie ma wartości domyślnej, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Nie można zmienić tych właściwości po wdrożeniu, jednak można dodać nowe pary wartości klucza.
- gpu_cores
- int
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.
- period_seconds
- int
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.
- initial_delay_seconds
- int
Liczba sekund po uruchomieniu kontenera przed zainicjowanymi sondami aktualności. Wartość domyślna to 310.
- timeout_seconds
- int
Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.
- success_threshold
- int
Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1.
- failure_threshold
- int
Gdy zasobnik zostanie uruchomiony, a sonda liveness zakończy się niepowodzeniem, platforma Kubernetes spróbuje failureThreshold
kilka razy przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.
- namespace
- str
Przestrzeń nazw platformy Kubernetes, w której ma zostać wdrożona ta usługa sieci Web: do 63 małych liter alfanumeryczne ('a'-'z', '0'-'9') i łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.
- token_auth_enabled
- bool
Niezależnie od tego, czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi sieci Web, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.
- cpu_cores_limit
- float
Maksymalna liczba rdzeni procesora cpu, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna.
- memory_gb_limit
- float
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna.
- blobfuse_enabled
- bool
Czy włączyć blobfuse na potrzeby pobierania modelu dla tej usługi sieci Web. Wartość domyślna to True
Zmienne
- autoscale_enabled
- bool
Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web.
Wartość domyślna to True, jeśli num_replicas
ma wartość None.
- autoscale_min_replicas
- int
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.
- autoscale_max_replicas
- int
Maksymalna liczba kontenerów do użycia podczas automatycznego skalowania tej usługi sieci Web. Wartość domyślna to 10
- autoscale_refresh_seconds
- int
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.
- autoscale_target_utilization
- int
Użycie docelowe (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.
- collect_model_data
- bool
Czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.
- auth_enabled
- bool
Niezależnie od tego, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.
- cpu_cores
- float
Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1
- memory_gb
- float
Ilość pamięci (w GB), która ma być przydzielana dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5
- enable_app_insights
- bool
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartości domyślne to False
- scoring_timeout_ms
- int
Limit czasu wymuszania wywołań oceniania dla tej usługi sieci Web. Wartość domyślna to 60000.
- replica_max_concurrent_requests
- int
Liczba maksymalnie współbieżnych żądań na replikę, która umożliwia korzystanie z tej usługi sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie poinstruowany przez pomoc techniczną firmy Microsoft lub członek zespołu usługi Azure Machine Learning.
- max_request_wait_time
- int
Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.
- num_replicas
- int
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie ma wartości domyślnej, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.
- primary_key
- str
Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web.
- secondary_key
- str
Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Nie można zmienić tych właściwości po wdrożeniu, jednak można dodać nowe pary wartości klucza.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Opis, który ma nadać tej usłudze sieci Web.
- gpu_cores
- int
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.
- period_seconds
- int
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.
- initial_delay_seconds
- int
Liczba sekund po uruchomieniu kontenera przed zainicjowanymi sondami aktualności. Wartość domyślna to 310.
- timeout_seconds
- int
Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.
- success_threshold
- int
Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1.
- failure_threshold
- int
Gdy zasobnik zostanie uruchomiony, a sonda aktualności zakończy się niepowodzeniem, platforma Kubernetes spróbuje kilka razy failureThreshold
przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.
- token_auth_enabled
- bool
Czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi internetowej. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.
Metody
print_deploy_configuration |
Wydrukuj konfigurację wdrożenia. |
validate_configuration |
Sprawdź, czy określone wartości konfiguracji są prawidłowe. Jeśli walidacja nie powiedzie się, zgłosi wyjątek WebserviceException. |
print_deploy_configuration
Wydrukuj konfigurację wdrożenia.
print_deploy_configuration()
validate_configuration
Sprawdź, czy określone wartości konfiguracji są prawidłowe.
Jeśli walidacja nie powiedzie się, zgłosi wyjątek WebserviceException.
validate_configuration()
Wyjątki
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla