AksServiceDeploymentConfiguration Klasse

Stellt Informationen zur Bereitstellungskonfiguration für einen in Azure Kubernetes Service bereitgestellten Dienst dar.

Erstellt ein AksServiceDeploymentConfiguration-Objekt mithilfe der deploy_configuration-Methode der AksWebservice-Klasse

Initialisieren Sie ein Konfigurationsobjekt für die Bereitstellung in einem AKS-Computeziel.

Vererbung
AksServiceDeploymentConfiguration

Konstruktor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parameter

cpu_cores_limit
Erforderlich

Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein.

memory_gb_limit
Erforderlich

Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.

autoscale_enabled
bool
Erforderlich

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn num_replicas „None“ (Keine) ist.

autoscale_min_replicas
int
Erforderlich

Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

autoscale_max_replicas
int
Erforderlich

Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10

autoscale_refresh_seconds
int
Erforderlich

Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

autoscale_target_utilization
int
Erforderlich

Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.

collect_model_data
bool
Erforderlich

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

auth_enabled
bool
Erforderlich

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

cpu_cores
float
Erforderlich

Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1

memory_gb
float
Erforderlich

Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.

enable_app_insights
bool
Erforderlich

Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“.

scoring_timeout_ms
int
Erforderlich

Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.

replica_max_concurrent_requests
int
Erforderlich

Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.

max_request_wait_time
int
Erforderlich

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.

num_replicas
int
Erforderlich

Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.

primary_key
str
Erforderlich

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll

secondary_key
str
Erforderlich

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll

tags
dict[str, str]
Erforderlich

Wörterbuch der Schlüsselwerttags für diesen Webdienst

properties
dict[str, str]
Erforderlich

Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.

description
str
Erforderlich

Eine Beschreibung für diesen Webdienst

gpu_cores
int
Erforderlich

Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.

period_seconds
int
Erforderlich

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

initial_delay_seconds
int
Erforderlich

Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310.

timeout_seconds
int
Erforderlich

Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.

success_threshold
int
Erforderlich

Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1.

failure_threshold
int
Erforderlich

Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.

namespace
str
Erforderlich

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.

token_auth_enabled
bool
Erforderlich

Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

cpu_cores_limit
Erforderlich

Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein.

memory_gb_limit
Erforderlich

Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.

blobfuse_enabled
bool
Standardwert: None

Gibt an, ob blobfuse für Modelldownloads für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

autoscale_enabled
bool
Erforderlich

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn num_replicas „None“ (Keine) ist.

autoscale_min_replicas
int
Erforderlich

Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

autoscale_max_replicas
int
Erforderlich

Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10

autoscale_refresh_seconds
int
Erforderlich

Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

autoscale_target_utilization
int
Erforderlich

Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.

collect_model_data
bool
Erforderlich

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

auth_enabled
bool
Erforderlich

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

cpu_cores
float
Erforderlich

Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1

memory_gb
float
Erforderlich

Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.

enable_app_insights
bool
Erforderlich

Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“.

scoring_timeout_ms
int
Erforderlich

Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.

replica_max_concurrent_requests
int
Erforderlich

Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.

max_request_wait_time
int
Erforderlich

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.

num_replicas
int
Erforderlich

Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.

primary_key
str
Erforderlich

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll

secondary_key
str
Erforderlich

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll

tags
dict[str, str]
Erforderlich

Wörterbuch der Schlüsselwerttags für diesen Webdienst

properties
dict[str, str]
Erforderlich

Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.

description
str
Erforderlich

Eine Beschreibung für diesen Webdienst

gpu_cores
int
Erforderlich

Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.

period_seconds
int
Erforderlich

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

initial_delay_seconds
int
Erforderlich

Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310.

timeout_seconds
int
Erforderlich

Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.

success_threshold
int
Erforderlich

Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1.

failure_threshold
int
Erforderlich

Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.

namespace
str
Erforderlich

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.

token_auth_enabled
bool
Erforderlich

Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

compute_target_name
str
Erforderlich

Der Name des Computeziels, in dem die Bereitstellung erfolgen soll

cpu_cores_limit
float
Erforderlich

Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein.

memory_gb_limit
float
Erforderlich

Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.

blobfuse_enabled
bool
Erforderlich

Gibt an, ob blobfuse für Modelldownloads für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

Variablen

autoscale_enabled
bool

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn num_replicas „None“ (Keine) ist.

autoscale_min_replicas
int

Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

autoscale_max_replicas
int

Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10

autoscale_refresh_seconds
int

Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

autoscale_target_utilization
int

Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.

collect_model_data
bool

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

auth_enabled
bool

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

cpu_cores
float

Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1

memory_gb
float

Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.

enable_app_insights
bool

Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“.

scoring_timeout_ms
int

Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.

replica_max_concurrent_requests
int

Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.

max_request_wait_time
int

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.

num_replicas
int

Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.

primary_key
str

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll

secondary_key
str

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Wörterbuch der Schlüsselwerttags für diesen Webdienst

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Eine Beschreibung für diesen Webdienst

gpu_cores
int

Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.

period_seconds
int

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

initial_delay_seconds
int

Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310.

timeout_seconds
int

Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.

success_threshold
int

Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1.

failure_threshold
int

Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.

token_auth_enabled
bool

Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

Methoden

print_deploy_configuration

Ausgeben der Bereitstellungskonfiguration.

validate_configuration

Überprüft, ob die angegebenen Konfigurationswerte gültig sind.

Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war.

print_deploy_configuration

Ausgeben der Bereitstellungskonfiguration.

print_deploy_configuration()

validate_configuration

Überprüft, ob die angegebenen Konfigurationswerte gültig sind.

Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war.

validate_configuration()

Ausnahmen