AksServiceDeploymentConfiguration Klasse
Stellt Informationen zur Bereitstellungskonfiguration für einen in Azure Kubernetes Service bereitgestellten Dienst dar.
Erstellt ein AksServiceDeploymentConfiguration-Objekt mithilfe der deploy_configuration
-Methode der AksWebservice-Klasse
Initialisieren Sie ein Konfigurationsobjekt für die Bereitstellung in einem AKS-Computeziel.
- Vererbung
-
AksServiceDeploymentConfiguration
Konstruktor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parameter
- cpu_cores_limit
Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein.
- memory_gb_limit
Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.
- autoscale_enabled
- bool
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll.
Der Standardwert ist „True“, wenn num_replicas
„None“ (Keine) ist.
- autoscale_min_replicas
- int
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.
- autoscale_max_replicas
- int
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10
- autoscale_refresh_seconds
- int
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.
- autoscale_target_utilization
- int
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.
- collect_model_data
- bool
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.
- auth_enabled
- bool
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.
- cpu_cores
- float
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1
- memory_gb
- float
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.
- enable_app_insights
- bool
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“.
- scoring_timeout_ms
- int
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.
- replica_max_concurrent_requests
- int
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.
- max_request_wait_time
- int
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.
- num_replicas
- int
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.
- primary_key
- str
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll
- secondary_key
- str
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.
- gpu_cores
- int
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.
- period_seconds
- int
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.
- initial_delay_seconds
- int
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310.
- timeout_seconds
- int
Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.
- success_threshold
- int
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1.
- failure_threshold
- int
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold
angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.
- namespace
- str
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.
- token_auth_enabled
- bool
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.
- cpu_cores_limit
Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein.
- memory_gb_limit
Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.
- blobfuse_enabled
- bool
Gibt an, ob blobfuse für Modelldownloads für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.
- autoscale_enabled
- bool
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll.
Der Standardwert ist „True“, wenn num_replicas
„None“ (Keine) ist.
- autoscale_min_replicas
- int
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.
- autoscale_max_replicas
- int
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10
- autoscale_refresh_seconds
- int
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.
- autoscale_target_utilization
- int
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.
- collect_model_data
- bool
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.
- auth_enabled
- bool
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.
- cpu_cores
- float
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1
- memory_gb
- float
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.
- enable_app_insights
- bool
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“.
- scoring_timeout_ms
- int
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.
- replica_max_concurrent_requests
- int
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.
- max_request_wait_time
- int
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.
- num_replicas
- int
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.
- primary_key
- str
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll
- secondary_key
- str
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.
- gpu_cores
- int
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.
- period_seconds
- int
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.
- initial_delay_seconds
- int
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310.
- timeout_seconds
- int
Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.
- success_threshold
- int
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1.
- failure_threshold
- int
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold
angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.
- namespace
- str
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.
- token_auth_enabled
- bool
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.
- compute_target_name
- str
Der Name des Computeziels, in dem die Bereitstellung erfolgen soll
- cpu_cores_limit
- float
Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein.
- memory_gb_limit
- float
Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.
- blobfuse_enabled
- bool
Gibt an, ob blobfuse für Modelldownloads für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.
Variablen
- autoscale_enabled
- bool
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll.
Der Standardwert ist „True“, wenn num_replicas
„None“ (Keine) ist.
- autoscale_min_replicas
- int
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.
- autoscale_max_replicas
- int
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10
- autoscale_refresh_seconds
- int
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.
- autoscale_target_utilization
- int
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.
- collect_model_data
- bool
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.
- auth_enabled
- bool
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.
- cpu_cores
- float
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1
- memory_gb
- float
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.
- enable_app_insights
- bool
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“.
- scoring_timeout_ms
- int
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.
- replica_max_concurrent_requests
- int
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.
- max_request_wait_time
- int
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.
- num_replicas
- int
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.
- primary_key
- str
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll
- secondary_key
- str
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Wörterbuch der Schlüsselwerttags für diesen Webdienst
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Eine Beschreibung für diesen Webdienst
- gpu_cores
- int
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.
- period_seconds
- int
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.
- initial_delay_seconds
- int
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310.
- timeout_seconds
- int
Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.
- success_threshold
- int
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1.
- failure_threshold
- int
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold
angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.
- token_auth_enabled
- bool
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.
Methoden
print_deploy_configuration |
Ausgeben der Bereitstellungskonfiguration. |
validate_configuration |
Überprüft, ob die angegebenen Konfigurationswerte gültig sind. Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war. |
print_deploy_configuration
Ausgeben der Bereitstellungskonfiguration.
print_deploy_configuration()
validate_configuration
Überprüft, ob die angegebenen Konfigurationswerte gültig sind.
Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war.
validate_configuration()
Ausnahmen
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für