AksServiceDeploymentConfiguration Clase
Representa una información de configuración de implementación para un servicio implementado en Azure Kubernetes Service.
Crea un objeto AksServiceDeploymentConfiguration mediante el método deploy_configuration
de la clase AksWebservice.
Inicialice un objeto de configuración para implementarlo en un destino de proceso de AKS.
- Herencia
-
AksServiceDeploymentConfiguration
Constructor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parámetros
- cpu_cores_limit
Número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal.
- memory_gb_limit
Cantidad máxima de memoria (en GB) que puede usar este objeto Webservice. Puede ser un decimal.
- autoscale_enabled
- bool
Indica si se debe habilitar el escalado automático para este Webservice.
El valor predeterminado es True si num_replicas
es Ninguno.
- autoscale_min_replicas
- int
Número mínimo de contenedores que se van a usar al escalar automáticamente este Webservice. De manera predeterminada, su valor es 1.
- autoscale_max_replicas
- int
Número máximo de contenedores que se van a usar al escalar automáticamente este Webservice. El valor predeterminado es 10.
- autoscale_refresh_seconds
- int
Frecuencia con la que el escalador automático debe intentar escalar este Webservice. De manera predeterminada, su valor es 1.
- autoscale_target_utilization
- int
Uso objetivo (en un porcentaje de 100) que el escalador automático debe intentar mantener para este Webservice. El valor predeterminado es 70.
- collect_model_data
- bool
Indica si se debe habilitar o no la recopilación de datos del modelo para este Webservice. El valor predeterminado es False.
- auth_enabled
- bool
Indica si se debe habilitar o no la autenticación para este servicio web. El valor predeterminado es True.
- cpu_cores
- float
Número de núcleos de CPU que se asignarán a este Webservice. Puede ser un decimal. El valor predeterminado es 0,1.
- memory_gb
- float
Cantidad de memoria (en GB) que se va a asignar a este Webservice. Puede ser un decimal. El valor predeterminado es 0,5.
- enable_app_insights
- bool
Indica si se debe habilitar o no el registro de Application Insights para este Webservice. El valor predeterminado es False.
- scoring_timeout_ms
- int
Tiempo de espera para aplicar a las llamadas de puntuación a este Webservice. El valor predeterminado es 60 000.
- replica_max_concurrent_requests
- int
Número máximo de solicitudes simultáneas por réplica que se permitirán para este Webservice. De manera predeterminada, su valor es 1. No cambie este valor a menos que se lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning.
- max_request_wait_time
- int
Cantidad máxima de tiempo que permanecerá una solicitud en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500.
- num_replicas
- int
Número de contenedores que se asignarán a este Webservice. No tiene un valor predeterminado. Si no se establece este parámetro, el escalador automático se habilita de manera predeterminada.
Diccionario de etiquetas de valor de clave para proporcionar este Webservice.
Diccionario de propiedades de valor de clave para proporcionar este Webservice. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares clave-valor.
- gpu_cores
- int
Número de núcleos de GPU que se asignará a este servicio web. El valor predeterminado es 0.
- period_seconds
- int
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1.
- initial_delay_seconds
- int
Número de segundos después de que se haya iniciado el contenedor antes de que se inicien los sondeos de ejecución. El valor predeterminado es 310.
- timeout_seconds
- int
Número de segundos tras los cuales el sondeo de ejecución agota el tiempo de espera. El valor predeterminado es de 2 segundos. El valor mínimo es 1.
- success_threshold
- int
Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1.
- failure_threshold
- int
Cuando se inicie un pod y se produzca un error en el sondeo de ejecución, Kubernetes probará failureThreshold
veces antes de abandonar. El valor predeterminado es 3. El valor mínimo es 1.
- namespace
- str
El espacio de nombres de Kubernetes en el que se va a implementar este Webservice: hasta 63 caracteres alfanuméricos en minúsculas ("a"-"z", "0"-"9") y guion ("-"). El primer y el último carácter no puede ser un guion.
- token_auth_enabled
- bool
Si quiere habilitar o no la autenticación de Azure Active Directory para este Webservice. Si esta opción está habilitada, los usuarios pueden acceder a este Webservice mediante la captura de un token de acceso con sus credenciales de Azure Active Directory. El valor predeterminado es False.
- cpu_cores_limit
Número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal.
- memory_gb_limit
Cantidad máxima de memoria (en GB) que puede usar este objeto Webservice. Puede ser un decimal.
- blobfuse_enabled
- bool
Si se habilita o no blobfuse para la descarga de modelos para este Webservice. El valor predeterminado es True.
- autoscale_enabled
- bool
Indica si se debe habilitar el escalado automático para este Webservice.
El valor predeterminado es True si num_replicas
es Ninguno.
- autoscale_min_replicas
- int
Número mínimo de contenedores que se van a usar al escalar automáticamente este Webservice. De manera predeterminada, su valor es 1.
- autoscale_max_replicas
- int
Número máximo de contenedores que se van a usar al escalar automáticamente este Webservice. El valor predeterminado es 10.
- autoscale_refresh_seconds
- int
Frecuencia con la que el escalador automático debe intentar escalar este Webservice. De manera predeterminada, su valor es 1.
- autoscale_target_utilization
- int
Uso objetivo (en un porcentaje de 100) que el escalador automático debe intentar mantener para este Webservice. El valor predeterminado es 70.
- collect_model_data
- bool
Indica si se debe habilitar o no la recopilación de datos del modelo para este Webservice. El valor predeterminado es False.
- auth_enabled
- bool
Indica si se debe habilitar o no la autenticación para este servicio web. El valor predeterminado es True.
- cpu_cores
- float
Número de núcleos de CPU que se asignarán a este Webservice. Puede ser un decimal. El valor predeterminado es 0,1.
- memory_gb
- float
Cantidad de memoria (en GB) que se va a asignar a este Webservice. Puede ser un decimal. El valor predeterminado es 0,5.
- enable_app_insights
- bool
Indica si se debe habilitar o no el registro de Application Insights para este Webservice. El valor predeterminado es False.
- scoring_timeout_ms
- int
Tiempo de espera para aplicar a las llamadas de puntuación a este Webservice. El valor predeterminado es 60 000.
- replica_max_concurrent_requests
- int
Número máximo de solicitudes simultáneas por réplica que se permitirán para este Webservice. De manera predeterminada, su valor es 1. No cambie este valor a menos que se lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning.
- max_request_wait_time
- int
Cantidad máxima de tiempo que permanecerá una solicitud en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500.
- num_replicas
- int
Número de contenedores que se asignarán a este Webservice. No tiene un valor predeterminado. Si no se establece este parámetro, el escalador automático se habilita de manera predeterminada.
Diccionario de etiquetas de valor de clave para proporcionar este Webservice.
Diccionario de propiedades de valor de clave para proporcionar este Webservice. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares clave-valor.
- gpu_cores
- int
Número de núcleos de GPU que se asignará a este servicio web. El valor predeterminado es 0.
- period_seconds
- int
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1.
- initial_delay_seconds
- int
Número de segundos después de que se haya iniciado el contenedor antes de que se inicien los sondeos de ejecución. El valor predeterminado es 310.
- timeout_seconds
- int
Número de segundos tras los cuales el sondeo de ejecución agota el tiempo de espera. El valor predeterminado es de 2 segundos. El valor mínimo es 1.
- success_threshold
- int
Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1.
- failure_threshold
- int
Cuando se inicie un pod y se produzca un error en el sondeo de ejecución, Kubernetes probará failureThreshold
veces antes de abandonar. El valor predeterminado es 3. El valor mínimo es 1.
- namespace
- str
El espacio de nombres de Kubernetes en el que se va a implementar este Webservice: hasta 63 caracteres alfanuméricos en minúsculas ("a"-"z", "0"-"9") y guion ("-"). El primer y el último carácter no puede ser un guion.
- token_auth_enabled
- bool
Si quiere habilitar o no la autenticación de Azure Active Directory para este Webservice. Si esta opción está habilitada, los usuarios pueden acceder a este Webservice mediante la captura de un token de acceso con sus credenciales de Azure Active Directory. El valor predeterminado es False.
- cpu_cores_limit
- float
Número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal.
- memory_gb_limit
- float
Cantidad máxima de memoria (en GB) que puede usar este objeto Webservice. Puede ser un decimal.
- blobfuse_enabled
- bool
Si se habilita o no blobfuse para la descarga de modelos para este Webservice. El valor predeterminado es True.
Variables
- autoscale_enabled
- bool
Indica si se debe habilitar el escalado automático para este Webservice.
El valor predeterminado es True si num_replicas
es Ninguno.
- autoscale_min_replicas
- int
Número mínimo de contenedores que se van a usar al escalar automáticamente este Webservice. De manera predeterminada, su valor es 1.
- autoscale_max_replicas
- int
Número máximo de contenedores que se van a usar al escalar automáticamente este Webservice. El valor predeterminado es 10.
- autoscale_refresh_seconds
- int
Frecuencia con la que el escalador automático debe intentar escalar este Webservice. De manera predeterminada, su valor es 1.
- autoscale_target_utilization
- int
Uso objetivo (en un porcentaje de 100) que el escalador automático debe intentar mantener para este Webservice. El valor predeterminado es 70.
- collect_model_data
- bool
Indica si se debe habilitar o no la recopilación de datos del modelo para este Webservice. El valor predeterminado es False.
- auth_enabled
- bool
Indica si se debe habilitar o no la autenticación para este servicio web. El valor predeterminado es True.
- cpu_cores
- float
Número de núcleos de CPU que se asignarán a este Webservice. Puede ser un decimal. El valor predeterminado es 0,1.
- memory_gb
- float
Cantidad de memoria (en GB) que se va a asignar a este Webservice. Puede ser un decimal. El valor predeterminado es 0,5.
- enable_app_insights
- bool
Indica si se debe habilitar o no el registro de Application Insights para este Webservice. El valor predeterminado es False.
- scoring_timeout_ms
- int
Tiempo de espera para aplicar a las llamadas de puntuación a este Webservice. El valor predeterminado es 60 000.
- replica_max_concurrent_requests
- int
Número máximo de solicitudes simultáneas por réplica que se permitirán para este Webservice. De manera predeterminada, su valor es 1. No cambie este valor a menos que se lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning.
- max_request_wait_time
- int
Cantidad máxima de tiempo que permanecerá una solicitud en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500.
- num_replicas
- int
Número de contenedores que se asignarán a este Webservice. No tiene un valor predeterminado. Si no se establece este parámetro, el escalador automático se habilita de manera predeterminada.
- primary_key
- str
Clave de autenticación principal que se usará para este Webservice.
- secondary_key
- str
Clave de autenticación secundaria que se usará para este Webservice.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Diccionario de etiquetas de valor de clave para proporcionar este Webservice.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Diccionario de propiedades de valor de clave para proporcionar este Webservice. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares clave-valor.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Descripción para proporcionar a este Webservice.
- gpu_cores
- int
Número de núcleos de GPU que se asignará a este servicio web. El valor predeterminado es 0.
- period_seconds
- int
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1.
- initial_delay_seconds
- int
Número de segundos después de que se haya iniciado el contenedor antes de que se inicien los sondeos de ejecución. El valor predeterminado es 310.
- timeout_seconds
- int
Número de segundos tras los cuales el sondeo de ejecución agota el tiempo de espera. El valor predeterminado es de 2 segundos. El valor mínimo es 1.
- success_threshold
- int
Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1.
- failure_threshold
- int
Cuando se inicie un pod y se produzca un error en el sondeo de ejecución, Kubernetes probará failureThreshold
veces antes de abandonar. El valor predeterminado es 3. El valor mínimo es 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
El espacio de nombres de Kubernetes en el que se va a implementar este Webservice: hasta 63 caracteres alfanuméricos en minúsculas ("a"-"z", "0"-"9") y guion ("-"). El primer y el último carácter no puede ser un guion.
- token_auth_enabled
- bool
Si quiere habilitar o no la autenticación de Azure Active Directory para este Webservice. Si esta opción está habilitada, los usuarios pueden acceder a este Webservice mediante la captura de un token de acceso con sus credenciales de Azure Active Directory. El valor predeterminado es False.
Métodos
print_deploy_configuration |
Imprime la configuración de implementación. |
validate_configuration |
Comprueba que los valores de configuración especificados sean válidos. Genera una excepción WebserviceException si se produce un error en la validación. |
print_deploy_configuration
Imprime la configuración de implementación.
print_deploy_configuration()
validate_configuration
Comprueba que los valores de configuración especificados sean válidos.
Genera una excepción WebserviceException si se produce un error en la validación.
validate_configuration()
Excepciones
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de