Límites y cuotas del servicio
Este contenido se aplica a:v2.1 | Versión más reciente:v4.0 (versión preliminar)
Este artículo contiene una referencia rápida y una descripción detallada de las cuotas y los límites del servicio de Documento de inteligencia de Azure AI de todos los planes de tarifa. También contiene algunos procedimientos recomendados para evitar la limitación de solicitudes.
Uso del modelo
Tipos de documento admitidos | Lectura | Layout | Modelos creados previamente | Modelos personalizados | Funcionalidades de complementos |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Imágenes: JPEG/JPG , PNG , BMP , TIFF , HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = compatible ✖️ = no compatible
Tipos de documento admitidos | Lectura | Layout | Modelos creados previamente | Modelos personalizados |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Imágenes: JPEG/JPG , PNG , BMP , TIFF , HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = compatible ✖️ = no compatible
Quota | Gratis (F0)1 | Estándar (S0) |
---|---|---|
Límite de transacciones por segundo | 1 | 15 (valor predeterminado) |
Ajustable | No | Sí 2 |
Tamaño máximo del documento | 4 MB | 500 MB |
Ajustable | No | No |
Número máximo de páginas (análisis) | 2 | 2000 |
Ajustable | No | No |
Tamaño máximo del archivo de etiquetas | 10 MB | 10 MB |
Ajustable | No | No |
Tamaño máximo de la respuesta json de OCR | 500 MB | 500 MB |
Ajustable | No | No |
Número máximo de modelos de plantilla | 500 | 5000 |
Ajustable | No | No |
Número máximo de modelos neuronales | 100 | 500 |
Ajustable | No | No |
Uso del modelo personalizado
Quota | Gratis (F0)1 | Estándar (S0) |
---|---|---|
Límite del modelo de redactado | 5 | 200 (valor predeterminado) |
Ajustable | No | No |
Tamaño del conjunto de datos de entrenamiento: neuronal | 1 GB3 | 1 GB (valor predeterminado) |
Ajustable | No | No |
Tamaño del conjunto de datos de entrenamiento: plantilla | 50 MB4 | 50 MB (valor predeterminado) |
Ajustable | No | No |
Número máximo de páginas (entrenamiento): plantilla | 500 | 500 (valor predeterminado) |
Ajustable | No | No |
Número máximo de páginas (entrenamiento): neuronal | 50.000 | 50 000 (valor predeterminado) |
Ajustable | No | No |
Entrenamiento de modelos neuronales personalizados | 10 al mes | 20 al mes |
Ajustable | No | Sí 3 |
Número máx. de páginas (entrenamiento) * clasificador | 10 000 | 10 000 (valor predeterminado) |
Ajustable | No | No |
Número máximo de tipos de documento (clases) * Clasificador | 500 | 500 (valor predeterminado) |
Ajustable | No | No |
Tamaño del conjunto de datos de entrenamiento * clasificador | 1 GB | 1 GB (valor predeterminado) |
Ajustable | No | No |
Número mínimo de muestras por clase * Clasificador | 5 | 5 (valor predeterminado) |
Ajustable | No | No |
Límites del modelo personalizado
Quota | Gratis (F0)1 | Estándar (S0) |
---|---|---|
Límite del modelo de redactado | 5 | 200 (valor predeterminado) |
Ajustable | No | No |
Tamaño del conjunto de datos de entrenamiento | 50 MB | 50 MB (valor predeterminado) |
Ajustable | No | No |
Número máximo de páginas (entrenamiento) | 500 | 500 (valor predeterminado) |
Ajustable | No | No |
1 Para el plan de tarifa Gratis (F0), consulte también las asignaciones mensuales en la página de precios.
2 Consulte los procedimientos recomendados y las [instrucciones de ajuste (#create-and-submit-support-request).
3El número de entrenamientos de modelos neuronales se restablece cada mes calendario. Abra una solicitud de soporte técnico para aumentar el límite de entrenamiento mensual.
4 Este límite se aplica a todos los documentos que estén en la carpeta del conjunto de datos de entrenamiento antes de cualquier actualización relacionada con el etiquetado.
Descripción detallada, ajuste de cuota y procedimientos recomendados
Antes de solicitar un aumento de cuota (en los casos en que sea aplicable), asegúrese de que es necesario. El servicio de Documento de inteligencia emplea el escalado automático para que los recursos de proceso necesarios se lleven on-demand
, mantener bajos los costes del cliente y desaprovisionar los recursos no utilizados al no mantener una cantidad excesiva de capacidad del hardware.
Si la aplicación devuelve un código de respuesta 429 (Demasiadas solicitudes) y la carga de trabajo está dentro de los límites definidos, lo más probable es que el servicio se escale a la demanda, pero aún no haya alcanzado la escala necesaria. Por lo tanto, el servicio no tiene inmediatamente suficientes recursos para servir la solicitud. Este estado es transitorio y no debe durar mucho tiempo.
Procedimientos recomendados generales para mitigar la limitación durante el escalado automático
Para minimizar los problemas relacionados con la limitación (código de respuesta 429), se recomienda usar las técnicas siguientes:
- Implemente lógica de reintento en la aplicación
- Evite cambios bruscos en la carga de trabajo. Aumente la carga de trabajo gradualmente.
Ejemplo. La aplicación usa Documento de inteligencia y la carga de trabajo actual es de 10 TPS (transacciones por segundo). En el siguiente segundo, aumenta la carga a 40 TPS (es decir, cuatro veces más). El servicio comienza inmediatamente el escalado vertical para satisfacer la nueva carga, pero es probable que no lo haga en un segundo, por lo que algunas de las solicitudes obtienen el código de respuesta 429.
En las secciones siguientes se describen los casos específicos de ajuste de las cuotas. Ir a Documento de inteligencia: aumentar el límite de solicitud simultáneo
Aumento del límite de solicitudes de transacciones por segundo
De manera predeterminada, el número de transacciones por segundo está limitado a 15 transacciones por segundo para un recurso de Documento de inteligencia. En el plan de tarifa Estándar, esta cantidad se puede aumentar. Antes de enviar la solicitud, asegúrese de que está familiarizado con el material de esta sección y tenga en cuenta estos procedimientos recomendados.
El aumento del límite de solicitudes simultáneas no afecta directamente a los costos. El servicio de Documento de inteligencia usa el modelo de "pague por lo que se usa". El límite define hasta dónde se puede escalar el servicio antes de empezar a limitar las solicitudes.
El valor existente del parámetro de límite de solicitudes simultáneas no es visible en Azure Portal, en las herramientas de línea de comandos o las solicitudes de API. Para comprobar el valor existente, cree una solicitud de soporte técnico de Azure.
Si desea aumentar las transacciones por segundo, puede habilitar el escalado automático en el recurso. Siga las instrucciones de este documento para habilitar el escalado automático en el recurso: Habilitar el escalado automático. También puede enviar una solicitud de apoyo para aumentar el número de transacciones por segundo.
Tenga lista la información necesaria
Id. de recurso de Documento de inteligencia
Region
Cómo obtener información (modelo base) :
- Inicie sesión en el Portal de Azure
- Seleccionar el recurso de Documento de inteligencia para el que desea aumentar el límite de transacciones
- Seleccione Propiedades (grupo Administración de recursos)
- Copie y guarde los valores de los siguientes campos:
- Identificador del recurso
- Ubicación (la región del punto de conexión)
Creación y envío de una solicitud de soporte técnico
Inicie el aumento del límite de transacciones por segundo (TPS) para el recurso mediante el envío de la solicitud de soporte técnico:
- Asegúrese de que tiene la información necesaria.
- Inicie sesión en el Portal de Azure
- Seleccionar el recurso de Documento de inteligencia para el que desea aumentar el límite de TPS
- Seleccione Nueva solicitud de soporte técnico (grupo Soporte técnico y solución de problemas).
- Aparece una nueva ventana con información rellenada automáticamente sobre la suscripción y el recurso de Azure
- Ingrese una nota de Resumen (como "Aumentar límite de TPS para Documento de inteligencia")
- En Tipo de problema, seleccione "Quota or usage validation".
- Seleccione Siguiente: Soluciones.
- Continúe con la creación de la solicitud.
- En la pestaña Detalles, escriba la siguiente información en el campo Descripción:
- de que la solicitud se refiere a la cuota de Documento de inteligencia.
- Proporcione una expectativa de TPS a la que le gustaría escalar para satisfacer las necesidades.
- La información sobre los recursos de Azure que recopiló.
- Termine de escribir la información necesaria y seleccione el botón Crear en la pestaña Revisar y crear.
- Anote el número de la solicitud de soporte técnico que aparece en las notificaciones de Azure Portal. Pronto se comunicarán con usted para continuar con el procesamiento
Ejemplo de un procedimiento recomendado para un patrón de carga de trabajo
En este ejemplo se presenta la estrategia que se recomienda seguir para mitigar la posible limitación de solicitudes debido a que el escalado automático está en curso. No es una receta exacta, sino una mera plantilla que le invitamos a seguir y ajustar según sea necesario.
Supongamos que un recurso de Documento de inteligencia tiene establecido el límite predeterminado. Inicie la carga de trabajo para enviar las solicitudes de análisis. Si observa una limitación frecuente con el código de respuesta 429, efectúe un retroceso exponencial en la solicitud de respuesta de análisis de GET. Por ejemplo, mediante el uso de un tiempo de espera progresivamente más prolongado entre reintentos para respuestas de error consecutivas,como el patrón 2-5-13-34 de retrasos entre solicitudes. En general, se recomienda no hacer una llamada a la respuesta de análisis de get más de una vez cada dos segundos para la solicitud POST correspondiente.
Si se encuentra limitado por el número de solicitudes POST de documentos que se envían, considere la posibilidad de agregar un retraso entre las solicitudes. Si la carga de trabajo requiere un mayor grado de procesamiento simultáneo, debe crear una solicitud de soporte técnico para aumentar los límites de servicio en las transacciones por segundo.
Por lo general, se recomienda probar la carga de trabajo y los patrones de carga de trabajo antes de pasar a producción.
Pasos siguientes
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente las Cuestiones de GitHub como mecanismo de retroalimentación para el contenido y lo sustituiremos por un nuevo sistema de retroalimentación. Para más información, consulta:Enviar y ver comentarios de