Límites de servicio en Azure Cognitive Search

Los límites máximos sobre el almacenamiento, las cargas de trabajo, las cantidades de índices y otros objetos dependen de si se aprovisiona Azure Cognitive Search conforme a un plan de tarifa Gratis, Básico, Estándar u Optimizado para almacenamiento.

  • Gratis es un servicio multiinquilino compartido incluido en su suscripción de Azure.

  • Básico proporciona recursos informáticos dedicados para cargas de trabajo de producción en una escala menor, pero comparte algunas infraestructuras de red con otros inquilinos.

  • Estándar se ejecuta en máquinas dedicadas, con más almacenamiento y capacidad de procesamiento en cada nivel. Estándar incluye cuatro niveles: S1, S2, S3 y S3 HD. S3 High Density (S3 HD) está diseñado para multiinquilinato y grandes cantidades de índices pequeños (tres mil índices por servicio). S3 HD no proporciona la característica de indexador y la ingesta de datos debe aprovechar las API que envían datos del origen al índice.

  • El plan de tarifa Almacenamiento optimizado se ejecuta en máquinas dedicadas con más almacenamiento total, ancho de banda de almacenamiento y memoria que el plan Estándar. Este nivel tiene como objetivo índices grandes que cambian con lentitud. Dicho plan se ofrece en dos niveles: L1 y L2.

Límites de suscripción

Puede crear varios servicios, con la única limitación del número de servicios permitidos en cada nivel. Por ejemplo, puede crear hasta 16 servicios en el nivel Básico y otros 16 en el nivel S1 dentro de la misma suscripción. Para más información sobre los niveles, consulte Selección de una SKU o de un plan de tarifa de Azure Cognitive Search.

El límite máximo de servicios se puede elevar a petición. Si necesita tener más servicios en la misma suscripción, envíe una solicitud de soporte técnico.

Recurso Gratis1 Básica S1 S2 S3 S3 HD L1 L2
Servicios máximos 1 16 16 8 6 6 6 6
Escala máxima en unidades de búsqueda (SU)2 N/D 3 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda

1 Gratis se basa en la infraestructura que se comparte con otros clientes. Dado que el hardware no está dedicado, no se admite el escalado vertical en el nivel gratis.

2 Las unidades de búsqueda son unidades facturables, asignadas como réplica o como partición. Ambos recursos se necesitan para las operaciones de almacenamiento, indexación y consulta. Para más información sobre los cálculos de SU, consulte Escalado de niveles de recursos para cargas de trabajo de indexación y consulta en Azure Search.

Límites de Storage

El límite de los servicios de búsqueda lo marcan el espacio en disco o por el número máximo de índices o indexadores, lo que ocurra primero. En la tabla siguiente se documentan los límites de almacenamiento. Para conocer los límites máximos de los objetos, consulte el artículo en que se especifican los límites por recurso.

Resource Gratuito Básico1 S1 S2 S3 S3 HD L1 L2
Contrato de nivel de servicio (SLA)2 No
Almacenamiento por partición 50 MB 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Particiones por servicio N/D 1 12 12 12 3 12 12
Tamaño de la partición N/D 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Réplicas N/D 3 12 12 12 12 12 12

1 Básico tiene una partición fija. Se pueden usar unidades de búsqueda adicionales para agregar réplicas para volúmenes de consultas mayores.

2 Los contratos de nivel de servicio están en vigor para los servicios facturables en los recursos dedicados. Los servicios gratuitos y las características de versión preliminar no tienen SLA. Para los servicios facturables, los SLA tomarán efecto cuando se aprovisione suficiente redundancia para el servicio. Se necesitan dos o más réplicas para los contrato de nivel de servicio de consulta (lectura). Se necesitan tres o más réplicas para los contratos de nivel de servicio de consulta e indexación (lectura y escritura). El número de particiones no se tiene en cuenta en el contrato de nivel de servicio.

Límites de índice

Resource Gratuito Básico 1 S1 S2 S3 S3 HD L1 L2
Índices máximos 3 5 o 15 50 200 200 1000 GB por partición o 3000 por servicio 10 10
Campos simples máximos por índice 2 1000 100 1000 1000 1000 1000 1000 1000
Colecciones complejas máximas por índice 40 40 40 40 40 40 40 40
Elementos máximos en todas las colecciones complejas por documento 3 3000 3000 3000 3000 3000 3000 3000 3000
Profundidad máxima de campos complejos 10 10 10 10 10 10 10 10
Proveedores de sugerencias máximos por índice 1 1 1 1 1 1 1 1
Perfiles de puntuación máximos por índice 100 100 100 100 100 100 100 100
Funciones máximas por perfil 8 8 8 8 8 8 8 8

1 Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los índices. El nivel básico es la única SKU con un límite inferior de 100 campos por índice.

2 El límite superior de los campos incluye campos de primer nivel y subcampos anidados en una colección compleja. Por ejemplo, si un índice contiene 15 campos y tiene dos colecciones complejas con 5 subcampos cada uno, el recuento de campos del índice es 25. Los índices que tengan una colección de campos muy grandes pueden ser lentos. Limite los campos y atributos a solo los que necesite y ejecute la indexación y la prueba de consulta para asegurarse de que el rendimiento sea aceptable.

3 Existe un límite superior para los elementos porque tener un gran número de ellos aumenta significativamente el almacenamiento necesario para el índice. Un elemento de una colección compleja se define como un miembro de esa colección. Por ejemplo, supongamos un documento de hotel con una colección de habitaciones compleja, donde cada habitación de dicha colección se considera un elemento. Durante la indexación, el motor de indexación puede procesar de forma segura un máximo de 3000 elementos en el documento en su totalidad. Este límite se presentó en y se aplica solo a colecciones complejas, no a colecciones de cadenas ni a campos complejos.

Es posible que encuentre alguna variación en los límites máximos si el servicio casualmente se aprovisiona en un clúster más eficaz. Los límites aquí representan el denominador común. Los índices creados con las especificaciones anteriores se podrán transportar entre los niveles de servicio equivalentes de cualquier región.

Límites de documento

Ya no hay límites de documentos por servicio en Azure Cognitive Search, pero hay un límite de aproximadamente 24 mil millones de documentos por índice en los servicios de búsqueda Básico, S1, S2, S3, L1 y L2. En el caso de S3 HD, el límite es de 2 mil millones de documentos por índice. Cada elemento de una colección compleja cuenta como un único documento en lo que respecta a estos límites.

Límites de tamaño de documento por llamada API

El tamaño máximo del documento cuando se llama a una API de índice es de aproximadamente 16 megabytes.

El tamaño del documento es de hecho un límite en el tamaño del cuerpo de la solicitud de la API de índice. Dado que se puede pasar un lote de varios documentos a la API de índice de una vez, el límite de tamaño depende en realidad de cuántos documentos estén en el lote. Para un lote con un único documento, el tamaño máximo del documento es de 16 MB de JSON.

Al calcular el tamaño del documento, recuerde tener en cuenta solo los campos que puede usar un servicio de búsqueda. Los datos binarios o de imagen de los documentos de origen deben omitirse en los cálculos.

Límites de indexador

Los tiempos de ejecución máximos existen para proporcionar equilibrio y estabilidad al servicio como un todo, pero es posible que los conjuntos de datos más grandes necesiten más tiempo de indexación que el que permite el máximo. Si un trabajo de indexación no se puede completar en el tiempo máximo permitido, intente ejecutarlo en una programación. El programador realiza un seguimiento del estado de la indexación. Si un trabajo programado de indexación se interrumpe por cualquier motivo, el indizador puede reanudarlo donde se quedó en la siguiente ejecución programada.

Resource Gratis 1 Básico 2 S1 S2 S3 S3 HD 3 L1 L2
Indexadores máximos 3 5 o 15 50 200 200 N/D 10 10
Orígenes de datos máximos 3 5 o 15 50 200 200 N/D 10 10
Conjuntos de habilidades máximos 4 3 5 o 15 50 200 200 N/D 10 10
Carga máxima de indexación por invocación 10 000 documentos Limitado solamente por el número máximo de documentos Limitado solamente por el número máximo de documentos Limitado solamente por el número máximo de documentos Limitado solamente por el número máximo de documentos N/D Sin límite Sin límite
Programación mínima 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos
Tiempo de ejecución máximo 6 1-3 minutos 2 o 24 horas 2 o 24 horas 2 o 24 horas 2 o 24 horas N/D 2 o 24 horas 2 o 24 horas
Tiempo máximo de ejecución de los indexadores con un aptitudes 5 3-10 minutos 2 horas 2 horas 2 horas 2 horas N/D 2 horas 2 horas
Indexador de blobs: tamaño máximo de blob, MB 16 16 128 256 256 N/D 256 256
Indexador de blobs: número máximo de caracteres del contenido extraído de un blob 32 000 64 000 4 millones 8 millones 16 millones N/D 4 millones 4 millones

1 Los servicios gratuitos tienen un tiempo de ejecución máximo del indexador de 3 minutos para servicios de blob y de 1 minuto para todos los demás orígenes de datos. La invocación del indexador es una vez cada 180 segundos. Para la indexación de IA que llama a Cognitive Services, los servicios gratuitos se limitan a 20 transacciones gratuitas por indizador por día, donde una transacción se define como un documento que pasa correctamente a través de la canalización enriquecimiento (consejo: puedes reiniciar un indexador para restablecer su recuento).

2 Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los indexadores, los orígenes de datos y los conjuntos de aptitudes.

3 Los servicios S3 HD no incluyen compatibilidad con el indexador.

4 Máximo de 30 habilidades por conjunto de habilidades.

5 El análisis de imágenes y el enriquecimiento con IA consumen muchos recursos informáticos y una cantidad desproporcionada de la potencia de procesamiento disponible. El tiempo de ejecución de estas cargas de trabajo se ha abreviado para que otros trabajos de la cola tengan más posibilidades de ejecutarse.

6 La ejecución del indexador y la ejecución combinada del conjunto de aptitudes del indexador están sujetas a una duración máxima de 2 horas. Actualmente, algunos indexadores tienen una ventana de ejecución máxima más larga de 24 horas, pero ese comportamiento no es la norma. La ventana más larga solo se aplica si un servicio o sus indexadores no se pueden migrar internamente al comportamiento más reciente del runtime. Si se necesitan más de 2 horas para completar un proceso de indexador o conjunto de aptitudes del indexador, programe el indexador para que se ejecute a intervalos de 2 horas.

Nota

Como se indica en el apartado Límites de índice, los indexadores también aplicarán el límite superior de 3000 elementos en todas las colecciones complejas por documento a partir de la versión de la API de disponibilidad general más reciente que admita tipos complejos () en adelante, lo que significa que si ha creado un indexador con una versión anterior de la API, no estará sujeto a ese límite. Para conservar la máxima compatibilidad, los indexadores que se crearon con una versión anterior de la API y, después, se actualizaron con una versión de la API 2019-05-06, o posterior, seguirá estando 2019-05-06 de los límites. Los clientes deben ser conscientes del impacto negativo de tener colecciones muy complejas (como se ha indicado anteriormente) y recomendamos encarecidamente que se creen todos los indexadores con la versión de la API de disponibilidad general más reciente.

Los indexadores pueden acceder a otros recursos de Azure mediante puntos de conexión privados administrados con la API de recursos compartidos de Private Link. En esta sección se describen los límites asociados a esta funcionalidad.

Resource Gratuito Básica S1 S2 S3 S3 HD L1 L2
Compatibilidad con indexador de puntos de conexión privados No No
Compatibilidad con puntos de conexión privados para indexadores con un conjunto de aptitudes1 No No No No
Número máximo de puntos de conexión privados N/D 10 o 30 100 400 400 N/D 20 20
Número máximo de tipos de recursos distintos2 N/D 4 7 15 15 N/D 4 4

1 El análisis de imágenes y el enriquecimiento con IA consumen muchos recursos informáticos y una cantidad desproporcionada de la potencia de procesamiento disponible. Por este motivo, las conexiones privadas están deshabilitadas en los niveles inferiores para evitar un impacto adverso en el rendimiento y la estabilidad del propio servicio de búsqueda.

2 El número de tipos de recursos distintos se calcula como el número de valores de únicos utilizados en todos los recursos compartidos de Private Link para un servicio de búsqueda determinado, independientemente del estado del recurso.

Límites de sinónimos

El número máximo de asignaciones de sinónimos varía según el nivel. Cada regla puede tener hasta 20 expansiones, donde una expansión es un término equivalente. Por ejemplo, dado el término "gato", la asociación con "gatito", "felino" y "felis" (el género de gatos) contaría como 3 expansiones.

Resource Gratuito Básica S1 S2 S3 S3-HD L1 L2
Asignaciones máximas de sinónimos 3 3 5 10 20 20 10 10
Número máximo de reglas por asignación 5000 20000 20000 20000 20000 20000 20000 20000

Límites de alias de índice

El número máximo de alias de índice varía según el nivel. En todos los niveles, el número máximo de alias es el doble del número máximo de índices permitido.

Resource Gratuito Básica S1 S2 S3 S3-HD L1 L2
Alias máximos 6 10 o 30 100 400 400 2000 GB por partición o 6000 por servicio 20 20

Límites de datos (enriquecimiento de inteligencia artificial)

Una canalización de enriquecimiento con IA que realiza llamadas a un recurso de Azure Cognitive Services for Language para el reconocimiento de entidades, la vinculación de entidad, la extracción de frases clave, el análisis de sentimiento, la detección de idioma y la detección de información personal está sujeta a límites de datos. El tamaño máximo de un registro debe tener 50 000 caracteres según lo que mida String.Length. Si tiene que dividir los datos antes de enviarlos al analizador de opiniones, use la aptitud División de texto.

Limitaciones

Las solicitudes de API se limitan a medida que el sistema se aproxima a la capacidad máxima. La limitación se comporta de forma diferente para las distintas API. Las API de consulta (Search/Suggest/Autocomplete) y las de indexación se limitan dinámicamente en función de la carga del servicio. Las API de índice y las API de operaciones de servicio tienen límites estáticos de frecuencia de solicitud.

Límites estáticos de frecuencia de solicitudes para las operaciones relacionadas con un índice:

  • Enumerar índices (GET /indexes): 3 por segundo por unidad de búsqueda
  • Obtener índice (GET /indexes/myindex): 10 por segundo por unidad de búsqueda
  • Crear índice (POST /indexes): 12 por minuto por unidad de búsqueda
  • Crear o actualizar índice (PUT /indexes/myindex): 6 por segundo por unidad de búsqueda
  • Eliminar índice (DELETE /indexes/myindex): 12 por minuto por unidad de búsqueda

Límites estáticos de frecuencia de solicitudes para las operaciones relacionadas con un servicio:

  • Estadísticas del servicio (GET /servicestats): 4 por segundo por unidad de búsqueda

Límites de solicitud de API

  • Máximo de 16 MB por solicitud 1
  • Longitud máxima de dirección URL de 8 KB
  • Máximo de 1000 documentos por lote del índice de cargas de índices, combinaciones o eliminaciones
  • Máximo de 32 campos en cláusula $orderby
  • Máximo de 100 000 caracteres en una cláusula de búsqueda
  • El número máximo de cláusulas en search (expresiones separadas por AND u OR) es 1024.
  • El tamaño máximo del término de búsqueda es de 32 766 bytes (32 KB menos 2 bytes) de texto con codificación UTF-8
  • El tamaño máximo del término de búsqueda es de 1000 caracteres para la búsqueda de prefijos y la búsqueda de expresiones regulares.
  • La búsqueda de caracteres comodín y la búsqueda de expresiones regulares se limitan a un máximo de 1000 estados cuando las procesa Lucene.

1 En Azure Cognitive Search, el cuerpo de una solicitud está sujeto a un límite superior de 16 MB, lo que impone un límite práctico sobre el contenido de campos individuales o colecciones que no están restringidos de algún modo por límites teóricos (vea Tipos de datos admitidos para obtener más información sobre composición de campos y restricciones).

Existen límites en el tamaño y la composición de las consultas porque las consultas sin enlazar pueden desestabilizar el servicio de búsqueda. Normalmente, estas consultas se crean mediante programación. Si la aplicación genera consultas de búsqueda mediante programación, se recomienda diseñarla de manera que no genere consultas de tamaño ilimitado.

Límites de respuesta de API

  • Máximo de 1000 documentos devueltos por página de resultados de búsqueda
  • Máximo de 100 sugerencias devueltas por solicitud de Sugerir API

Límites de clave de API

Las claves de API se usan para la autenticación del servicio. Hay dos tipos. Las claves de administración se especifican en el encabezado de solicitud y conceden acceso completo de lectura y escritura al servicio. Las claves de consulta son de solo lectura, se especifican en la dirección URL y normalmente se distribuyen a las aplicaciones cliente.

  • Máximo de 2 claves de administración por servicio
  • Máximo de 50 claves de consultas por servicio