Límites de servicio en Azure AI Search

Artículo
04/10/2024

Los límites máximos sobre el almacenamiento, las cargas de trabajo, las cantidades de índices y otros objetos dependen de si se crea Azure AI Search conforme a un plan de tarifa Gratis, Básico, Estándar u Optimizado para almacenamiento.

Gratis es un servicio multiinquilino compartido incluido en su suscripción de Azure.
Básico proporciona recursos informáticos dedicados para cargas de trabajo de producción en una escala menor, pero comparte algunas infraestructuras de red con otros inquilinos.
Estándar se ejecuta en máquinas dedicadas, con más almacenamiento y capacidad de procesamiento en cada nivel. Estándar incluye cuatro niveles: S1, S2, S3 y S3 HD. S3 High Density (S3 HD) está diseñado para multiinquilino y grandes cantidades de índices pequeños (3000 índices por servicio). S3 HD no proporciona la característica de indexador y la ingesta de datos debe usar las API que envían datos del origen al índice.
El plan de tarifa Almacenamiento optimizado se ejecuta en máquinas dedicadas con más almacenamiento total, ancho de banda de almacenamiento y memoria que el plan Estándar. Este nivel tiene como objetivo índices grandes que cambian con lentitud. El plan Optimizado para almacenamiento se ofrece en dos niveles: L1 y L2.

Límites de suscripción

Puede crear varios servicios de búsqueda facturables (básicos y avanzados), hasta el número máximo de servicios permitidos en cada nivel. Por ejemplo, puede crear hasta 16 servicios en el nivel Básico y otros 16 en el nivel S1 dentro de la misma suscripción. Para más información sobre los niveles, consulte Elegir un nivel (o SKU) para Azure AI Search.

El límite máximo de servicios se puede elevar a petición. Si necesita tener más servicios en la misma suscripción, envíe una solicitud de soporte técnico.

Resource	Gratis ¹	Basic	S1	S2	S3	S3 HD	L1	L2
Servicios máximos	1	16	16	8	6	6	6	6
Número máximo de unidades de búsqueda (SU)²	N/D	3 unidades de búsqueda	36 unidades de búsqueda	36 unidades de búsqueda	36 unidades de búsqueda	36 unidades de búsqueda	36 unidades de búsqueda	36 unidades de búsqueda

¹ Puede tener un servicio de búsqueda gratuito por suscripción de Azure. El nivel gratuito se basa en la infraestructura compartida con otros clientes. Dado que el hardware no está dedicado, no se admite el escalado vertical y el almacenamiento está limitado a 50 MB.

² Las unidades de búsqueda (SU) son unidades facturables, asignadas como réplica o como partición. Necesita ambos. Para obtener más información sobre las combinaciones de SU, consulte Estimación y administración de la capacidad de un servicio de búsqueda.

Límites de servicio

Los límites del servicio de búsqueda para el almacenamiento, las particiones y las réplicas varían según la fecha de creación del servicio, con límites más altos para los servicios más recientes en las regiones admitidas.

Un servicio de búsqueda está sujeto a un límite máximo de almacenamiento (tamaño de partición multiplicado por el número de particiones) o por un límite máximo en el número máximo de índices o indexadores, lo que ocurra primero.

Los acuerdos de nivel de servicio (SLA) se aplican a los servicios facturables que tienen dos o más réplicas para cargas de trabajo de consulta, o tres o más réplicas para cargas de trabajo de consulta e indexación. El número de particiones no se tiene en cuenta en el contrato de nivel de servicio. Para más información, consulte Confiabilidad en Azure AI Search.

Los servicios gratuitos no tienen particiones ni réplicas fijas y comparten recursos con otros suscriptores.

Antes del 3 de abril de 2024

Resource	Gratuito	Básico	S1	S2	S3	S3 HD	L1	L2
Acuerdo de Nivel de Servicio (SLA)	No	Sí	Sí	Sí	Sí	Sí	Sí	Sí
Almacenamiento (tamaño de partición)	50 MB	2 GB	25 GB	100 GB	200 GB	200 GB	1 TB	2 TB
Particiones	N/D	1	12	12	12	3	12	12
Réplicas	N/D	3	12	12	12	12	12	12

Después del 3 de abril de 2024

Para los nuevos servicios creados después del 3 de abril de 2024:

El nivel básico puede tener hasta tres particiones y tres réplicas, y un total de nueve unidades de búsqueda (SU).
Básico, S1, S2, S3 tiene más almacenamiento por partición, que oscila entre 3 y 7 veces más, en función del nivel.
El nuevo servicio de búsqueda debe estar en una región compatible para obtener la capacidad adicional de nivel básico y otros niveles.

Actualmente, no hay ninguna actualización local. Debe crear un nuevo servicio de búsqueda para beneficiarse del almacenamiento adicional.

Resource	Gratuito	Básico	S1	S2	S3	S3 HD	L1	L2
Acuerdo de Nivel de Servicio (SLA)	No	Sí	Sí	Sí	Sí	Sí	Sí	Sí
Almacenamiento (tamaño de partición)	50 MB	15 GB	160 GB	350 GB	700 GB	700 GB	1 TB	2 TB
Particiones	N/D	3	12	12	12	3	12	12
Réplicas	N/D	3	12	12	12	12	12	12

Regiones admitidas con mayores límites de almacenamiento

Los servicios creados después del 3 de abril de 2024 deben estar en una de las siguientes regiones para obtener el almacenamiento adicional. Vea los anuncios en Novedades de Azure AI Search para la expansión a otras regiones.

Country	Regiones que proporcionan capacidad adicional por partición
Estados Unidos	Este de EE. UU., Este de EE. UU. 2, Centro de EE. UU., Centro-norte de EE. UU., Centro-sur de EE. UU., Oeste de EE. UU., Oeste de EE. UU. 2, Oeste de EE. UU. 3, Centro-oeste de EE. UU.
Reino Unido	Sur de Reino Unido, Oeste de Reino Unido
Emiratos Árabes Unidos	Norte de Emiratos Árabes Unidos
Suiza	Oeste de Suiza
Suecia	Centro de Suecia
Polonia	Centro de Polonia
Noruega	Este de Noruega
Corea	Centro de Corea del Sur, Corea del Sur
Japón	Este de Japón, Oeste de Japón
Italia	Norte de Italia
India	Centro de la India, Oeste de la India
Francia	Centro de Francia
Europa	Norte de Europa
Canadá	Centro de Canadá, Este de Canadá
Bazil	Sur de Brasil
Asia-Pacífico	Este de Asia, Sudeste de Asia
Australia	Este de Australia, Sudeste de Australia

Límites de índice

Recurso	Gratuito	Básico ¹	S1	S2	S3	S3 HD	L1	L2
Índices máximos	3	5 o 15	50	200	200	1000 GB por partición o 3000 por servicio	10	10
Campos simples máximos por índice ²	1 000	100	1000	1000	1000	1000	1000	1000
Dimensiones máximas por campo de vector	3072	3072	3072	3072	3072	3072	3072	3072
Colecciones complejas máximas por índice	40	40	40	40	40	40	40	40
Elementos máximos en todas las colecciones complejas por documento ³	3000	3000	3000	3000	3000	3000	3000	3000
Profundidad máxima de campos complejos	10	10	10	10	10	10	10	10
Proveedores de sugerencias máximos por índice	1	1	1	1	1	1	1	1
Perfiles de puntuación máximos por índice	100	100	100	100	100	100	100	100
Funciones máximas por perfil	8	8	8	8	8	8	8	8
Tamaño máximo de índice ⁴	N/D	N/D	N/D	1,92 TB	2,4 TB	100 GB	N/D	N/D

¹ Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los índices. El nivel básico es el único nivel con un límite inferior de 100 campos por índice.

² El límite superior de los campos incluye campos de primer nivel y subcampos anidados en una colección compleja. Por ejemplo, si un índice contiene 15 campos y tiene dos colecciones complejas con 5 subcampos cada uno, el recuento de campos del índice es 25. Los índices que tengan una colección de campos muy grandes pueden ser lentos. Limite los campos y atributos a solo los que necesite y ejecute la indexación y la prueba de consulta para asegurarse de que el rendimiento sea aceptable.

³ Existe un límite superior para los elementos porque tener un gran número de ellos aumenta significativamente el almacenamiento necesario para el índice. Un elemento de una colección compleja se define como un miembro de esa colección. Por ejemplo, supongamos un documento de hotel con una colección de habitaciones compleja, donde cada habitación de dicha colección se considera un elemento. Durante la indexación, el motor de indexación puede procesar de forma segura un máximo de 3000 elementos en todo el documento. Este límite se presentó en api-version=2019-05-06 y se aplica solo a colecciones complejas, no a colecciones de cadenas ni a campos complejos.

⁴ En la mayoría de los niveles, el tamaño máximo del índice está disponible en el servicio de búsqueda. Para S2, S3 y S3 HD, el tamaño máximo de cualquier índice es el número proporcionado en la tabla. Se aplica a los servicios de búsqueda creados después del 3 de abril de 2024.

Es posible que encuentre alguna variación en los límites máximos si el servicio casualmente se aprovisiona en un clúster más eficaz. Los límites aquí representan el denominador común. Los índices creados con las especificaciones anteriores se pueden transportar entre los niveles de servicio equivalentes de cualquier región.

Límites de documento

Puede tener aproximadamente 24 mil millones de documentos por índice en los servicios de búsqueda Basic, S1, S2, S3, L1 y L2. En el caso de S3 HD, el límite es de 2 mil millones de documentos por índice. Cada instancia de una colección compleja cuenta como un documento independiente en términos de estos límites.

Límites de tamaño de documento por llamada API

El tamaño máximo del documento cuando se llama a una API de índice es de aproximadamente 16 megabytes.

El tamaño del documento es de hecho un límite en el tamaño del cuerpo de la solicitud de la API de índice. Dado que se puede pasar un lote de varios documentos a la API de índice de una vez, el límite de tamaño depende en realidad de cuántos documentos estén en el lote. Para un lote con un único documento, el tamaño máximo del documento es de 16 MB de JSON.

Al calcular el tamaño del documento, recuerde tener en cuenta solo los campos que puede usar un servicio de búsqueda. Los datos binarios o de imagen de los documentos de origen deben omitirse en los cálculos.

Límites de tamaño del índice vectorial

Al indexar documentos con campos vectoriales, la Búsqueda de Azure AI construye índices vectoriales internos mediante los parámetros de algoritmo que proporcione. El tamaño de estos índices vectoriales está restringido por la memoria reservada para el vector de búsqueda del nivel de servicio (o SKU).

El servicio aplica una cuota de tamaño de índice vectorial para cada partición en el servicio de búsqueda. Cada partición adicional aumenta la cuota de tamaño de índice vectorial disponible. Esta cuota supone un límite estricto que sirve para asegurar que su servicio funcione correctamente, lo que significa que realizar más intentos de indexación una vez que se ha superado el límite provoca errores. Puede reanudar la indexación una vez que libere la cuota disponible eliminando algunos documentos vectoriales o escalando verticalmente en particiones.

En la tabla se describe la cuota de tamaño del índice de vector por partición en los niveles de servicio. En el contexto, incluye:

Límites de almacenamiento de particiones para cada nivel, repetido aquí para el contexto.
Cantidad de cada partición (en GB) disponible para los índices vectoriales (creados al agregar campos vectoriales a un índice).
Número aproximado de incrustaciones (valores de punto flotante) por partición.

Use el GET Service Statistics para recuperar la cuota de tamaño del índice vectorial o revise la página Índices o la pestaña Utilización en Azure Portal.

Los límites de vectores varían según la fecha y el nivel de creación del servicio. Para comprobar la antigüedad del servicio de búsqueda y obtener más información sobre los índices vectoriales, consulte Tamaño del índice vector y mantenerse debajo de los límites.

Límites de vectores en los servicios creados después del 3 de abril de 2024 en regiones admitidas

Los límites de vectores más altos están disponibles en los servicios de búsqueda creados después del 3 de abril de 2024 en una región admitida.

Nivel	Cuota de almacenamiento (GB)	Cuota de vectores por partición (GB)	Floats aproximados por partición (suponiendo un 15 % de sobrecarga)
Basic	15	5	1.100 millones
S1	160	35	8.200 millones
S2	350	100	23.500 millones
S3	700	200	47.000 millones
L1	1,000	12	2800 millones
L2	2.000	36	8400 millones

Tenga en cuenta que los límites L1 y L2 no se modifican en el lanzamiento del 3 de abril.

Límites de vectores en los servicios creados entre el 1 de julio de 2023 y el 3 de abril de 2024

Los siguientes límites se aplican a los nuevos servicios creados entre el 1 de julio y el 3 de abril de 2024, excepto para las siguientes regiones, que tienen los límites originales anteriores al 1 de julio de 2023:

Centro-oeste de Alemania
Oeste de la India
Centro de Catar

Todas las demás regiones tienen estos límites:

Nivel	Cuota de almacenamiento (GB)	Cuota de vectores por partición (GB)	Floats aproximados por partición (suponiendo un 15 % de sobrecarga)
Basic	2	1	235 millones
S1	25	3	700 millones
S2	100	12	2800 millones
S3	200	36	8400 millones
L1	1,000	12	2800 millones
L2	2.000	36	8400 millones

Límites de vectores en los servicios creados antes del 1 de julio de 2023

Nivel	Cuota de almacenamiento (GB)	Cuota de vectores por partición (GB)	Floats aproximados por partición (suponiendo un 15 % de sobrecarga)
Basic	2	0.5	115 millones
S1	25	1	235 millones
S2	100	6	1400 millones
S3	200	12	2800 millones
L1	1,000	12	2800 millones
L2	2.000	36	8400 millones

Límites de indexador

Los tiempos de ejecución máximos existen para proporcionar equilibrio y estabilidad al servicio como un todo, pero es posible que los conjuntos de datos más grandes necesiten más tiempo de indexación que el que permite el máximo. Si un trabajo de indexación no se puede completar en el tiempo máximo permitido, intente ejecutarlo en una programación. El programador realiza un seguimiento del estado de la indexación. Si un trabajo programado de indexación se interrumpe por cualquier motivo, el indizador puede reanudarlo donde se quedó en la siguiente ejecución programada.

Recurso	Gratis ¹	Básico ²	S1	S2	S3	S3 HD ³	L1	L2
Indexadores máximos	3	5 o 15	50	200	200	N/D	10	10
Orígenes de datos máximos	3	5 o 15	50	200	200	N/D	10	10
Conjuntos de habilidades máximos ⁴	3	5 o 15	50	200	200	N/D	10	10
Carga máxima de indexación por invocación	10 000 documentos	Limitado solamente por el número máximo de documentos	Limitado solamente por el número máximo de documentos	Limitado solamente por el número máximo de documentos	Limitado solamente por el número máximo de documentos	N/D	Sin límite	Sin límite
Programación mínima	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos
Tiempo de ejecución máximo ⁵	1-3 minutos	2 o 24 horas	2 o 24 horas	2 o 24 horas	2 o 24 horas	N/D	2 o 24 horas	2 o 24 horas
Tiempo máximo de ejecución de los indexadores con un aptitudes ⁶	3-10 minutos	2 horas	2 horas	2 horas	2 horas	N/D	2 horas	2 horas
Indexador de blobs: tamaño máximo de blob, MB	16	16	128	256	256	N/D	256	256
Indexador de blobs: número máximo de caracteres del contenido extraído de un blob	32 000	64 000	4 millones	8 millones	16 millones	N/D	4 millones	4 millones

¹ Los servicios gratuitos tienen un tiempo de ejecución máximo del indexador de 3 minutos para servicios de blob y de 1 minuto para todos los demás orígenes de datos. La invocación del indexador es una vez cada 180 segundos. Para la indexación de IA que llama a los servicios de Azure AI, los servicios gratuitos se limitan a 20 transacciones gratuitas por indexador por día, donde una transacción se define como un documento que pasa correctamente a través de la canalización de enriquecimiento (sugerencia: puedes restablecer un indexador para restablecer su recuento).

² Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los indexadores, los orígenes de datos y los conjuntos de aptitudes.

³ Los servicios S3 HD no incluyen compatibilidad con el indexador.

⁴ Máximo de 30 habilidades por conjunto de habilidades.

⁵ Con respecto a la duración máxima de 2 o 24 horas para los indexadores: un máximo de 2 horas es el más común y es lo que debe planear. El límite de 24 horas es de una implementación anterior del indexador. Si tiene indizadores no programados que se ejecutan continuamente durante 24 horas, es porque esos indexadores no se pudieron migrar a la infraestructura más reciente. Como regla general, para los trabajos de indexación que no pueden finalizar en dos horas, coloque el indexador en una programación de 2 horas. Cuando se completa el primer intervalo de 2 horas, el indizador recoge dónde se dejó al iniciar el siguiente intervalo de 2 horas.

⁶ La ejecución del conjunto de habilidades, y el análisis de imágenes en particular, requieren un uso intensivo de la computación y consumen cantidades desproporcionadas de potencia de procesamiento disponible. El tiempo de ejecución de estas cargas de trabajo se ha abreviado para que otros trabajos de la cola tengan más posibilidades de ejecutarse.

Nota:

Como se indica en el apartado Límites de índice, los indexadores también aplicarán el límite superior de 3000 elementos en todas las colecciones complejas por documento a partir de la versión de la API de disponibilidad general más reciente que admita tipos complejos (2019-05-06) en adelante, lo que significa que si ha creado un indexador con una versión anterior de la API, no estará sujeto a ese límite. Para conservar la máxima compatibilidad, los indexadores que se crearon con una versión anterior de la API y, después, se actualizaron con una versión de la API 2019-05-06, o posterior, seguirá estando excluido de los límites. Los clientes deben ser conscientes del impacto negativo de tener colecciones muy complejas (como se ha indicado anteriormente) y recomendamos encarecidamente que se creen todos los indexadores con la versión de la API de disponibilidad general más reciente.

Límites de recursos compartidos de Private Link

Los indexadores pueden acceder a otros recursos de Azure mediante puntos de conexión privados administrados con la API de recursos compartidos de Private Link. En esta sección se describen los límites asociados a esta funcionalidad.

Recurso	Gratuito	Básico	S1	S2	S3	S3 HD	L1	L2
Compatibilidad con indexador de puntos de conexión privados	No	Sí	Sí	Sí	Sí	No	Sí	Sí
Compatibilidad con puntos de conexión privados para indexadores con un conjunto de aptitudes¹	No	N.º	No	Sí	Sí	No	Sí	Sí
Número máximo de puntos de conexión privados	N/D	10 o 30	100	400	400	N/D	20	20
Número máximo de tipos de recursos distintos²	N/D	4	7	15	15	N/D	4	4

¹ El análisis de imágenes y el enriquecimiento con IA consumen muchos recursos informáticos y una cantidad desproporcionada de la potencia de procesamiento disponible. Por este motivo, las conexiones privadas están deshabilitadas en niveles inferiores para garantizar el rendimiento y la estabilidad del propio servicio de búsqueda.

² El número de tipos de recursos distintos se calcula como el número de valores de groupId únicos utilizados en todos los recursos compartidos de Private Link para un servicio de búsqueda determinado, independientemente del estado del recurso.

Límites de sinónimos

El número máximo de asignaciones de sinónimos varía según el nivel. Cada regla puede tener hasta 20 expansiones, donde una expansión es un término equivalente. Por ejemplo, dado el término "gato", la asociación con "gatito", "felino" y "felis" (el género de gatos) contaría como 3 expansiones.

Recurso	Gratuito	Básico	S1	S2	S3	S3-HD	L1	L2
Asignaciones máximas de sinónimos	3	3	5	10	20	20	10	10
Número máximo de reglas por asignación	5000	20000	20000	20000	20000	20000	20000	20000

Límites de alias de índice

El número máximo de alias de índice varía según el nivel. En todos los niveles, el número máximo de alias es el doble del número máximo de índices permitido.

Recurso	Gratuito	Básico	S1	S2	S3	S3-HD	L1	L2
Alias máximos	6	10 o 30	100	400	400	2000 GB por partición o 6000 por servicio	20	20

Límites de datos (enriquecimiento de inteligencia artificial)

Una canalización de enriquecimiento con IA que realiza llamadas a un recurso de lenguaje de Azure AI para el reconocimiento de entidades, la vinculación de entidades, la extracción de frases clave, el análisis de sentimiento, la detección de idioma y la detección de información personal está sujeta a los límites de datos. El tamaño máximo de un registro debe tener menos de 50 000 caracteres según la medición de String.Length. Si tiene que dividir los datos antes de enviarlos al analizador de opiniones, use la aptitud División de texto.

Limitaciones

Las solicitudes de API se limitan a medida que el sistema se aproxima a la capacidad máxima. La limitación se comporta de forma diferente para las distintas API. Las API de consulta (Search/Suggest/Autocomplete) y las de indexación se limitan dinámicamente en función de la carga del servicio. Las API de índice y las API de operaciones de servicio tienen límites estáticos de frecuencia de solicitud.

Límites estáticos de frecuencia de solicitudes para las operaciones relacionadas con un índice:

Enumerar índices (GET /indexes): 3 por segundo por unidad de búsqueda
Obtener índice (GET /indexes/myindex): 10 por segundo por unidad de búsqueda
Crear índice (POST /indexes): 12 por minuto por unidad de búsqueda
Crear o actualizar índice (PUT /indexes/myindex): 6 por segundo por unidad de búsqueda
Eliminar índice (DELETE /indexes/myindex): 12 por minuto por unidad de búsqueda

Límites estáticos de frecuencia de solicitudes para las operaciones relacionadas con un servicio:

Estadísticas de servicio (GET /servicestats): 4 por segundo por unidad de búsqueda

Límites de solicitud de API

Máximo de 16 MB por solicitud ¹
Longitud máxima de la dirección URL de 8 KB
Máximo de 1000 documentos por lote de cargas, combinaciones o eliminaciones de índices
Máximo de 32 campos en cláusula $orderby
Máximo de 100 000 caracteres en una cláusula de búsqueda
El número máximo de cláusulas en search (expresiones separadas por AND u OR) es 1024.
El tamaño máximo del término de búsqueda es de 32 766 bytes (32 KB menos 2 bytes) de texto con codificación UTF-8
El tamaño máximo del término de búsqueda es de 1000 caracteres para la búsqueda de prefijos y la búsqueda de expresiones regulares
La búsqueda de caracteres comodín y la búsqueda de expresiones regulares se limitan a un máximo de 1000 estados cuando las procesa Lucene.

¹ En Azure AI Search, el cuerpo de una solicitud está sujeto a un límite superior de 16 MB, lo que impone un límite práctico sobre el contenido de campos individuales o colecciones que no están restringidos de algún modo por límites teóricos (vea Tipos de datos admitidos para obtener más información sobre composición de campos y restricciones).

Existen límites en el tamaño y la composición de las consultas porque las consultas sin enlazar pueden desestabilizar el servicio de búsqueda. Normalmente, estas consultas se crean mediante programación. Si la aplicación genera consultas de búsqueda mediante programación, se recomienda diseñarla de manera que no genere consultas de tamaño ilimitado.

Límites de respuesta de API

Máximo de 1000 documentos devueltos por página de resultados de búsqueda
Máximo de 100 sugerencias devueltas por solicitud de Sugerir API

Límites de clave de API

Las claves de API se usan para la autenticación del servicio. Hay dos tipos. Las claves de administración se especifican en el encabezado de solicitud y conceden acceso completo de lectura y escritura al servicio. Las claves de consulta son de solo lectura, se especifican en la dirección URL y normalmente se distribuyen a las aplicaciones cliente.

Máximo de 2 claves de administración por servicio
Máximo de 50 claves de consultas por servicio