Características de Azure AI Search

Azure AI Search permite la recuperación de la información y usa la integración opcional de la IA para extraer más texto y contenido estructural.

En la tabla siguiente se resumen las características por categoría. Para más información sobre la comparación de Azure AI Search con otras tecnologías de búsqueda, consulte Comparación de las opciones de búsqueda.

En las nubes soberanas, privadas y públicas de Azure hay una paridad de características, pero algunas características no se admiten en determinadas regiones. Para más información, consulte la disponibilidad de los productos por región.

Nota:

¿Busca características en versión preliminar? Consulte la lista de características en vista previa (GB).

Características de indexación

Categoría Características
Orígenes de datos Los índices de búsqueda pueden aceptar texto de cualquier origen, siempre que se envíe como un documento JSON.

Los indexadores son una característica que automatiza la importación de datos desde orígenes de datos compatibles para extraer contenido que permite realizar búsquedas en almacenes de datos principales. Los indexadores controlan la serialización JSON automáticamente y la mayoría admite alguna forma de detección de cambios y eliminación. Puede conectarse a varios orígenes de datos, incluidos Azure SQL Database, Azure Cosmos DB o Azure Blob Storage.
Estructuras de datos jerárquicas y anidadas Los tipos complejos y las colecciones le permiten modelar casi cualquier tipo de estructura JSON dentro de un índice de búsqueda. La cardinalidad "uno a varios" y "varios a varios" se puede expresar de forma nativa a través de colecciones, tipos complejos y colecciones de tipos complejos.
Análisis lingüístico Los analizadores son componentes que se usan para el procesamiento de texto durante las operaciones de indexación y búsqueda. De forma predeterminada, puede usar el analizador estándar de Lucene de uso general o reemplazar el valor predeterminado por un analizador de lenguaje, un analizador personalizado que usted configure u otro analizador predefinido que genere tokens en el formato que necesite.

Los analizadores de idioma de Lucene o de Microsoft se usan para controlar de manera inteligente la lingüística específica del idioma, como tiempos verbales, género, nombres plurales irregulares (por ejemplo, "régimen" frente a "regímenes"), separación de palabras compuestas, separación de palabras (para idiomas sin espacios) y mucho más.

Los analizadores léxicos personalizados se usan para formas de consulta complejas, como la coincidencia fonética y las expresiones regulares.

Categoría Características
Indexación de vectores En los índices de búsqueda, es preciso agregarcampos vectoriales para que se puedan realizar búsquedas vectoriales. Los campos vectoriales pueden coexistir en los campos no vectoriales en el mismo documento de búsqueda.
Consultas vectoriales Formule consultas vectoriales individuales y múltiples.
Algoritmos de búsqueda vectorial Use los algoritmos de mundo pequeño jerárquico navegable o de k vecinos más próximos (KNN) para encontrar vectores similares en cualquier índice de búsqueda.
Filtros vectoriales Aplique filtros antes o después de la ejecución de la consulta para aumentar la precisión a la hora de recuperar la información.
Recuperación de información híbrida Busque conceptos y palabras clave en una única solicitud de consulta híbrida.

La búsqueda híbrida consolida la búsqueda de vectores y de texto, y, opcionalmente, para lograr unos resultados óptimos se puede realizar una clasificación semántica y un ajuste de la relevancia.
Integración de la vectorización y de la fragmentación de datos (versión preliminar) La fragmentación de los datos nativos se realiza mediante la aptitud División de texto, mientras que la vectorización nativa se obtiene mediante vectorizadores y azureOpenAIEmbeddingModel.

La vectorización integrada (versión preliminar) proporciona una canalización de indexación de un extremo a otro de los archivos de origen en consultas.
Compresión y cuantificación de vectores integrados Use cuantificación escalar integrada para reducir el tamaño del índice vectorial en memoria y en el disco. También puede renunciar al almacenamiento de vectores que no necesita o asignar tipos de datos estrechos a campos vectoriales para requisitos de almacenamiento reducidos.
Importación y vectorización de datos (versión preliminar) Un asistente nuevo de Azure Portal que crea una canalización de indexación completa que incluye la vectorización y la fragmentación de datos. El asistente crea todos los objetos y valores de configuración.

Enriquecimiento con IA y minería de conocimientos

Categoría Características
Procesamiento de IA durante la indexación El enriquecimiento con IA hace referencia al procesamiento de lenguaje natural e imágenes insertadas en una canalización del indexador que extrae texto e información del contenido que, de otro modo, no se puede indexar para la búsqueda de texto completo. El procesamiento de IA se logra mediante la adición y combinación de aptitudes en un conjunto de aptitudes, que posteriormente se asocia a un indizador. La IA pueden ser aptitudes integradas de Microsoft, como la traducción de texto o el reconocimiento óptico de caracteres (OCR), o aptitudes personalizadas proporcionadas por el usuario.
Almacenamiento de contenido enriquecido para su análisis y consumo en escenarios que no son de búsqueda El almacén de conocimiento es un almacenamiento persistente de contenido enriquecido, diseñado para escenarios que no son de búsqueda, como la minería de conocimiento y el procesamiento de ciencia de datos. Un almacén de conocimiento se define en un conjunto de aptitudes, pero se crea en Azure Storage como objetos o conjuntos de filas tabulares.
Enriquecimientos en caché El enriquecimiento incremental (versión preliminar) hace referencia a los enriquecimientos en caché que se pueden reutilizar durante la ejecución del conjunto de aptitudes. El almacenamiento en caché es especialmente valioso en conjuntos de aptitudes que incluyen OCR y análisis de imágenes, cuyo procesamiento es caro.

Consulta y experiencia del usuario

Categoría Características
Búsqueda de texto de forma libre La búsqueda de texto completo es el principal caso de uso para la mayoría de las aplicaciones basadas en búsquedas. Las consultas se formulan con una sintaxis compatible.

Sintaxis de consulta simple ofrece operadores lógicos, de búsqueda de frase, de sufijo y de precedencia.

Sintaxis de consulta completa de Lucene incluye todas las operaciones en sintaxis simple, con extensiones para la búsqueda aproximada, búsqueda de proximidad, incremento de términos y expresiones regulares.
Relevancia La puntuación simple es una ventaja clave de Azure AI Search. Los perfiles de puntuación sirven para modelar la relevancia en función de los valores de los propios documentos. Por ejemplo, tal vez se desea que los productos más recientes o con descuento aparezcan arriba en los resultados de búsqueda. También se pueden crear perfiles de puntuación mediante etiquetas para puntuaciones personalizadas, según las preferencias de búsqueda de los clientes de las que se ha hecho seguimiento y se han almacenado por separado.

Clasificador semántico es una característica prémium que vuelve a clasificar resultados en base a la relevancia semántica de la consulta. En función del contenido y el escenario, puede mejorar significativamente la relevancia de la búsqueda con una configuración o un esfuerzo casi mínimos.
Búsqueda geoespacial Las funciones geoespaciales filtran y coinciden en coordenadas geográficas. Puede hacer coincidir la distancia o incluirlas en una forma de polígono.
Filtros y facetas La navegación por facetas se habilita con un único parámetro de consulta. Azure AI Search devuelve una estructura de navegación por facetas que se puede utilizar como código subyacente a una lista de categorías para el filtrado autodirigido (por ejemplo, para filtrar los elementos de catálogo por intervalo de precios o marca).

Se pueden usar filtros para incorporar fácilmente la navegación por facetas en la interfaz de usuario de la aplicación, mejorar la formulación de consulta y filtrar según los criterios especificados por el usuario o el desarrollador. Los filtros se crean con la sintaxis de OData.
Experiencia del usuario La función autocompletar puede habilitarse para realizar sugerencias de búsqueda para las consultas en una barra de búsqueda.

La función sugerencias de búsqueda también funciona fuera de las entradas de texto parcial en una barra de búsqueda, pero los resultados son documentos reales en el índice en lugar de términos de consulta.

Los sinónimos asocian términos equivalentes que expanden implícitamente el ámbito de una consulta, sin que el usuario tenga que proporcionar los términos alternativos.

El resaltado de referencias aplica un formato de texto a una palabra clave coincidente en los resultados de búsqueda. Se puede elegir qué campos devuelven los fragmentos resaltados.

La ordenación se ofrece para varios campos mediante el esquema de índice y se activa o se desactiva en el momento de la consulta con un único parámetro de búsqueda.

La paginación y la limitación de los resultados de búsqueda se aplican fácilmente con el control de precisión que Azure AI Search ofrece para los resultados de búsqueda.

Características de seguridad

Categoría Características
Cifrado de datos El cifrado en reposo administrado por Microsoft está integrado en la capa de almacenamiento interno y es irrevocable.

Las claves de cifrado administradas por el cliente que se crean y administran en Azure Key Vault se pueden usar para el cifrado complementario de índices y mapas de sinónimos. En el caso de los servicios creados después del 1 de agosto de 2020, el cifrado de CMK se extiende a los datos de los discos temporales, para el cifrado doble completo del contenido indizado.
Protección de punto de conexión Las reglas de IP para la compatibilidad con el firewall de entrada permite configurar intervalos IP en los que el servicio de búsqueda aceptará solicitudes.

Cree un punto de conexión privado mediante Azure Private Link para forzar todas las solicitudes a través de una red virtual.
Acceso de entrada El control de acceso basado en rol de Azure asigna roles a usuarios y grupos de Microsoft Entra ID para controlar el acceso al contenido y a las operaciones de búsqueda. Si no dispone de ningún inquilino de Azure, también puede usar la autenticación mediante clave.
Seguridad de salida (indizadores) El acceso a los datos a través de puntos de conexión privados permite que un indexador se conecte a los recursos de Azure que están protegidos a través de Azure Private Link.

El acceso a los datos mediante una identidad de confianza significa que las cadenas de conexión a orígenes de datos externos pueden omitir nombres de usuario y contraseñas. Cuando un indexador se conecta al origen de datos, el recurso permite la conexión si el servicio de búsqueda se registró previamente como un servicio de confianza.

Características del portal

Categoría Características
Herramientas para la creación de prototipos y la inspección Agregar índice es un diseñador de índices del portal que se puede usar para crear un esquema básico que conste de campos con atributos y unos cuantos valores de configuración. Después de guardar el índice, puede rellenarlo mediante un SDK o la API de REST para proporcionar los datos.

El Asistente para la importación de datos crea índices, indexadores, conjuntos de aptitudes y definiciones de orígenes de datos. Si existen los datos en Azure, este asistente puede ahorrar mucho tiempo y esfuerzo, especialmente para la investigación y exploración de la prueba de concepto.

El Explorador de búsqueda se usa para probar las consultas y refinar los perfiles de puntuación.

La creación de una aplicación de demostración se usa para generar una página HTML que se puede usar para probar la experiencia de búsqueda.

Sesiones de depuración es un editor visual que permite depurar un conjunto de aptitudes de forma interactiva. Muestra las dependencias, la salida y las transformaciones.
Supervisión y diagnóstico Habilite las características de supervisión para ir más allá de las "métricas de un vistazo" que están siempre disponibles en el portal. Las métricas sobre consultas por segundo, latencia y limitación se capturan y notifican en páginas del portal sin que sea necesaria ninguna configuración adicional.

Programación

Categoría Características
REST La API REST de servicios sirve para las operaciones del plano de datos, incluidas todas las operaciones relacionadas con la indexación, las consultas y el enriquecimiento con IA. También puede usar esta biblioteca cliente para recuperar información del sistema y estadísticas.

API de REST de administración sirve para la creación y el aprovisionamiento de servicios a través de Azure Resource Manager. También puede usar esta API para administrar las claves y la capacidad.
SDK de Azure para .NET Azure.Search.Documents sirve para las operaciones del plano de datos, incluidas todas las operaciones relacionadas con la indexación, las consultas y el enriquecimiento con IA. También puede usar esta biblioteca cliente para recuperar información del sistema y estadísticas.

Microsoft.Azure.Management.Search sirve para la creación y el aprovisionamiento de servicios a través de Azure Resource Manager. También puede usar esta API para administrar las claves y la capacidad.
SDK de Azure para Java com.azure.search.documents sirve para las operaciones del plano de datos, incluidas todas las operaciones relacionadas con la indexación, las consultas y el enriquecimiento con IA. También puede usar esta biblioteca cliente para recuperar información del sistema y estadísticas.

com.microsoft.azure.management.search sirve para la creación y el aprovisionamiento de servicios a través de Azure Resource Manager. También puede usar esta API para administrar las claves y la capacidad.
SDK de Azure para Python azure-search-documents sirve para las operaciones del plano de datos, incluidas todas las operaciones relacionadas con la indexación, las consultas y el enriquecimiento con IA. También puede usar esta biblioteca cliente para recuperar información del sistema y estadísticas.

azure-mgmt-search sirve para la creación y el aprovisionamiento de servicios a través de Azure Resource Manager. También puede usar esta API para administrar las claves y la capacidad.
Azure SDK para JavaScript o TypeScript azure/search-documents sirve para las operaciones del plano de datos, incluidas todas las operaciones relacionadas con la indexación, las consultas y el enriquecimiento con IA. También puede usar esta biblioteca cliente para recuperar información del sistema y estadísticas.

azure/arm-search sirve para la creación y el aprovisionamiento de servicios a través de Azure Resource Manager. También puede usar esta API para administrar las claves y la capacidad.

Consulte también