Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Azure AI Search es un servicio hospedado en la nube totalmente administrado que conecta los datos a la inteligencia artificial. El servicio unifica el acceso al contenido empresarial y web para que los agentes y los LLM puedan usar el contexto, el historial de chat y las señales de varias fuentes para generar respuestas confiables y fundamentadas.
Entre los casos de uso comunes se incluyen la búsqueda clásica y la generación aumentada de recuperación (RAG) moderna a través de la recuperación de agentes. Esto hace que Azure AI Search sea adecuado para escenarios empresariales y de consumidor, tanto si va a agregar funcionalidad de búsqueda a un sitio web, una aplicación, un agente o un bot de chat.
Al crear un servicio de búsqueda, se desbloquean las siguientes funcionalidades:
- Dos motores: búsqueda clásica de solicitudes únicas y recuperación agente para búsquedas paralelas, iterativas y asistidas por LLM.
- Consultas de texto completo, vectoriales, híbridas y multimodales a través de contenido local (indexado) y remoto.
- Enriquecimiento con IA para fragmentar, vectorizar y de otras maneras hacer que el contenido sin procesar sea buscable.
- Ajuste de relevancia para mejorar la coincidencia de intenciones y la calidad de los resultados.
- Azure escalabilidad, seguridad, supervisión y cumplimiento.
- Integraciones de Azure con plataformas de datos compatibles, Azure OpenAI y Microsoft Foundry.
Motivos para usar Azure AI Search
Agentes de base y bots de chat en datos de su propiedad, empresariales o web para respuestas precisas y con reconocimiento del contexto.
Acceda a datos desde Azure Blob Storage, Azure Cosmos DB, Microsoft SharePoint, Microsoft OneLake y otros orígenes de datos admitidos. Elija acceso indizado o remoto en función de sus necesidades de actualización, latencia y cumplimiento.
Enriquezca y estructure el contenido en tiempo de indexación o consulta con habilidades que realizan segmentación, incrustaciones y transformaciones con la asistencia de LLM.
Combine la búsqueda de texto completo con búsqueda vectorial (búsqueda híbrida) para equilibrar la precisión y la recuperación.
Consulta contenido que contiene tanto texto como imágenes en una única canalización multimodal.
Implementación con facilidad de características relacionadas con la búsqueda: ajuste de relevancia, navegación por facetas, filtros (incluida la búsqueda espacial geográfica), asignación de sinónimos y Autocompletar.
Proporcionar seguridad empresarial, control de acceso y cumplimiento a través de Microsoft Entra, Azure Private Link, control de acceso de nivel de documento y acceso basado en roles.
Escale y trabaje en producción con la fiabilidad, supervisión y diagnóstico de Azure (registros, métricas y alertas) y API REST o herramientas de SDK para la automatización.
Para más información sobre la funcionalidad específica, consulte Características de Azure AI Search.
¿Qué es la búsqueda clásica?
La búsqueda clásica es un modelo de recuperación de índice primero para consultas predecibles y de baja latencia. Cada consulta tiene como destino un único índice de búsqueda predefinido y devuelve documentos clasificados en un ciclo de solicitud-respuesta. No se produce ninguna planificación, iteración o síntesis asistida por LLM durante la recuperación.
En esta arquitectura, el servicio de búsqueda se encuentra entre los almacenes de datos que contienen el contenido no procesado y la aplicación cliente. La aplicación es responsable de enviar solicitudes de consulta al servicio de búsqueda y controlar la respuesta.
Esta arquitectura tiene dos cargas de trabajo principales:
La indexación carga contenido en un índice y hace que se pueda realizar búsquedas. Internamente, el texto entrante se tokeniza y almacena en índices invertidos, mientras que los vectores de entrada se almacenan en índices vectoriales. Azure AI Search solo puede indexar documentos JSON. Puede usar el método push para cargar documentos JSON directamente o el método de extracción (indexador o flujo de trabajo de aplicación lógica) para recuperar y serializar datos en JSON.
Durante la indexación, puede usar el enriquecimiento con IA para fragmentar texto, generar vectores y aplicar otras transformaciones que crean estructura y contenido. A continuación, Azure AI Search serializa la salida enriquecida en documentos JSON y las ingiere en el índice.
Nota:
Este diagrama separa los motores de indexación y consulta para mayor claridad, pero en Azure AI Search, son el mismo componente que funciona en modos de lectura y escritura y de solo lectura.
¿Qué es la recuperación de agentes?
La recuperación de agentes es una canalización de varias consultas diseñada para flujos de trabajo complejos de agente a agente. Cada consulta tiene como destino una base de conocimiento que representa un dominio completo de conocimiento. Un agente es una base de conocimiento que determina en qué se basa, mientras que la base de conocimiento gestiona cómo se realiza el análisis.
Una base de conocimiento consta de uno o varios orígenes de conocimiento, un LLM opcional para la planificación de consultas y la síntesis de respuestas, y parámetros que rigen el comportamiento de recuperación. Cada consulta se somete a la planificación, descomposición en subconsultas centradas, recuperación paralela de orígenes de conocimiento, reordenamiento semántico y combinación de resultados. La respuesta de tres vías está optimizada para su uso por parte del agente.
En segundo plano, la recuperación agéntica se basa en la arquitectura de búsqueda clásica, añadiendo una capa de contexto (base de conocimiento) que orquesta la recuperación de múltiples fuentes. Los orígenes de conocimiento se pueden indexar o remotos: los orígenes indexados usan los mismos motores de indexación y consulta que la búsqueda clásica, mientras que los orígenes remotos omiten la indexación y se consultan en directo.
Cómo se comparan
La búsqueda clásica y la recuperación agente son modos complementarios de recuperación de información. Ambos admiten la búsqueda de texto completo, vector, híbrido y bidireccional . Sin embargo, difieren en cómo se ingiere y consulta el contenido. En la tabla siguiente se resumen sus principales diferencias.
| Aspecto | Búsqueda clásica | Recuperación de agente |
|---|---|---|
| Buscar en el corpus | Índice de búsqueda | Fuente de conocimiento |
| Destino de búsqueda | Un índice definido por un esquema | Una base de conocimiento que apunta a uno o varios orígenes de conocimiento |
| Plan de consulta | Sin plan, solo una solicitud | Plan asistido por LLM o proporcionado por el usuario |
| Solicitud de consulta | Buscar documentos en un índice | Recuperar de fuentes de conocimiento |
| Respuesta | Resultados de búsqueda simplificados según el esquema | Respuesta formulada por LLM o datos de origen sin procesar, registro de actividad, referencias |
| Restricciones de región | No | Sí |
| Estado | Disponible con carácter general | Versión preliminar pública |
Introducción
Puede acceder a Azure AI Search a través de Azure Portal, las API REST y los SDK de Azure para .NET, Java, JavaScript y Python.
El portal es útil para la administración de servicios y la administración de contenido, con herramientas para crear prototipos de las bases de conocimiento, orígenes de conocimiento, índices, indexadores, conjuntos de aptitudes y orígenes de datos. Las API REST y los SDK son útiles para la automatización de producción.
Elección de la ruta de acceso
Antes de empezar, use esta lista de comprobación para tomar decisiones clave:
Elija un motor de búsqueda: Si no usa un agente o bot de chat, la búsqueda clásica puede satisfacer la mayoría de las necesidades de la aplicación, con menores costos y complejidad que la integración de LLM. Si desea las ventajas de una base de conocimiento y de múltiples fuentes de conocimiento sin una orquestación LLM completa, considere la recuperación agentica con el mínimo esfuerzo de razonamiento.
Elija una región: Si usa la recuperación agente, elija una región admitida. Para la búsqueda clásica, elija una región que ofrezca las características y la capacidad que necesita.
Elija un método de ingesta para el contenido enlazado al índice: Si el contenido está en un origen de datos compatible, use el método pull para recuperar y serializar datos en JSON. Si no tiene un origen de datos compatible o si el contenido y el índice deben sincronizarse en tiempo real, el método de inserción es la única opción.
¿Necesita vectores? Los LLMs y los agentes no requieren vectores. Úselos solo si necesita búsqueda de similitud o si tiene contenido que se puede homogeneizar en vectores. Azure AI Search ofrece vectorización integrada para esta tarea.
¿Necesita herencia de permisos basada en usuarios? Remote SharePoint está diseñado para este escenario, pero también puede heredar permisos de usuario asociados al contenido en Azure Blob Storage o ADLS Gen2. Para todos los demás escenarios, puede usar la solución alternativa del filtro de seguridad .
Elección de los recursos de aprendizaje
Mantenemos inicios rápidos que abarcan varios escenarios de búsqueda de un extremo a otro:
- Inicio rápido: Recuperación agentica (portal o mediante programación)
- Inicio rápido: búsqueda de texto completo (portal o mediante programación)
- Inicio rápido: Búsqueda de vectores (portal o mediante programación)
Sugerencia
Para obtener ayuda con soluciones complejas o personalizadas, póngase en contacto con un asociado con una experiencia profunda en Azure AI Search.