O que é o Azure AI Search?

O Azure AI Search (anteriormente conhecido como "Azure Cognitive Search"): fornece recuperação segura de informações em escala sobre conteúdo de propriedade do usuário em aplicativos de pesquisa de IA tradicionais e generativos.

A recuperação de informações é fundamental para qualquer aplicativo que apresente texto e vetores. Os cenários comuns incluem pesquisa de catálogos ou documentos, exploração de dados e, cada vez mais, aplicativos no estilo bate-papo sobre dados de aterramento proprietários. Ao criar um serviço de pesquisa, você trabalha com os seguintes recursos:

Arquitetonicamente, um serviço de pesquisa fica entre os armazenamentos de dados externos que contêm seus dados não indexados e seu aplicativo cliente que envia solicitações de consulta para um índice de pesquisa e lida com a resposta.

Arquitetura do Azure AI Search

Em seu aplicativo cliente, a experiência de pesquisa é definida usando APIs do Azure AI Search e pode incluir ajuste de relevância, classificação semântica, preenchimento automático, correspondência de sinônimos, correspondência difusa, correspondência de padrões, filtro e classificação.

Em toda a plataforma Azure, o Azure AI Search pode integrar-se com outros serviços do Azure na forma de indexadores que automatizam a ingestão/recuperação de dados de fontes de dados do Azure e conjuntos de habilidades que incorporam IA consumível de serviços de IA do Azure, como processamento de imagem e linguagem natural, ou IA personalizada que você cria no Azure Machine Learning ou encapsula dentro do Azure Functions.

Dentro de um serviço de pesquisa

No próprio serviço de pesquisa, as duas principais cargas de trabalho são indexação e consulta.

  • A indexação é um processo de admissão que carrega conteúdo no seu serviço de pesquisa e o torna pesquisável. Internamente, o texto de entrada é processado em tokens e armazenado em índices invertidos, e os vetores de entrada são armazenados em índices vetoriais. O formato de documento que o Azure AI Search pode indexar é JSON. Você pode carregar documentos JSON montados ou usar um indexador para recuperar e serializar seus dados em JSON.

    A IA aplicada através de um conjunto de habilidades estende a indexação com modelos de imagem e linguagem. Se você tiver imagens ou texto não estruturado grande no documento de origem, poderá anexar habilidades que executam OCR, descrevem imagens, inferem estrutura, traduzem texto e muito mais. Você também pode anexar habilidades que executam fragmentação e vetorização de dados.

  • A consulta pode acontecer quando um índice é preenchido com conteúdo pesquisável, quando seu aplicativo cliente envia solicitações de consulta para um serviço de pesquisa e lida com respostas. Toda a execução da consulta é feita sobre um índice de pesquisa que você controla.

    A classificação semântica é uma extensão da execução de consultas. Adiciona compreensão linguística ao processamento de resultados de pesquisa, promovendo os resultados semanticamente mais relevantes para o topo.

O Azure AI Search é adequado para os seguintes cenários de aplicativos:

  • Use-o para pesquisa tradicional de texto completo e pesquisa de semelhança vetorial de próxima geração. Apoie seus aplicativos de IA generativa com recuperação de informações que aproveita a força da pesquisa de palavras-chave e similaridade. Use ambas as modalidades para obter os resultados mais relevantes.

  • Consolide conteúdo heterogêneo em um índice de pesquisa definido e preenchido pelo usuário composto por vetores e texto. Você possui e controla o que é pesquisável.

  • Integre fragmentação e vetorização de dados para aplicativos generativos de IA e RAG.

  • Aplique controle de acesso granular no nível do documento.

  • Descarregue as cargas de trabalho de indexação e consulta para um serviço de pesquisa dedicado.

  • Implemente facilmente recursos relacionados à pesquisa: ajuste de relevância, navegação facetada, filtros (incluindo pesquisa geoespacial), mapeamento de sinônimos e preenchimento automático.

  • Transforme grandes arquivos de texto ou imagem indiferenciados, ou arquivos de aplicativo armazenados no Armazenamento de Blobs do Azure ou no Azure Cosmos DB, em partes pesquisáveis. Isso é alcançado durante a indexação por meio de habilidades cognitivas que adicionam processamento externo da IA do Azure.

  • Adicione análise de texto linguística ou personalizada. Se você tiver conteúdo diferente do inglês, o Azure AI Search oferece suporte aos analisadores Lucene e aos processadores de linguagem natural da Microsoft. Você também pode configurar analisadores para obter processamento especializado de conteúdo bruto, como filtrar diacríticos ou reconhecer e preservar padrões em cadeias de caracteres.

Para obter mais informações sobre funcionalidades específicas, consulte Recursos do Azure AI Search

Como começar

A funcionalidade é exposta por meio do portal do Azure, APIs REST simples ou SDKs do Azure, como o SDK do Azure para .NET. O portal do Azure dá suporte à administração de serviços e gerenciamento de conteúdo, com ferramentas para prototipar e consultar seus índices e conjuntos de habilidades.

Uma exploração completa dos principais recursos de pesquisa pode ser realizada em quatro etapas:

  1. Decida um nível e uma região. É permitido um serviço de pesquisa gratuito por subscrição. Todos os inícios rápidos podem ser concluídos no nível gratuito. Para obter mais capacidade e recursos, você precisará de um nível faturável.

  2. Crie um serviço de pesquisa no portal do Azure.

  3. Comece com o assistente Importar dados. Escolha um exemplo interno ou uma fonte de dados suportada para criar, carregar e consultar um índice em minutos.

  4. Termine com o Search Explorer, usando um cliente de portal para consultar o índice de pesquisa que você acabou de criar.

Como alternativa, você pode criar, carregar e consultar um índice de pesquisa em etapas atômicas:

  1. Crie um índice de pesquisa usando o portal, a API REST, o SDK do .NET ou outro SDK. O esquema de índice define a estrutura do conteúdo pesquisável.

  2. Carregue conteúdo usando o modelo "push" para enviar documentos JSON de qualquer fonte ou use o modelo "pull" (indexadores) se os dados de origem forem de um tipo suportado.

  3. Consulte um índice usando o explorador de pesquisa no portal, API REST, SDK .NET ou outro SDK.

Gorjeta

Para obter ajuda com soluções complexas ou personalizadas, contacte um parceiro com profunda experiência na tecnologia Azure AI Search.

Comparar opções de pesquisa

Os clientes geralmente perguntam como o Azure AI Search se compara a outras soluções relacionadas à pesquisa. A tabela seguinte resume as diferenças principais.

Em comparação com Diferenças principais
Microsoft Search O Microsoft Search destina-se a utilizadores autenticados do Microsoft 365 que necessitam de consultar conteúdo no SharePoint. O Azure AI Search obtém conteúdo no Azure e em qualquer conjunto de dados JSON.
Bing As APIs do Bing consultam os índices em Bing.com para obter termos correspondentes. O Azure AI Search pesquisa em índices preenchidos com o seu conteúdo. Você controla a ingestão de dados e o esquema.
Pesquisa de base de dados O Azure SQL tem pesquisa de texto completo e pesquisa vetorial. O Azure Cosmos DB também tem pesquisa de texto e pesquisa vetorial. A Pesquisa de IA do Azure torna-se uma alternativa atraente quando precisa de funcionalidades como o ajuste de relevância ou conteúdo de fontes heterogéneas. A utilização de recursos é outro ponto de flexão. A indexação e as consultas são intensivas em termos computacionais. O descarregamento da pesquisa do DBMS preserva os recursos do sistema para processamento de transações.
Solução de pesquisa dedicada Supondo que você tenha decidido pela pesquisa dedicada com funcionalidade de espectro completo, uma comparação categórica final é entre as tecnologias de pesquisa. Entre os provedores de nuvem, a Pesquisa de IA do Azure é mais forte para cargas de trabalho vetoriais, de palavras-chave e híbridas em relação ao conteúdo no Azure, para aplicativos que dependem principalmente da pesquisa para recuperação de informações e navegação de conteúdo.

As principais vantagens incluem:

  • Armazene, indexe e pesquise incorporações vetoriais para frases, imagens, gráficos e muito mais.
  • Encontre informações semanticamente semelhantes às consultas de pesquisa, mesmo que os termos de pesquisa não correspondam exatamente.
  • Use a pesquisa híbrida para obter o melhor da pesquisa por palavras-chave e vetores.
  • Ajuste de relevância através de classificação semântica e perfis de pontuação.
  • Integração de dados (rastreadores) na camada de indexação.
  • Integração de IA do Azure para transformações que tornam o conteúdo, o texto e o vetor pesquisáveis.
  • Segurança do Microsoft Entra para conexões confiáveis e Azure Private Link para conexões privadas em cenários sem internet.
  • Experiência de pesquisa completa: Análise linguística e de texto personalizado em 56 idiomas. Faceting, preenchimento automático de consultas e sugestões de resultados e sinónimos.
  • Escala, confiabilidade e alcance global do Azure.