Compartilhar via


Recursos da IA do Azure Search

A Pesquisa de IA do Azure fornece recuperação de informações e usa a integração opcional de IA para extrair mais valor de conteúdos de texto e estrutura.

A tabela a seguir resume os recursos por categoria. Para obter mais informações sobre como a IA do Azure Search se compara com outras tecnologias de pesquisa, consulte Comparar opções de pesquisa.

Há paridade de recursos em todas as nuvens públicas, privadas e soberanas do Azure, mas alguns recursos não têm suporte em regiões específicas. Para obter mais informações, veja Escolha uma região.

Observação

Procurando por versões prévias dos recursos? Consulte a lista de recursos de visualização.

Recursos de indexação

Categoria Recursos
Fontes de dados Os índices de pesquisa aceitam dados de qualquer fonte, desde que os dados sejam enviados como um documento JSON.

Os indexadores são um recurso que automatiza a importação de dados de fontes de dados compatíveis para extrair conteúdo pesquisável em armazenamentos de dados primários. Os indexadores lidam com a serialização JSON para você e a maioria dá suporte a alguma forma de detecção de alteração e exclusão. Você pode se conectar a diversas fontes de dados, incluindo o OneLake, o Banco de Dados SQL do Azure, o Azure Cosmos DB ou o Armazenamento de blobs do Azure.
Estruturas de dados hierárquicas e aninhadas Os tipos complexos e as coleções permitem que você modele praticamente qualquer tipo de estrutura JSON como um índice de pesquisa. A cardinalidade um-para-muitos e muitos-para-muitos pode ser expressa de maneira nativa por meio de coleções, tipos complexos e coleções de tipos complexos.
Análise linguística Os analisadores são componentes usados para processamento de texto durante as operações de indexação e de pesquisa. Por padrão, pode ser usado o analisador Lucene Padrão de uso geral ou o padrão pode ser substituído por um analisador de linguagem, um analisador personalizado configurado ou outro analisador predefinido que produz tokens no formato necessário.

Os analisadores de idioma do Lucene ou da Microsoft são usados para tratar com inteligência a linguística específica a um idioma, incluindo tempos verbais, gênero, substantivos plurais irregulares (por exemplo, “mouse” vs. “mice”), decomposição de palavras, separação de palavras (para idiomas sem espaços), entre outros.

Os analisadores léxicos personalizados são usados para formulários de pesquisa complexos como a correspondência fonética e as expressões regulares.

Categoria Recursos
Indexação de vetor Em um índice de pesquisa, adicione campos de vetor para dar suporte aos cenários de pesquisa de vetor. Os campos de vetor podem coexistir com os campos não vetoriais no mesmo documento de pesquisa.
Consultas de vetor Formular consultas de vetor único e múltiplo.
Algoritmos de pesquisa de vetor Use HNSW (Hierarchical Navigable Small World) ou K-Nearest Neighbors (KNN) exaustivo para encontrar vetores semelhantes em um índice de pesquisa.
Filtros de vetor Aplicar filtros antes ou depois da execução da consulta para maior precisão durante a recuperação de informações.
Recuperação de informações híbridas Pesquise conceitos e palavras-chave em uma única solicitação de consulta híbrida.

A Pesquisa híbrida consolida a pesquisa de vetor e texto com classificação semântica opcional e ajuste de relevância para obter melhores resultados.
Agrupamento e vetorização de dados integrados Agrupamento de dados nativos por meio da habilidade de Divisão de Texto. Vetorização nativa por meio de vetorizadores e habilidades de inserção, como AzureOpenAIEmbeddingModel, a Visão de IA do Azure multimodal e a habilidade do AML que você pode usar para se conectar a pontos de extremidade no catálogo de modelos do Estúdio de IA do Azure.

Vetorização integrada fornece um pipeline de indexação de ponta a ponta de arquivos de origem para consultas.
Compressão vetorial e compartimentalização integradas Use a compartimentalização escalar interna e binária para reduzir o tamanho do índice vetorial na memória e no disco. Também é possível renunciar ao armazenamento de vetores desnecessários ou atribuir tipos de dados restritos a campos de vetores para reduzir os requisitos de armazenamento.

IA aplicada e mineração de conhecimento

Categoria Recursos
Processamento de IA durante a indexação Enriquecimento de IA se refere à imagem inserida e ao processamento de linguagem natural em um pipeline do indexador que extrai texto e informações do conteúdo que não poderiam ser indexados para pesquisa de texto completo de outra forma. O processamento de IA é realizado por meio da adição e da combinação de habilidades em um conjunto de habilidades, que depois é anexado a um indexador. A IA pode ser habilidades internas da Microsoft, como tradução de texto ou OCR (reconhecimento óptico de caracteres) ou habilidades personalizadas fornecidas por você.
Armazenar conteúdo aprimorado para análise e consumo em cenários que não são de pesquisa O repositório de conhecimento é um armazenamento persistente de conteúdo enriquecido, destinado a cenários que não são de pesquisa, como mineração de conhecimento e processamento de ciência de dados. Um repositório de conhecimento é definido em um conjunto de habilidades, mas é criado no Armazenamento do Azure como objetos ou conjuntos de linhas tabulares.
Enriquecimentos armazenados em cache Cache de enriquecimento (versão prévia) se refere a enriquecimentos armazenados em cache que podem ser reutilizados durante a execução do conjunto de habilidades. O cache é importante principalmente em conjuntos de habilidades que incluem OCR e análise de imagem, cujo processamento é de alto custo.

Texto completo e outros formulários de consulta

Categoria Recursos
Pesquisa de texto de forma livre A pesquisa de texto completo é um caso de uso primário para a maioria dos aplicativos baseados em pesquisa. As consultas podem ser formuladas usando uma sintaxe com suporte.

A sintaxe de consulta simples oferece operadores lógicos, operadores de pesquisa de frase, operadores de sufixo e operadores de precedência.

A sintaxe de consulta completa do Lucene inclui todas as operações em sintaxe simples, com extensões para pesquisa difusa, pesquisa por proximidade, aumento de termo e expressões regulares.
Relevância A Pontuação simples é o principal benefício da IA do Azure Search. Os perfis de pontuação são usados para modelar a relevância como uma função de valores nos próprios documentos. Por exemplo, talvez você queira que produtos mais recentes ou com desconto apareçam primeiro nos resultados da pesquisa. Você também pode criar perfis de pontuação usando marcas de pontuação personalizadas com base nas preferências de pesquisa do cliente que você controlou e armazenou separadamente.

O classificador semântico é um recurso Premium que reclassifica os resultados com base na relevância semântica para a consulta. Dependendo do seu conteúdo e cenário, ele pode aprimorar significativamente a relevância da pesquisa com o mínimo de configuração ou esforço.
Pesquisa geoespacial As funções geoespaciais filtram e correspondem a coordenadas geográficas. Você pode corresponder à distância ou por inclusão em uma forma de polígono.
Filtros e facetas A navegação facetada é habilitada por meio de um único parâmetro de consulta. A IA do Azure Search retorna uma estrutura de navegação mista que você pode usar como o código por trás de uma lista de categorias para a filtragem autodirigida (por exemplo, para filtrar os itens do catálogo por faixa de preços ou marca).

Os filtros podem ser usados para incorporar a navegação facetada na interface do usuário do aplicativo, melhorar a formulação da consulta e filtrar com base em critérios especificados pelo usuário ou pelo desenvolvedor. Crie filtros usando a sintaxe OData.
Experiência do usuário O preenchimento automático pode ser habilitado para consultas de digitação antecipada em uma barra de pesquisa.

Sugestões de pesquisa também funciona em entradas de texto parcial em uma barra de pesquisa, mas os resultados são documentos reais em seu índice em vez de termos de consulta.

Sinônimos associa termos equivalentes que expandem implicitamente o escopo de uma consulta, sem que o usuário tenha de fornecer os termos alternativos.

O realce de ocorrência aplica uma formatação de texto a uma palavra-chave correspondente nos resultados da pesquisa. Você pode escolher quais campos retornam os snippets de código destacados.

A classificação é oferecida em vários campos por meio do esquema de índice e, então, alternada no momento da consulta com um único parâmetro de pesquisa.

A Paginação e limitação dos resultados da pesquisa são simples com o controle bem ajustado que a IA do Azure Search oferece sobre os resultados da pesquisa.

Recursos de segurança

Categoria Recursos
Criptografia de dados A criptografia em repouso gerenciada pela Microsoft está incorporada à camada de armazenamento interno e é irrevogável.

As chaves de criptografia gerenciadas pelo cliente criadas e gerenciadas no Azure Key Vault podem ser usadas para criptografia complementar de índices e mapas de sinônimos. Para serviços criados após 1º de agosto de 2020, a criptografia CMK se estende aos dados em discos temporários, para criptografia dupla completa de conteúdo indexado.
Proteção do ponto de extremidade As regras de IP para suporte ao firewall de entrada permitem configurar intervalos de IP nos quais o serviço de pesquisa vai aceitar solicitações.

Crie um ponto de extremidade privado usando o Link Privado do Azure forçar todas as solicitações por meio de uma rede virtual.
Acesso de entrada O controle de acesso baseado na função atribui funções a usuários e grupos no Microsoft Entra ID para acesso controlado ao conteúdo e operações de pesquisa. Você também poderá usar a autenticação baseada em chave se não quiser usar atribuições de função.
Segurança de saída (indexadores) O acesso a dados por meio de pontos de extremidade privados permite que um indexador se conecte aos recursos do Azure protegidos por meio do Link Privado do Azure.

O acesso a dados usando uma identidade confiável significa que as cadeias de conexão para fontes de dados externas podem omitir nomes de usuário e senhas. Quando um indexador se conectar à fonte de dados, o recurso permitirá a conexão se o serviço de pesquisa tiver sido registrado como um serviço confiável.

Recursos do portal

Categoria Recursos
Ferramentas para criação de protótipos e inspeção Adicionar índice é um designer de índice no portal que você pode usar para criar um esquema básico que consiste em campos atribuídos e algumas outras configurações. Depois de salvar o índice, você pode preenchê-lo usando um SDK ou a API REST para fornecer os dados.

O assistente de importação de dados cria índices, indexadores, conjuntos de habilidades e definições de fonte de dados. Se os dados existem no Azure, esse assistente pode poupar tempo e esforço significativos, especialmente para investigação e exploração de prova de conceito.

A tarefa Importar e vetorizar dados cria um pipeline de indexação completo que inclui divisão de dados e vetorização. O assistente cria todos os objetos e definições de configuração.

O gerenciador de pesquisa é usado para testar consultas e refinar perfis de pontuação.

Criar aplicativo de demonstração é usado para gerar uma página HTML que pode ser usada para testar a experiência de pesquisa.

Depurar Sessões é um editor visual que permite depurar um conjunto de habilidades interativamente. Ele mostra as dependências, a saída e as transformações.
Monitoramento e diagnóstico Habilite recursos de monitoramento para ir além de métricas rápidas que estão sempre visíveis no portal. As métricas nas consultas por segundo, latência e limitação são capturadas e informadas nas páginas do portal sem nenhuma configuração adicional necessária.

Programação

Categoria Recursos
REST A API REST de Serviço destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.

A API REST de Gerenciamento destina-se à criação do serviço e à limpeza por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade.
SDK do Azure para .NET A Azure.Search.Documents destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.

A Microsoft.Azure.Management.Search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade.
SDK do Azure para Java A com.azure.search.documents destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.

com.microsoft.azure.management.search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade.
SDK do Azure para Python A azure-search-documents destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.

A azure-mgmt-search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade.
SDK do Azure para JavaScript/TypeScript A azure/search-documents destina-se às operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de clientes para recuperar informações e estatísticas do sistema.

A azure/arm-search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade.

Confira também