Carregar dados em um índice de pesquisa no Azure AI Search

Este artigo explica como importar, atualizar e gerenciar conteúdo em um índice de pesquisa predefinido. Na Pesquisa de IA do Azure, um índice de pesquisa é criado primeiro, com a importação de dados logo em seguida como a segunda etapa. A exceção é o assistente de Importação de Dados e os pipelines do indexador, que criam e carregam um índice em um fluxo de trabalho.

Um serviço de pesquisa importa e indexa texto e vetores em JSON, usados em cenários completos de pesquisa de texto, busca em vetores, pesquisa híbrida e mineração de conhecimento. O conteúdo de texto é obtido de campos alfanuméricos na fonte de dados externa, de metadados úteis em cenários de pesquisa ou de conteúdo enriquecido criado por um conjunto de habilidades (as habilidades podem extrair ou inferir descrições textuais de imagens e conteúdo não estruturado). O conteúdo do vetor é vetorizado com um modelo de inserção externo ou uma vetorização integrada (versão prévia).

Depois que os dados são indexados, as estruturas de dados físicas do índice são bloqueadas. Para obter diretrizes sobre o que pode e o que não pode ser alterado, confira Remover e recriar um índice.

A indexação não é um processo em segundo plano. Um serviço de pesquisa equilibra a indexação e as cargas de trabalho de consulta, mas quando a latência de consulta for muito alta, você poderá adicionar capacidade ou identificar períodos de baixa atividade de consulta para carregar um índice.

Carregue os documentos

Um serviço de pesquisa aceita documentos JSON que estão em conformidade com o esquema de índice.

Você pode preparar esses documentos por conta própria, mas quando o conteúdo reside em uma fonte de dados com suporte, a execução de um indexador ou do assistente Importar Dados pode automatizar a recuperação de documentos, a serialização JSON e a indexação.

No portal do Azure, use os assistentes de Importação de Dados para criar e carregar índices em um fluxo de trabalho contínuo. Caso deseje carregar um índice existente, escolha uma abordagem alternativa.

  1. Entre no portal do Azure com sua conta do Azure.

  2. Encontre o serviço de pesquisa e, na página Visão geral, selecione Importar dados ou Importar e vetorizar dados na barra de comandos para criar e preencher um índice de pesquisa. Acesse estes links para analisar o fluxo de trabalho: Início Rápido: Criar um índice da Pesquisa de IA do Azure e Início Rápido: Vetorização integrada (versão prévia).

    Captura de tela do comando Importar dados

Se os indexadores já estiverem definidos, redefina e execute um indexador no portal do Azure, o que será útil se você estiver adicionando campos de maneira incremental. A redefinição força o indexador a reiniciar, obtendo todos os campos nos documentos de origem.

Excluir documentos órfãos

O Azure AI Search dá suporte a operações de nível de documento para que você possa pesquisar, atualizar e excluir um documento específico isoladamente. O exemplo a seguir mostra como excluir um documento. Em um serviço de pesquisa, os documentos não estão relacionados, portanto, a exclusão de um deles não afeta o restante do índice.

  1. Identifique qual campo é a chave do documento. No portal, você pode ver os campos de cada índice. Chaves de documento são campos de cadeia de caracteres e apresentam um ícone de chave para facilitar a identificação.

  2. Verifique os valores do campo de chave do documento: search=*&$select=HotelId. Uma cadeia de caracteres simples é básica, mas se o índice usar um campo codificado em base 64 ou se os documentos de pesquisa forem gerados por uma configuração parsingMode, você poderá estar trabalhando com valores com os quais não está familiarizado.

  3. Procure o documento para verificar o valor da ID do documento e para examinar o conteúdo antes de excluí-lo. Especifique a chave ou a ID do documento na solicitação. Os exemplos a seguir ilustram uma cadeia de caracteres simples para o índice de exemplo Hotels e uma cadeia de caracteres codificada em base 64 para a chave metadata_storage_path do índice cog-search-demo index.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Exclua o documento para removê-lo do índice de pesquisa.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Confira também