Usar um indexador para criar um índice

Concluído

Para que os documentos sejam indexados no armazenamento do Azure, eles precisam ser exportados do tipo de arquivo original para JSON. Para exportar dados em qualquer formato para JSON e carregá-los em um índice, usamos um indexador.

Para criar documentos de pesquisa, você pode gerar documentos JSON com o código do aplicativo ou pode usar o indexador do Azure para exportar documentos recebidos para o JSON.

A Pesquisa de IA do Azure permite criar e carregar documentos JSON em um índice de duas maneiras:

  • Método de push: os dados JSON são enviados por push a um índice de pesquisa por meio da API REST ou do SDK do .NET. O envio de dados por push tem mais flexibilidade, pois não tem nenhuma restrição quanto ao tipo de fonte de dados, à localização nem à frequência de execução.

  • Método de pull: os indexadores do serviço Pesquisa podem efetuar pull de dados de fontes de dados populares do Azure e, se necessário, exportar esses dados para o JSON, se ainda não estiverem nesse formato.

Usar o método de pull para carregar dados com um indexador

O indexador da Pesquisa de IA do Azure é um rastreador que extrai texto pesquisável e metadados de uma fonte de dados externa do Azure e popula um índice de pesquisa usando mapeamentos de campo a campo entre os dados de origem e o índice. O uso do indexador às vezes é chamado de “modelo de pull”, pois o serviço efetua pull dos dados sem precisar escrever um código que adicione dados a um índice. Um indexador mapeia os campos de origem para os campos correspondentes no índice.

Monitoramento e verificação de importação de dados

A página de visão geral de serviços de pesquisa tem um painel que permite que você veja rapidamente a integridade do serviço de pesquisa. No painel, você poderá ver quantos documentos existem no serviço de pesquisa, quantos índices foram usados e a quantidade de armazenamento que está em uso.

Ao carregar novos documentos em um índice, é possível monitorar o progresso clicando no indexador associado do índice. A contagem de documentos se expandirá conforme os documentos forem carregados em um índice. Em alguns casos, a página do portal pode levar alguns minutos para exibir contagens de documentos atualizadas. Quando o índice estiver pronto para consulta, você poderá usar o Gerenciador de pesquisa para verificar os resultados. Um índice estará pronto quando o primeiro documento for carregado com êxito.

Os indexadores somente importam documentos novos ou atualizados, portanto, é normal não ver nenhum documento indexado.

O Gerenciador de pesquisa pode realizar pesquisas rápidas para verificar o conteúdo de um índice e garantir que você esteja obtendo os resultados de pesquisa esperados. Ter essa ferramenta disponível no portal permite que você verifique facilmente o índice, examinando os resultados retornados como documentos JSON.

Fazendo alterações em um índice

Você precisa remover e recriar índices para fazer alterações nas definições de campo. Há suporte para adicionar novos campos, sendo que todos os documentos existentes terão valores nulos. Você verá que é mais rápido usar uma abordagem baseada em código para iterar seus designs, pois trabalhar no portal do exige que o índice seja excluído e recriado e que os detalhes do esquema sejam preenchidos manualmente.

Uma forma de atualizar um índice sem afetar seus usuários é criando um índice com um nome diferente. Você pode usar o mesmo indexador e fonte de dados. Depois de importar dados, você pode mudar seu aplicativo para usar o novo índice.