Identificar elementos de uma solução de pesquisa

Concluído

Infographic of indexing process.

Uma solução típica da Pesquisa de IA do Azure começa com uma fonte de dados que contém os artefatos de dados que você deseja pesquisar. Isso pode ser uma hierarquia de pastas e arquivos no Armazenamento do Azure ou texto em um banco de dados, como o Banco de Dados SQL do Azure ou o Azure Cosmos DB. O formato de dados compatível com a Pesquisa de IA do Azure é JSON. Seja qual for a fonte dos dados, se você puder fornecê-los como um documento JSON, o mecanismo de pesquisa poderá indexá-los.

Se os dados residirem em uma fonte de dados com suporte, você poderá usar um indexador para automatizar a ingestão de dados, incluindo a serialização de JSON de dados de origem em formatos nativos. Um indexador se conecta a uma fonte de dados, serializa os dados e envia-os ao mecanismo de pesquisa para indexação. A maioria dos indexadores dá suporte à detecção de alterações, fazendo com que a atualização de dados seja um exercício mais simples.

Além de automatizar a ingestão de dados, os indexadores também dão suporte ao enriquecimento de IA. Você pode anexar um conjunto de habilidades que aplique uma sequência de habilidades de IA para enriquecer os dados, tornando-os mais pesquisáveis. Um conjunto abrangente de habilidades integradas, com base nas APIs de serviços de IA do Azure, pode ajudá-lo a derivar novos campos – por exemplo, reconhecendo entidades no texto, traduzindo texto, avaliando sentimento ou prevendo legendas apropriadas para imagens. Opcionalmente, o conteúdo enriquecido pode ser enviado a um repositório de conhecimento, que armazena a saída de um pipeline de enriquecimento de IA em tabelas e blobs no Armazenamento do Azure para análise independente ou processamento downstream.

Quando você escreve um código do aplicativo que envia dados por push a um índice ou usa um indexador que automatiza a ingestão de dados e adiciona o enriquecimento de IA, os campos que contêm o conteúdo persistem em um índice, que pode ser pesquisado por aplicativos cliente. Os campos são usados para pesquisa, filtragem e classificação, com o objetivo de gerar um conjunto de resultados que possa ser exibido ou, de outro modo, usado pelo aplicativo cliente.