Escolher um armazenamento de dados de pesquisa no Azure

Este artigo compara as opções de tecnologia para armazenamentos de dados de pesquisa no Azure. Um armazenamento de dados de pesquisa é usado para criar e armazenar índices especializados para realizar pesquisas em texto de forma livre. O texto indexado pode residir em um armazenamento de dados separado, como armazenamento de blob. Um aplicativo envia uma consulta para o armazenamento de dados de pesquisa e o resultado é uma lista de documentos correspondentes. Para obter mais informações sobre esse cenário, consulte Processando texto de forma livre para pesquisa.

Quais são as suas opções ao escolher um armazenamento de dados de pesquisa?

No Azure, todos os armazenamentos de dados a seguir atenderão aos requisitos principais de pesquisa em dados de texto de forma livre fornecendo um índice de pesquisa:

Principais critérios de seleção

Para cenários de pesquisa, comece a escolher o armazenamento de dados de pesquisa apropriado para suas necessidades respondendo a estas perguntas:

  • Você quer um serviço gerenciado em vez de gerenciar seus próprios servidores?

  • Você pode especificar seu esquema de índice em tempo de design? Caso contrário, escolha uma opção que ofereça suporte a esquemas atualizáveis.

  • Você precisa de um índice apenas para pesquisa de texto completo ou também precisa de agregação rápida de dados numéricos e outras análises? Se você precisar de funcionalidades além da pesquisa de texto completo, considere opções que ofereçam suporte a análises adicionais.

  • Você precisa de um índice de pesquisa para análise de log, com suporte para coleta, agregação e visualizações de logs em dados indexados? Em caso afirmativo, considere o Elasticsearch, que faz parte de uma pilha de análise de log.

  • Você precisa indexar dados em formatos de documento comuns, como PDF, Word, PowerPoint e Excel? Em caso afirmativo, escolha uma opção que forneça indexadores de documentos.

  • A sua base de dados tem necessidades de segurança específicas? Em caso afirmativo, considere os elementos de segurança listados abaixo.

Matriz de capacidades

As tabelas a seguir resumem as principais diferenças nos recursos.

Capacidades gerais

Funcionalidade Cognitive Search Elasticsearch Base de Dados SQL
É serviço gerenciado Sim No Sim
API REST Sim Sim No
Programabilidade .NET, Java, Python, JavaScript Java T-SQL
Indexadores de documentos para tipos de arquivo comuns (PDF, DOCX, TXT e assim por diante) Sim No Não

Recursos de capacidade de gerenciamento

Funcionalidade Cognitive Search Elasticsearch Base de Dados SQL
Esquema atualizável Sim Sim Sim
Suporta dimensionamento Sim Sim No

Recursos de carga de trabalho analítica

Funcionalidade Cognitive Search Elasticsearch Base de Dados SQL
Suporta análises além da pesquisa de texto completo Não Sim Sim
Parte de uma pilha de análise de log Não Sim (ELK) Não
Suporta pesquisa semântica Sim (apenas para encontrar documentos semelhantes) Sim Sim

Funcionalidades de segurança

Funcionalidade Cognitive Search Elasticsearch Base de Dados SQL
Segurança ao nível da linha Parcial (requer consulta de aplicativo para filtrar por ID de grupo) Parcial (requer consulta de aplicativo para filtrar por ID de grupo) Sim
Encriptação de Dados Transparente No Não Sim
Restringir o acesso a endereços IP específicos Sim Sim Sim
Restringir o acesso para permitir apenas o acesso à rede virtual Sim Sim Sim
Autenticação do Ative Directory (autenticação integrada) No Não Sim

Contribuidores

Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.

Autor principal:

Próximos passos