Diferenças entre os resultados estimados e reais da pesquisa de descoberta eletrônica

Este artigo se aplica a pesquisas que você pode executar usando uma das seguintes ferramentas de Descoberta Eletrônica do Microsoft Purview:

  • Pesquisa de conteúdo
  • Descoberta Eletrônica (Standard)

Ao executar uma pesquisa de descoberta eletrônica, a ferramenta que você está usando retornará uma estimativa do número de itens (e do tamanho total) que correspondem aos critérios de pesquisa. Por exemplo, quando você executa uma pesquisa no portal de conformidade do Microsoft Purview, os resultados estimados da pesquisa são exibidos na página de sobrevoo para a pesquisa selecionada.

Estimativa dos resultados exibidos na página de sobrevoo de pesquisa.

Essa é a mesma estimativa do tamanho total e do número de itens exibidos na Ferramenta de Exportação de Descoberta Eletrônica ao exportar resultados para um computador local e no relatório Resumo de Exportação baixado com os resultados da pesquisa.

Resultados estimados na ferramenta exportação de descoberta eletrônica

Resultados estimados na ferramenta exportação de descoberta eletrônica.

Resultados estimados no relatório Resumo de Exportação

Os resultados estimados da pesquisa estão incluídos no relatório Resumo de Exportação.

No entanto, como você observará na captura de tela anterior do relatório Resumo de Exportação, o tamanho e o número de resultados reais da pesquisa baixados são diferentes do tamanho e do número de resultados estimados da pesquisa.

Diferença entre os resultados estimados e baixados da pesquisa.

Aqui estão algumas razões para essas diferenças:

  • A forma como os resultados são estimados. Uma estimativa dos resultados da pesquisa é exatamente isso, uma estimativa (e não uma contagem real) dos itens que atendem aos critérios de consulta de pesquisa. Para compilar a estimativa de itens do Exchange, uma lista das IDs de mensagem que atendem aos critérios de pesquisa é solicitada do banco de dados do Exchange pela ferramenta de descoberta eletrônica que você está usando. Mas quando você exporta os resultados da pesquisa, a pesquisa é executada novamente e as mensagens reais são recuperadas do banco de dados do Exchange. Portanto, essas diferenças podem resultar devido à forma como o número estimado de itens e o número real de itens são determinados.

  • Alterações que ocorrem entre o tempo em que estimam e exportam resultados da pesquisa. Quando você exporta os resultados da pesquisa, a pesquisa é reiniciada para coletar os itens mais recentes no índice de pesquisa que atendem aos critérios de pesquisa. É possível que haja itens adicionais criados, enviados ou recebidos que atendam aos critérios de pesquisa no tempo entre quando os resultados estimados da pesquisa foram coletados e quando os resultados da pesquisa foram exportados. Também é possível que os itens que estavam no índice de pesquisa quando os resultados da pesquisa foram estimados não estejam mais lá porque foram removidos do local de conteúdo antes que os resultados da pesquisa sejam exportados. Uma maneira de atenuar esse problema é especificar um intervalo de datas para uma pesquisa de descoberta eletrônica. Outra maneira é colocar um porão em locais de conteúdo para que os itens sejam preservados e não possam ser limpos.

    Aqui estão outros problemas que podem resultar em diferenças entre os resultados estimados e exportados da pesquisa:

    • Em aumento de itens ao usar uma consulta de data. Normalmente, isso é causado pelas duas coisas a seguir:
      • Mantenha a versão no SharePoint. Se um documento é excluído de um site que está bloqueado e o controle de versão de documentos está habilitado, todas as versões do documento excluído serão preservadas.
      • Itens de calendário. Aceitar e rejeitar mensagens e reuniões recorrentes continuarão automaticamente criando novos itens em segundo plano com datas antigas.
    • Com os porões, pode haver casos em que o mesmo item é preservado na caixa de correio primária de um usuário e em sua caixa de correio de arquivo. Isso pode acontecer quando um usuário move manualmente um item para o arquivo.
    • Embora raro, mesmo quando uma retenção é aplicada, a manutenção de itens de calendário internos (que não são editáveis pelo usuário, mas são incluídos em muitos resultados de pesquisa) pode ser removida de tempos em tempos. Essa remoção periódica de itens de calendário resultará em menos itens exportados.
  • Itens não especificados. Itens que não estão desndexados para pesquisa podem causar diferenças entre os resultados estimados e reais da pesquisa. Você pode incluir itens não discriminados ao exportar os resultados da pesquisa. Se você incluir itens não discriminados ao exportar resultados da pesquisa, poderá haver mais itens exportados. Isso causará uma diferença entre os resultados estimados e exportados da pesquisa.

    Ao usar a ferramenta de pesquisa de conteúdo, você tem a opção de incluir itens não desdados ao exportar resultados da pesquisa. O número de itens não desdescompactados retornados pela pesquisa está listado na página de sobrevoo junto com os outros resultados estimados da pesquisa. Todos os itens não especificados também seriam incluídos no tamanho total dos resultados estimados da pesquisa. Ao exportar os resultados da pesquisa, você tem a opção de incluir ou não itens não desdesndexados. A forma como você configura essas opções pode resultar em diferenças entre os resultados estimados e os resultados reais da pesquisa baixados.

  • Exportando os resultados de uma pesquisa de conteúdo que inclui todos os locais de conteúdo. Se a pesquisa da qual você está exportando resultados for uma pesquisa de todos os locais de conteúdo em sua organização, somente os itens não discriminados de locais de conteúdo que contêm itens que correspondem aos critérios de pesquisa serão exportados. In other words, if no search results are found in a mailbox or site, then any unindexed items in that mailbox or site won't be exported. No entanto, itens não discriminados de todos os locais de conteúdo (mesmo aqueles que não contêm itens que correspondem à consulta de pesquisa) serão incluídos nos resultados estimados da pesquisa.

    Como alternativa, se a pesquisa de que você está exportando resultados de locais de conteúdo específicos incluídos, os itens não desdados (que não são excluídos pelos critérios de pesquisa) de todos os locais de conteúdo especificados na pesquisa serão exportados. Nesse caso, o número estimado de itens não desdesdados e o número de itens não discriminados exportados devem ser os mesmos.

    O motivo para não exportar itens não discriminados de todos os locais da organização é porque pode aumentar a probabilidade de erros de exportação e aumentar o tempo necessário para exportar e baixar os resultados da pesquisa.

  • Itens não especificados no SharePoint e no OneDrive não incluídos nas estimativas de pesquisa. Itens não especificados de sites do SharePoint e contas de OneDrive for Business não estão incluídos nos resultados estimados da pesquisa. Isso ocorre porque o índice do SharePoint não contém dados para itens não desdexados. Somente itens não especificados de caixas de correio são incluídos nas estimativas de pesquisa. No entanto, se você incluir itens não discriminados ao exportar resultados de pesquisa, itens não discriminados no SharePoint e no OneDrive serão incluídos, o que aumentará o número de itens que são realmente exportados. Isso resultará em diferenças entre os resultados estimados (que não incluem itens não discriminados em sites do SharePoint e do OneDrive) e os itens reais que são baixados. A regra sobre a exportação de itens não discriminados somente de locais de conteúdo que contenham itens que correspondam aos critérios de pesquisa ainda se aplica nessa situação.

  • Versões do documento no SharePoint e no OneDrive. Ao pesquisar sites do SharePoint e contas do OneDrive, várias versões de um documento não são incluídas na contagem de resultados estimados da pesquisa. Mas você tem a opção de incluir todas as versões do documento ao exportar os resultados da pesquisa. Se você incluir versões de documento ao exportar resultados da pesquisa, o número real (e o tamanho total) dos itens exportados será aumentado.

  • Pastas do SharePoint. Se as pastas no SharePoint corresponderem a uma consulta de pesquisa, por exemplo, pesquisando por data, a estimativa de pesquisa incluirá uma contagem dessas pastas com o último intervalo de datas modificado (mas não os itens nessas pastas). Quando você exporta os resultados da pesquisa, os itens na pasta são exportados, mas a pasta real não é exportada. O resultado é que o número de itens exportados será maior do que o número de resultados estimados da pesquisa. Se uma pasta estiver vazia, o número de resultados reais de pesquisa exportados será reduzido por um item, pois a pasta real não é exportada.

    Observação

    Ao executar uma pesquisa baseada em consulta, você pode excluir pastas do SharePoint adicionando a seguinte condição à consulta: NOT(ContentType:folder).

  • Listas do SharePoint. Se o nome de uma lista do SharePoint corresponder a uma consulta de pesquisa, a estimativa de pesquisa incluirá uma contagem de todos os itens da lista. Quando você exporta os resultados da pesquisa, a lista (e os itens de lista) é exportada como um único arquivo CSV. Isso reduzirá o número real de itens realmente exportados. Se a lista contiver anexos, os anexos serão exportados como documentos separados, o que também aumentará o número de itens exportados.

    Observação

    Ao executar uma pesquisa baseada em consulta, você pode excluir listas do SharePoint adicionando a seguinte condição à consulta: NOT(ContentType:list).

  • Formatos de arquivo bruto versus formatos de arquivo exportados. Para itens do Exchange, o tamanho estimado dos resultados da pesquisa é calculado usando os tamanhos brutos da mensagem do Exchange. No entanto, as mensagens de email são exportadas em um arquivo PST ou como mensagens individuais (que são formatadas como arquivos EML). Ambas as opções de exportação usam um formato de arquivo diferente das mensagens brutas do Exchange, o que resulta no tamanho total do arquivo exportado ser diferente do tamanho estimado do arquivo.

  • Eliminação da duplicação de itens do Exchange durante a exportação. Para itens do Exchange, a eliminação de duplicação reduz o número de itens exportados. Você tem a opção de desativar os resultados da pesquisa ao exportá-los. Para mensagens do Exchange, isso significa que apenas uma única instância de uma mensagem é exportada, embora essa mensagem possa ser encontrada em várias caixas de correio. Os resultados estimados da pesquisa incluem cada instância de uma mensagem. Portanto, se você escolher a opção de eliminação de duplicação ao exportar resultados de pesquisa, o número real de itens exportados poderá ser consideravelmente menor do que o número estimado de itens.

O relatório de resultados da pesquisa (Results.csv arquivo) contém uma entrada para cada mensagem duplicada e identifica a caixa de correio de origem em que uma mensagem duplicada está localizada. Isso ajuda você a identificar todas as caixas de correio que contêm uma mensagem duplicada.

Observação

Se você não selecionar os itens Include criptografados ou tiver uma opção de formato não reconhecido ao exportar resultados de pesquisa ou apenas baixar os relatórios, os relatórios de erro de índice serão baixados, mas não têm entradas. Isso não significa que não haja erros de indexação. Isso significa apenas que itens não desdesdados não foram incluídos na exportação.