Compartilhar via


Diferenças entre os resultados de pesquisa de Deteção de Dados Eletrónicos estimados e reais

Dica

A Deteção de Dados Eletrónicos (pré-visualização) está agora disponível no novo portal do Microsoft Purview. Para saber mais sobre como utilizar a nova experiência de Deteção de Dados Eletrónicos, veja Saiba mais sobre a Deteção de Dados Eletrónicos (pré-visualização).

Este artigo aplica-se a pesquisas que pode executar com uma das seguintes ferramentas de Deteção de Dados Eletrónicos do Microsoft Purview:

  • Pesquisa de conteúdo
  • Descoberta Eletrônica (Standard)

Quando executa uma pesquisa de Deteção de Dados Eletrónicos, a ferramenta que está a utilizar irá devolver uma estimativa do número de itens (e do respetivo tamanho total) que correspondem aos critérios de pesquisa. Por exemplo, quando executa uma pesquisa no portal de conformidade do Microsoft Purview, os resultados estimados da pesquisa são apresentados na página de lista de opções da pesquisa selecionada.

Estimativa dos resultados apresentados na página de lista de opções de pesquisa.

Esta é a mesma estimativa do tamanho total e do número de itens apresentados na Ferramenta de Exportação de Deteção de Dados Eletrónicos quando exporta os resultados para um computador local e no relatório Resumo da Exportação que é transferido com os resultados da pesquisa.

Resultados estimados na ferramenta de Exportação de Deteção de Dados Eletrónicos

Resultados estimados na ferramenta Exportação de Deteção de Dados Eletrónicos.

Resultados estimados no relatório Resumo da Exportação

Os resultados estimados da pesquisa estão incluídos no relatório Resumo da Exportação.

No entanto, como verá na captura de ecrã anterior do relatório Resumo da Exportação, o tamanho e o número de resultados reais da pesquisa transferidos são diferentes do tamanho e do número de resultados estimados da pesquisa.

Diferença entre os resultados de pesquisa estimados e transferidos.

Eis algumas razões para estas diferenças:

  • A forma como os resultados são estimados. Uma estimativa dos resultados da pesquisa é apenas isso, uma estimativa (e não uma contagem real) dos itens que cumprem os critérios da consulta de pesquisa. Para compilar a estimativa dos itens do Exchange, é pedida uma lista dos IDs de mensagens que cumprem os critérios de pesquisa na base de dados do Exchange pela ferramenta de Deteção de Dados Eletrónicos que está a utilizar. No entanto, quando exporta os resultados da pesquisa, a pesquisa é novamente executada e as mensagens reais são obtidas a partir da base de dados do Exchange. Assim, estas diferenças podem resultar devido à forma como o número estimado de itens e o número real de itens são determinados.

  • Alterações que ocorrem entre o momento em que estima e exporta os resultados da pesquisa. Ao exportar os resultados da pesquisa, a pesquisa é reiniciada para recolher os itens mais recentes no índice de pesquisa que cumprem os critérios de pesquisa. É possível que tenham sido criados, enviados ou recebidos itens adicionais que correspondam aos critérios de pesquisa no tempo entre o momento em que os resultados estimados da pesquisa foram recolhidos e quando os resultados da pesquisa foram exportados. Também é possível que os itens que estavam no índice de pesquisa quando os resultados da pesquisa foram estimados já não estejam lá porque foram removidos da localização do conteúdo antes de os resultados da pesquisa serem exportados. Uma forma de mitigar este problema é especificar um intervalo de datas para uma pesquisa de Deteção de Dados Eletrónicos. Outra forma é colocar uma suspensão nas localizações de conteúdo para que os itens sejam preservados e não possam ser removidos.

    Eis outros problemas que podem resultar em diferenças entre os resultados de pesquisa estimados e exportados:

    • No aumento de itens ao utilizar uma consulta de data. Normalmente, isto é causado pelas duas coisas seguintes:
      • Mantenha o controlo de versões no SharePoint. Se um documento é excluído de um site que está bloqueado e o controle de versão de documentos está habilitado, todas as versões do documento excluído serão preservadas.
      • Itens de calendário. Aceitar e rejeitar mensagens e reuniões periódicas continuarão a criar automaticamente novos itens em segundo plano com datas antigas.
    • Com suspensões, pode haver casos em que o mesmo item é preservado na caixa de correio principal de um utilizador e na respetiva caixa de correio de arquivo. Isto pode acontecer quando um utilizador move manualmente um item para o respetivo arquivo.
    • Embora raro, mesmo no caso de uma suspensão ser aplicada, a manutenção de itens de calendário incorporados (que não são editáveis pelo utilizador, mas estão incluídos em muitos resultados de pesquisa) pode ser removida de vez em quando. Esta remoção periódica de itens de calendário resultará em menos itens que são exportados.
  • Itens não identificados. Os itens não identificados para pesquisa podem causar diferenças entre os resultados de pesquisa estimados e os resultados reais da pesquisa. Pode incluir itens não identificados ao exportar os resultados da pesquisa. Se incluir itens não identificados ao exportar os resultados da pesquisa, poderão existir mais itens que são exportados. Isto causará uma diferença entre os resultados de pesquisa estimados e exportados.

    Ao utilizar a ferramenta de pesquisa conteúdo, tem a opção de incluir itens não identificados ao exportar os resultados da pesquisa. O número de itens não identificados devolvidos pela pesquisa é listado na página de lista de opções juntamente com os outros resultados estimados da pesquisa. Quaisquer itens não identificados também seriam incluídos no tamanho total dos resultados estimados da pesquisa. Ao exportar os resultados da pesquisa, tem a opção de incluir ou não itens não identificados. A forma como configura estas opções pode resultar em diferenças entre os resultados de pesquisa estimados e os resultados reais da pesquisa que são transferidos.

  • Exportar os resultados de uma pesquisa de Conteúdo que inclui todas as localizações de conteúdo. Se a pesquisa a partir da qual está a exportar resultados tiver sido uma pesquisa de todas as localizações de conteúdo na sua organização, apenas serão exportados os itens não identificados de localizações de conteúdo que contenham itens que correspondam aos critérios de pesquisa. In other words, if no search results are found in a mailbox or site, then any unindexed items in that mailbox or site won't be exported. No entanto, os itens não filtrados de todas as localizações de conteúdo (mesmo aqueles que não contêm itens que correspondem à consulta de pesquisa) serão incluídos nos resultados estimados da pesquisa.

    Em alternativa, se a pesquisa a partir da qual está a exportar resultados incluir localizações de conteúdo específicas, os itens não filtrados (que não são excluídos pelos critérios de pesquisa) de todas as localizações de conteúdo especificadas na pesquisa serão exportados. Neste caso, o número estimado de itens nãondexados e o número de itens não exportados devem ser os mesmos.

    O motivo para não exportar itens não identificados de todas as localizações da organização deve-se ao facto de poder aumentar a probabilidade de erros de exportação e aumentar o tempo necessário para exportar e transferir os resultados da pesquisa.

  • Os itens não identificados no SharePoint e no OneDrive não estão incluídos nas estimativas de pesquisa. Os itens não identificados dos sites do SharePoint e das contas do OneDrive para Empresas não estão incluídos nos resultados estimados da pesquisa. Isto deve-se ao facto de o índice do SharePoint não conter dados para itens não identificados. Apenas os itens não identificados das caixas de correio são incluídos nas estimativas de pesquisa. No entanto, se incluir itens não identificados ao exportar os resultados da pesquisa, serão incluídos itens não identificados no SharePoint e no OneDrive, o que aumentará o número de itens que são realmente exportados. Isto resultará em diferenças entre os resultados estimados (que não incluem itens não identificados em sites do SharePoint e do OneDrive) e os itens reais que são transferidos. A regra sobre a exportação de itens não identificados apenas a partir de localizações de conteúdo que contenham itens que correspondam aos critérios de pesquisa ainda se aplica nesta situação.

  • Documente versões no SharePoint e no OneDrive. Ao pesquisar sites do SharePoint e contas do OneDrive, várias versões de um documento não são incluídas na contagem de resultados estimados da pesquisa. No entanto, tem a opção de incluir todas as versões do documento ao exportar os resultados da pesquisa. Se incluir versões de documentos ao exportar os resultados da pesquisa, o número real (e o tamanho total) dos itens exportados será aumentado.

  • Pastas do SharePoint. Se as pastas no SharePoint corresponderem a uma consulta de pesquisa, por exemplo, procurar por data, a estimativa de pesquisa incluirá uma contagem dessas pastas com o último intervalo de datas modificado (mas não os itens nessas pastas). Quando exporta os resultados da pesquisa, os itens na pasta são exportados, mas a pasta real não é exportada. O resultado é que o número de itens exportados será superior ao número de resultados estimados da pesquisa. Se uma pasta estiver vazia, o número de resultados de pesquisa reais exportados será reduzido por um item, porque a pasta real não é exportada.

    Observação

    Ao executar uma pesquisa baseada em consultas, pode excluir pastas do SharePoint ao adicionar a seguinte condição à consulta: NOT(ContentType:folder).

  • Listas do SharePoint. Se o nome de uma lista do SharePoint corresponder a uma consulta de pesquisa, a estimativa de pesquisa incluirá uma contagem de todos os itens na lista. Ao exportar os resultados da pesquisa, a lista (e os itens de lista) é exportada como um único ficheiro CSV. Isto reduzirá o número real de itens realmente exportados. Se a lista contiver anexos, os anexos serão exportados como documentos separados, o que também aumentará o número de itens exportados.

    Observação

    Ao executar uma pesquisa baseada em consultas, pode excluir listas do SharePoint ao adicionar a seguinte condição à consulta: NOT(ContentType:list).

  • Formatos de ficheiro não processados versus formatos de ficheiro exportados. Para itens do Exchange, o tamanho estimado dos resultados da pesquisa é calculado com os tamanhos de mensagens do Exchange não processados. No entanto, as mensagens de e-mail são exportadas num ficheiro PST ou como mensagens individuais (que são formatadas como ficheiros EML). Ambas as opções de exportação utilizam um formato de ficheiro diferente das mensagens não processadas do Exchange, o que faz com que o tamanho total do ficheiro exportado seja diferente do tamanho estimado do ficheiro.

  • Eliminação da duplicação de itens do Exchange durante a exportação. Para itens do Exchange, a eliminação de duplicados reduz o número de itens que são exportados. Tem a opção de anular o duplicado dos resultados da pesquisa ao exportá-los. Para mensagens do Exchange, isto significa que apenas uma única instância de uma mensagem é exportada, mesmo que essa mensagem possa ser encontrada em várias caixas de correio. Os resultados estimados da pesquisa incluem todas as instâncias de uma mensagem. Por isso, se escolher a opção de eliminação de duplicados ao exportar os resultados da pesquisa, o número real de itens exportados poderá ser consideravelmente inferior ao número estimado de itens.

O relatório de resultados da pesquisa (Results.csv ficheiro) contém uma entrada para cada mensagem duplicada e identifica a caixa de correio de origem onde está localizada uma mensagem duplicada. Isto ajuda-o a identificar todas as caixas de correio que contêm uma mensagem duplicada.

Observação

Se não selecionar a opção Incluir itens que estão encriptados ou que têm um formato não reconhecido ao exportar os resultados da pesquisa ou apenas transferir os relatórios, os relatórios de erros de índice são transferidos, mas não têm entradas. Isto não significa que não existam erros de indexação. Significa apenas que os itens não não identificados não foram incluídos na exportação.