Estatísticas e relatórios de coleção em Descoberta Eletrônica do Microsoft Purview (Premium)

Depois de criar uma estimativa de coleção, você pode exibir estatísticas sobre os itens recuperados, como os locais de conteúdo que contêm a maioria dos itens que corresponderam aos critérios de pesquisa e ao número de itens retornados pela consulta de pesquisa. Você também pode visualizar um subconjunto dos resultados.

Quando você identificou o conjunto de documentos que deseja examinar, você pode adicionar os resultados da pesquisa a um conjunto de revisão para coletar e processar.

Dica

Se você não for um cliente E5, use a avaliação de soluções do Microsoft Purview de 90 dias para explorar como recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações portal de conformidade do Microsoft Purview. Saiba mais sobre os termos de inscrição e avaliação.

Pesquisar estatísticas para estimativas de coleção

Esta seção descreve as estatísticas disponíveis para estimativas de coleção. Essas estatísticas estão disponíveis na guia Estatísticas de pesquisa na página de sobrevoo de uma estimativa de coleção.

Estimativas de coleção

Esta seção exibe um resumo gráfico dos itens estimados retornados pela coleção. Isso indica o número de itens que correspondem aos critérios de pesquisa da coleção. Essas informações dão uma ideia sobre o número estimado de itens retornados pela coleção.

  • Itens estimados por locais: o número total de itens estimados retornados pela coleção. O número específico de itens localizados em caixas de correio e localizados em sites também é exibido.
  • Locais estimados com hits: o número total de locais de conteúdo que contêm itens retornados pela coleção. O número específico de caixas de correio e locais de site também é exibido.
  • Volume de dados por local (em MB): o tamanho total de todos os itens estimados retornados pela coleção. O tamanho específico dos itens de caixa de correio e itens de site também é exibido.

Seção estimativas de coleção para uma estimativa de coleção.

Relatório de condição

Esta seção exibe estatísticas sobre a consulta de pesquisa de coleção e o número de itens estimados que corresponderam a diferentes partes da consulta de pesquisa. Você pode usar essas estatísticas para analisar o número de itens que correspondem a cada componente da consulta de pesquisa. Isso pode ajudá-lo a refinar os critérios de pesquisa da coleção e, se necessário, restringir o escopo da coleção.

  • Tipo de local: o tipo de local de conteúdo ao qual as estatísticas de consulta são aplicáveis. O valor do Exchange indica um local de caixa de correio; um valor do SharePoint indica um local de site.
  • Parte: a parte da consulta de pesquisa à qual as estatísticas são aplicáveis. Primário indica toda a consulta de pesquisa. Palavra-chave indica que as estatísticas na linha são para uma palavra-chave específica. Se você usar uma lista de palavra-chave quando for para a consulta de pesquisa na coleção, as estatísticas de cada componente da consulta serão incluídas nesta tabela.
  • Condição: o componente real (palavra-chave ou condição) da consulta de pesquisa que foi executada para a estimativa de coleção que retornou as estatísticas exibidas na linha correspondente.
  • Locais com hits: o número dos locais de conteúdo (especificados pela coluna Tipo de localização) que contêm itens que correspondem à consulta primária ou palavra-chave listada na coluna Condição.
  • Itens: o número de itens (do local de conteúdo especificado) que correspondem à consulta listada na coluna Condição . Como explicado anteriormente, se um item contiver várias instâncias de um palavra-chave que está sendo pesquisado, ele só será contado uma vez nesta coluna.
  • Tamanho (MB): o tamanho total de todos os itens encontrados (no local de conteúdo especificado) que correspondem à consulta de pesquisa na coluna Condição .

Seção relatório de condição para uma estimativa de coleção.

Locais principais

Esta seção exibe estatísticas sobre os locais de conteúdo específicos com a maioria dos itens retornados pela coleção.

  • Local: o nome do local (o endereço de email das caixas de correio e a URL para sites).
  • Tipo de local: uma caixa de correio terá um tipo exchange e sites do SharePoint terão um tipo do SharePoint .
  • Itens: número estimado de itens no local de conteúdo retornado pela coleção.
  • Tamanho: o tamanho total dos itens estimados em cada local de conteúdo.

Seção Locais superiores para uma estimativa de coleção.

Estatísticas e relatórios para coleções comprometidas

Esta seção descreve as estatísticas que estão disponíveis depois que você confirma uma coleção em um conjunto de revisão, incluindo o número real de itens adicionados ao conjunto de revisão. Essas estatísticas (além de informações de conjunto de carga) fornecem informações históricas sobre o conteúdo adicionado a um caso.

Depois de confirmar uma coleção em um conjunto de revisão, as guias a seguir são exibidas na página de sobrevoo da conexão confirmada. Cada uma dessas guias contém diferentes tipos de informações sobre a coleção.

Guias na página de sobrevoo da coleção comprometida.

Guia resumo para coleções

A guia Resumo de coleções confirmadas contém várias seções que fornecem informações sobre os itens de coleção, estimativas de itens e locais, indexação, tipos de arquivo e muito mais.

Visão geral da coleção (versão prévia)

A seção Visão geral da coleção na guia Resumo de um conjunto de revisão comprometida contém informações sobre como os itens foram encontrados, recuperados e processados como parte da coleção. As informações nesta seção são um resumo das informações coletadas e exibidas durante a estimativa inicial da coleção e incluem informações coletadas e processadas durante o committal de coleção para o conjunto de revisão. Você pode usar as informações nesta seção para ajudar a melhorar a compreensão sobre como os dados de coleta final evoluem dos dados de estimativa durante o committal e o processamento da coleção.

Essas informações são segmentadas e exibidas nas seguintes sub-seções:

  • Locais com hits: esta seção resume o número de locais pesquisados e o número de locais com acertos com base nas condições definidas na estimativa de coleção. Ele também exibe o número e o tipo de locais pesquisados.

    Locais com hits.

  • Estimativas de pré-coleção: esta seção resume o número de itens e o tamanho do total de itens calculados para a estimativa de coleção (antes da confirmação da coleção). Uma contagem de todos os itens que foram parcialmente indexados também é exibida.

    Estimativas de pré-coleta.

  • Itens de coleção: esta seção exibe o tipo, a contagem e a descrição de todos os itens recuperados de locais com hits durante o committal da coleção para o conjunto de revisão. Durante esse processo, pode haver alguma adição e consolidação de itens durante o processamento. Adições e consolidações podem incluir tipos incluídos na tabela a seguir:

    Tipo de item Descrição do tipo de item
    Itens com hits Número estimado de itens encontrados pela pesquisa.
    Revisar duplicatas de conjunto Itens que já estão no mesmo conjunto de revisão não são coletados.
    Pesquisar duplicatas As instâncias duplicadas dos mesmos itens não são coletadas.
    Todas as versões Todas as versões de itens no SharePoint são coletadas.
    Versões históricas As versões históricas mantidas pelo SharePoint são coletadas.
    Anexos de nuvem Os anexos de nuvem são identificados e coletados de links do SharePoint.
    Versão como compartilhada As versões compartilhadas dos itens são coletadas além de suas versões mais recentes.
    Conversas contextuais do Teams Mensagens de chat adicionais que podem ser relevantes são coletadas.
    Transcrições de chat consolidadas As mensagens de chat coletadas são consolidadas em menos transcrições HTML.
    Exceções de recuperação Tempo limite de acesso, arquivos vazios e outras exceções.
    Total de itens coletados Número total de itens coletados de vários locais.
  • Processamento para revisar o conjunto: esta seção exibe o tipo, a contagem e a descrição dos itens adicionados ao conjunto de revisão da estimativa de coleção. Os itens são descompactados, verificados para texto, reindexados e processados em preparação para a revisão.

    Processamento para revisão definido.

Conteúdo da coleção

A seção Conteúdo da Coleção na guia Resumo de um conjunto de revisão comprometido contém estatísticas e outras informações sobre os itens coletados das fontes de dados da coleção e adicionados ao conjunto de revisão.

  • Total de itens extraídos. O número total de itens adicionados ao conjunto de revisão. Esse número indica a soma de itens pai e itens filho adicionados ao conjunto de revisão.

    Dica

    Passe o cursor sobre as barras de item pai ou filho para exibir o número total de itens pai ou filho.

  • Itens pai. O número de itens retornados pela coleção usada para coletar os itens que foram adicionados ao conjunto de revisão. Esse número corresponde a (e é igual a) o número estimado de itens exibidos na seção Parâmetros de Coleção . O número de itens pai que ele coleta informações que foram usadas para coletar os itens que foram adicionados ao conjunto de revisão.

    Um item pai pode conter vários itens filho. Por exemplo, uma mensagem de email é um item pai se contiver um arquivo anexado ou tiver um anexo de nuvem. Nesse caso, o arquivo anexado ou o arquivo de destino do anexo de nuvem é considerado um item filho. Quando você confirma uma coleção, os itens pai e quaisquer itens filho correspondentes (como arquivos anexados e anexos de nuvem) são adicionados ao conjunto de revisão como itens ou arquivos individuais.

  • Itens filho. O número de itens filho adicionados ao conjunto de revisão. Somente itens filho que são anexos de arquivo e anexos de nuvem são adicionados ao conjunto de revisão como arquivos individuais. Outros tipos de itens filho, como assinaturas de email e imagens, são extraídos de um item pai e processados pelo OCR (Reconhecimento óptico de Caracteres) para extrair qualquer texto do item filho. O texto extraído desses tipos de itens filho é adicionado ao item pai para que você possa exibi-lo no conjunto de revisão. Ao não adicionar itens filho ao conjunto de revisão como um arquivo separado, a descoberta eletrônica (Premium) ajuda a simplificar o processo de revisão limitando o número de itens potencialmente imateriais no conjunto de revisão.

  • Itens exclusivos. O número de itens exclusivos adicionados ao conjunto de revisão. Itens exclusivos são exclusivos do conjunto de revisão. Todos os itens são exclusivos quando a primeira coleção é adicionada a um novo conjunto de revisão porque não havia itens anteriores no conjunto de revisão.

  • Itens duplicados identificados. O número de itens da coleção que não foram adicionados ao conjunto de revisão porque o mesmo item já existe no conjunto de revisão. Estatísticas sobre itens duplicados podem ajudar a explicar as diferenças entre o número de itens estimados de uma estimativa de coleção e o número real de itens adicionados ao conjunto de revisão.

Indexação

A seção Indexação na guia Resumo de um conjunto de revisão comprometido contém informações de indexação sobre os itens adicionados ao conjunto de revisão.

  • Novos itens indexados. O número de itens que foram recentemente indexados antes de serem adicionados ao conjunto de revisão. Exemplos de um item recém-indexado são itens filho extraídos de um item pai e indexados antes de serem adicionados ao conjunto de revisão. Além disso, itens que não estão localizados em fontes de dados de custódia e locais de conteúdo não custodiados listados na guia Fontes de dados no caso são indexados antes de serem adicionados à revisão. Por exemplo, itens recém-indexados incluiriam itens coletados de locais adicionais.

  • Itens indexados atualizados. O número de itens parcialmente indexados que foram indexados com êxito e adicionados ao conjunto de revisão. Essa estatística indica os itens parcialmente indexados dos locais de conteúdo custodiado e não custodiado Guia Fontes de dados que foram indexadas com êxito quando a coleção foi comprometida com o conjunto de revisão.

  • Erros de indexação. O número de itens parcialmente indexados que não podiam ser indexados antes de serem adicionados ao conjunto de revisão. Esses itens podem exigir correção de erro.

Tipos de arquivo de coleção

A seção Tipos de arquivo de coleção na guia Resumo de um conjunto de revisão comprometido exibe a contagem de itens para cada tipo de arquivo incluído na coleção. Os tipos de arquivo incluem email, imagem, documento, áudio, tipos de arquivo de vídeo e muito mais. Para obter uma lista completa dos tipos de arquivo com suporte, consulte Tipos de arquivo com suporte na descoberta eletrônica (Premium).

Erros

A seção Erros na guia Resumo de um conjunto de revisão comprometido exibe o tipo e o número de erros encontrados durante o committal de coleção. Erros podem incluir arquivos com tamanho zero, arquivos protegidos, arquivos malformados, erros internos e muito mais. Um relatório de erro no formato .csv pode ser baixado selecionando Baixar o relatório de erros nesta seção.

Parâmetros de coleção

A seção Parâmetros de coleção na guia Resumo de um conjunto de revisão comprometido exibe as informações de coleção usadas para coletar os itens adicionados ao conjunto de revisão. Esta guia exibe informações semelhantes às informações na guia Estatísticas de pesquisa . Esta seção fornece uma captura rápida da consulta de pesquisa usada pela coleção, os locais de conteúdo que foram pesquisados e os resultados estimados da coleção. Como explicado anteriormente, o número de itens estimados nesta seção seria igual ao número de itens pai mostrados na seção Conteúdo da Coleção .

Guia Fontes de dados para coleções

A guia Fontes de dados contém informações sobre fontes de dados de custódia e não custódia. A seção Fontes de dados de custódia exibe todas as fontes de dados de custódia para cada custodiante incluído na coleção. A seção Fontes de dados não custodiais exibe todas as fontes de dados não custodiadas para a coleção. As informações da fonte de dados exibidas também estão disponíveis na guia main Fontes de dados para cada caso.

Guia estatísticas de pesquisa para coleções

As estatísticas exibidas na guia Estatísticas de pesquisa são as mesmas estatísticas da última vez que uma estimativa de coleção foi executada. Isso inclui estimativas de coleção, relatório de condição e locais superiores. Essas informações são preservadas da estimativa de coleção para referência histórica e podem ser comparadas à coleção real comprometida com o conjunto de revisão.

Diferenças entre estimativas de coleção e a coleção confirmada real

Quando você executa uma estimativa de coleção, uma estimativa do número de itens (e seu tamanho total) que atendem aos critérios de coleção é exibida na guia Resumo e na seção Estimativas de coleção da guia Estatísticas de pesquisa . Depois de confirmar uma estimativa de coleção em um conjunto de revisão, o número real de itens (e seu tamanho total) adicionados, o conjunto de revisão geralmente é diferente das estimativas. Na maioria dos casos, mais itens são adicionados ao conjunto de revisão do que foram estimados na estimativa de coleção. A lista a seguir descreve os motivos mais comuns para essas diferenças e dicas para identificá-las:

  • Itens filho. Itens filho (como anexos de arquivos e anexos de nuvem) que são extraídos de seus itens pai e adicionados como arquivos individuais. O número de itens filho pode aumentar o número de itens adicionados ao conjunto de revisão. Em geral, o número de itens pai identificados na seção Conteúdo da Coleção na guia Resumo de uma coleção confirmada deve ser igual ao número de itens estimados da estimativa de coleção.

  • Itens duplicados. Itens da estimativa de coleção que já foram adicionados ao conjunto de revisão em uma coleção anterior não serão adicionados. Conforme explicado anteriormente, o número de itens duplicados na coleção é exibido na seção Conteúdo da Coleção na guia Resumo .

  • Opções de configuração de coleção. Quando você confirma uma estimativa de coleção em um conjunto de revisão, você precisa ter a opção de incluir threads de conversa, anexos de nuvem e versões de documento. Qualquer um desses itens adicionados ao conjunto de revisão não está incluído nas estimativas da estimativa de coleção. Eles são identificados e coletados somente quando você confirma a coleção. A seleção dessas opções provavelmente aumentará o número de itens adicionados ao conjunto de revisão.

    Por exemplo, várias versões de documentos do SharePoint não estão incluídas na estimativa para a estimativa de coleção. Mas se você selecionar a opção de incluir todas as versões do documento ao confirmar uma estimativa de coleção, o número real (e o tamanho total) dos itens adicionados ao conjunto de revisão aumentará.

    Para obter mais informações sobre essas opções, consulte Confirmar uma estimativa de coleção em um conjunto de revisão.

Aqui estão outras razões pelas quais os resultados estimados de uma estimativa de coleção podem ser diferentes dos resultados reais confirmados.

  • A forma como os resultados são estimados para estimativas de coleção. Uma estimativa dos resultados da pesquisa retornados por uma estimativa de coleção é exatamente isso, uma estimativa (e não uma contagem real) dos itens que atendem aos critérios de consulta de coleção. Para compilar a estimativa de itens de email, uma lista das IDs de mensagem que atendem aos critérios de pesquisa é solicitada do banco de dados do Exchange. Mas quando você confirma a coleção em um conjunto de revisão, a coleção é executada novamente e as mensagens reais são recuperadas do banco de dados do Exchange. Portanto, as diferenças podem resultar devido à forma como o número estimado de itens e o número real de itens são determinados.

  • Alterações que ocorrem entre o tempo em que estimam e emitem estimativas de coleção. Quando você confirma uma estimativa de coleção em um conjunto de revisão, a pesquisa é executada novamente para coletar os itens mais recentes no índice de pesquisa que atendem aos critérios de pesquisa. É possível que itens adicionais tenham sido criados, enviados ou excluídos que atendam aos critérios de pesquisa no tempo entre quando a estimativa de coleção foi executada pela última vez e quando a estimativa de coleção está comprometida com um conjunto de revisão. Também é possível que os itens que estavam no índice de pesquisa quando os resultados da estimativa de coleta foram estimados não estejam mais lá porque foram removidos de uma fonte de dados antes de cometer a coleção. Uma maneira de atenuar esse problema é especificar um intervalo de datas para uma coleção. Outra maneira é colocar um porão em locais de conteúdo para que os itens sejam preservados e não possam ser limpos.

  • Itens não especificados. Se a estimativa de coleção incluísse pesquisar todas as caixas de correio do Exchange ou todos os sites do SharePoint, somente itens não especificados de locais de conteúdo que contenham itens que correspondam aos critérios de coleção serão adicionados ao conjunto de revisão. Em outras palavras, se nenhum resultado for encontrado em uma caixa de correio ou site, todos os itens não discriminados nessa caixa de correio ou site não serão adicionados ao conjunto de revisão. No entanto, itens não discriminados de todos os locais de conteúdo (mesmo aqueles que não contêm itens que correspondem à consulta de coleção) serão incluídos nos resultados estimados da coleção.

  • Itens parcialmente indexados: a seleção dessa opção adiciona itens parcialmente indexados de fontes de dados adicionais ao conjunto de revisão. Se a coleção pesquisasse fontes de dados adicionais (conforme especificado na página Locais adicionais no assistente de coleções), poderá haver itens parcialmente indexados desses locais que você deseja adicionar ao conjunto de revisão. As fontes de dados custodiais e não custodiais normalmente não têm itens parcialmente indexados. Isso ocorre porque o processo avançado de indexação reexe itens quando fontes de dados custodiais e não custodiais são adicionadas a um caso. Além disso, a adição de itens parcialmente indexados aumentará o número de itens adicionados ao conjunto de revisão.

    Depois que itens parcialmente indexados forem adicionados ao conjunto de revisão, você poderá aplicar um filtro para exibir especificamente esses itens. Para obter mais informações, confira Exemplo de cenário: filtrar itens parcialmente indexados

    Como alternativa, se a estimativa de coleção incluísse locais de conteúdo específicos (o que significa que caixas de correio ou sites específicos em que especificados na página Locais adicionais no assistente de estimativa de coleção), os itens não discriminados (que não são excluídos pelos critérios de coleção) dos locais de conteúdo especificados na pesquisa serão exportados. Nesse caso, o número estimado de itens não discriminados e o número de itens não discriminados adicionados ao conjunto de revisão devem ser os mesmos.