Limites para pesquisa de conteúdo e descoberta eletrônica (Standard)

Vários limites são aplicados às ferramentas de pesquisa de descoberta eletrônica no portal de conformidade do Microsoft Purview. Isso inclui pesquisas executadas na página Pesquisa de conteúdo e pesquisas associadas a um caso de descoberta eletrônica na página eDiscovery (Standard). Esses limites ajudam a manter a integridade e a qualidade dos serviços prestados às organizações. Há também limites relacionados à indexação de mensagens de email em Exchange Online para pesquisa. Você não pode modificar os limites para pesquisas de descoberta eletrônica ou indexação por email, mas deve estar ciente deles para que você possa levar esses limites em consideração ao planejar, executar e solucionar problemas de pesquisas de descoberta eletrônica.

Para obter limites relacionados à ferramenta Descoberta Eletrônica do Microsoft Purview (Premium), consulte Limites na descoberta eletrônica (Premium)

Dica

Se você não for um cliente E5, use a avaliação de soluções do Microsoft Purview de 90 dias para explorar como recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações portal de conformidade do Microsoft Purview. Saiba mais sobre os termos de inscrição e avaliação.

Limites da pesquisa

A tabela a seguir lista os limites de pesquisa ao usar a ferramenta de pesquisa de conteúdo no portal de conformidade e para pesquisas associadas a um caso Descoberta Eletrônica do Microsoft Purview (Standard).

Descrição do limite Limite
O número máximo de caixas de correio ou sites que podem ser pesquisados em uma única pesquisa Sem limite 1
O número máximo de itens encontrados em todas as caixas de correio de usuário que possivelmente podem ser exibidos na página de visualização ao visualizar os resultados da pesquisa. Os itens mais recentes são exibidos. 1.000 2
O número máximo de caixas de correio de usuário que podem ser visualizadas para os resultados da pesquisa. Se houver mais de 1000 caixas de correio que contenham conteúdo que corresponda à consulta de pesquisa, no máximo, apenas as 1000 principais caixas de correio com mais resultados de pesquisa estarão disponíveis para visualização. 1.000
O número máximo de itens encontrados no SharePoint e OneDrive for Business sites exibidos na página de visualização ao visualizar os resultados da pesquisa. Os itens mais recentes são exibidos. 200
O número máximo de sites (no SharePoint e OneDrive for Business) que podem ser visualizados para obter resultados de pesquisa. Se houver mais de 200 sites totais que contenham conteúdo que corresponda à consulta de pesquisa, apenas os 200 principais sites com mais resultados de pesquisa estarão disponíveis para visualização. 200
O número máximo de itens por caixa de correio de pasta pública que são exibidos na página de visualização ao visualizar os resultados da pesquisa de conteúdo. 100
O número máximo de itens encontrados em todas as caixas de correio de pasta pública exibidas na página de visualização ao visualizar os resultados da pesquisa de conteúdo. 200
O número máximo de caixas de correio de pasta pública que podem ser visualizadas para os resultados da pesquisa. Se houver mais de 500 caixas de correio de pasta pública que contenham conteúdo que corresponda à consulta de pesquisa, apenas as 500 principais caixas de correio de pasta pública com mais resultados de pesquisa estarão disponíveis para visualização. 500
O tamanho máximo de um item que pode ser exibido na página de visualização. 10.000.000 bytes (aproximadamente 9,5 MB)
O número máximo de caracteres para a consulta de pesquisa (incluindo operadores e condições) para uma pesquisa. Caixas de correio: 10.000.

Sites: 4.000 ao pesquisar todos os sites ou 2.000 ao pesquisar até 20 sites. 3

O número máximo de variantes retornadas ao usar um curinga de prefixo para pesquisar uma frase exata em uma consulta de pesquisa ou ao usar um curinga de prefixo e o operador booliano NEAR . 10.000 4
O número mínimo de caracteres alfa para curingas de prefixo; por exemplo, time*, one*ou set*. 3
O número máximo de caixas de correio em uma pesquisa em que você pode excluir itens fazendo uma ação de "pesquisa e limpeza" (usando o comando New-ComplianceSearchAction -Purge ). Se a pesquisa para a qual você está fazendo uma ação de limpeza tiver mais caixas de correio de origem do que esse limite, a ação de limpeza falhará. Para obter mais informações sobre pesquisa e limpeza, consulte Pesquisar e excluir mensagens de email em sua organização. 50.000
O número máximo de locais em uma pesquisa da qual você pode exportar itens. Se a pesquisa que você está exportando tiver mais locais do que esse limite, a exportação falhará. Para obter mais informações, confira Exportar resultados da pesquisa de conteúdo. 100.000

Observação

1 Embora você possa pesquisar um número ilimitado de caixas de correio em uma única pesquisa, você só pode baixar os resultados da pesquisa exportada de um máximo de 100.000 caixas de correio usando a Ferramenta de Exportação de Descoberta Eletrônica no portal de conformidade.

2 A intenção da página de visualização é mostrar uma amostra limitada dos resultados. Mesmo para pesquisas maciças com milhares de resultados, o número de itens mostrados na página de visualização pode, e muitas vezes, ser muito menor do que o valor máximo possível de 1000. Para ver os resultados completos da pesquisa, você precisa exportar os resultados.

3 Ao pesquisar locais do SharePoint e OneDrive for Business, os caracteres nas URLs dos sites que estão sendo pesquisados são contados em relação a esse limite. Esse limite entra em vigor depois que a consulta é expandida e inclui caracteres da consulta palavra-chave, quaisquer filtros de permissões de pesquisa aplicados ao usuário e as URLs de todos os locais do site. Isso significa que a consulta será expandida em relação a cada uma das palavras-chave. Por exemplo, se uma consulta de pesquisa tiver 15 palavras-chave e parâmetros e condições adicionais, a consulta será expandida 15 vezes, cada uma com os outros parâmetros e condições na consulta. Portanto, mesmo que o número de caracteres na consulta de pesquisa possa estar abaixo do limite, é a consulta expandida que pode contribuir para exceder esse limite.

5 Para consultas sem frase (um valor palavra-chave que não usa aspas duplas) usamos um índice de prefixo especial. Isso nos diz que uma palavra ocorre em um documento, mas não onde ela ocorre no documento. Para fazer uma consulta de frase (um valor palavra-chave com aspas duplas), precisamos comparar a posição dentro do documento para as palavras na frase. Isso significa que não podemos usar o índice de prefixo para consultas de frase. Nesse caso, expandimos internamente a consulta com todas as palavras possíveis para as quais o prefixo se expande; por exemplo, "time*" pode expandir para "time OR timer OR times OR timex OR timeboxed OR ...". 10.000 é o número máximo de variantes para as quais a palavra pode ser expandida, não o número de documentos que correspondem à consulta. Não há limite superior para termos que não sejam frases.

Tempos de pesquisa

A Microsoft coleta informações de desempenho para pesquisas executadas por todas as organizações. Embora a complexidade da consulta de pesquisa possa afetar os tempos de pesquisa, o maior fator que afeta o tempo de duração das pesquisas é o número de caixas de correio pesquisadas. Embora a Microsoft não forneça um Contrato de Nível de Serviço para tempos de pesquisa, a tabela a seguir lista os tempos médios de pesquisa para pesquisas de coleção com base no número de caixas de correio incluídas na pesquisa.

Número de caixas de correio Tempo médio de pesquisa
100 30 segundos
1.000 45 segundos
10.000 4 minutos
25.000 10 minutos
50.000 20 minutos
100.000 25 minutos

Limites de exportação

A tabela a seguir lista os limites ao exportar os resultados de uma pesquisa de conteúdo. Esses limites também se aplicam quando você exporta conteúdo de um caso de descoberta eletrônica (Standard).

Descrição do limite Limite
Quantidade máxima de dados exportáveis de uma única pesquisa1 2 TB
No máximo, uma organização pode exportar em um único dia2 2 TB
Número máximo de caixas de correio para resultados de pesquisa que podem ser baixados usando a Ferramenta de Exportação de Descoberta Eletrônica 100.000
Tamanho máximo do arquivo PST que pode ser exportado3 10 GB
Número máximo de exportações ou relatórios exibidos em casos de pesquisa de conteúdo ou descoberta eletrônica 1.000
Taxa na qual os resultados da pesquisa de caixas de correio e sites são carregados em um local de Armazenamento do Azure fornecido pela Microsoft. Máximo de 2 GB por hora

Observação

1 Se os resultados da pesquisa forem maiores que 2 TB, considere usar intervalos de data ou outros tipos de filtros para diminuir o tamanho total dos resultados da pesquisa.

2 Esse limite é redefinido diariamente às 12:00 UTC.

3 Se os resultados da pesquisa da caixa de correio de um usuário forem maiores que 10 GB, os resultados da pesquisa para a caixa de correio serão exportados em dois (ou mais) arquivos PST separados. Se você optar por exportar todos os resultados da pesquisa em um único arquivo PST, o arquivo PST será derramado em arquivos PST adicionais se o tamanho total dos resultados da pesquisa for maior que 10 GB.

Limites de indexação para mensagens de email

A tabela a seguir descreve os limites de indexação que podem resultar em uma mensagem de email sendo retornada como um item não indexado ou um item parcialmente indexado nos resultados de uma pesquisa de conteúdo.

Limite de indexação Observações Descrição
Tamanho máximo do anexo 1 150 MB O tamanho máximo de um anexo de email que será analisado para indexação. Qualquer anexo maior que esse limite não será analisado para indexação e a mensagem com o anexo será marcada como parcialmente indexada.
Número máximo de anexos 250 O número máximo de arquivos anexados a uma mensagem de email que será analisada para indexação. Se uma mensagem tiver mais de 250 anexos, os primeiros 250 anexos serão analisados e indexados, e a mensagem será marcada como parcialmente indexada porque tinha anexos adicionais que não foram analisados.
Profundidade máxima do anexo 30 O número máximo de anexos aninhados analisados. Por exemplo, se uma mensagem de email tiver outra mensagem anexada a ela e a mensagem anexada tiver um documento Word anexado, o documento Word e a mensagem anexada serão indexados. Esse comportamento continuará para até 30 anexos aninhados.
Número máximo de imagens anexadas 0 Uma imagem anexada a uma mensagem de email é ignorada pelo analisador e não é indexada.
Tempo máximo gasto analisando um item 30 segundos Um máximo de 30 segundos é gasto analisando um item para indexação. Se o tempo de análise exceder 30 segundos, o item será marcado como parcialmente indexado.
Saída máxima do analisador 2 milhões de caracteres A quantidade máxima de saída de texto do analisador indexado. Por exemplo, se o analisador extraísse 8 milhões de caracteres de um documento, somente os primeiros 2 milhões de caracteres serão indexados.
Tokens de anotação máximos Dois milhões Quando uma mensagem de email é indexada, cada palavra é anotada com instruções de processamento diferentes que especificam como essa palavra deve ser indexada. Cada conjunto de instruções de processamento é chamado de token de anotação. Para manter a qualidade do serviço no Office 365, há um limite de 2 milhões de tokens de anotação para uma mensagem de email.
Tamanho máximo do corpo no índice 67 milhões de caracteres O número total de caracteres no corpo de uma mensagem de email e todos os seus anexos. Quando uma mensagem de email é indexada, todo o texto no corpo da mensagem e em todos os anexos é concatenado em uma única cadeia de caracteres. O tamanho máximo dessa cadeia de caracteres indexada é de 67 milhões de caracteres.
Tokens exclusivos máximos no corpo 1 milhão Como explicado anteriormente, os tokens são o resultado da extração de texto do conteúdo, da remoção de pontuação e dos espaços e, em seguida, dividi-los em palavras (chamados tokens) armazenadas no índice. Por exemplo, a frase "cat, mouse, bird, dog, dog" contém 5 tokens. Mas apenas 4 deles são tokens exclusivos. Há um limite de 1 milhão de tokens exclusivos por mensagem de email, o que ajuda a impedir que o índice fique muito grande com tokens aleatórios.

Observação

1 Análise é o processo em que o serviço de indexação extrai texto do anexo, remove caracteres desnecessários como pontuação e espaços e divide o texto em palavras (em um processo chamado tokenização), que são armazenados no índice.

Limites de trabalho

Descrição Limite
Número máximo de trabalhos simultâneos em sua organização. 50
Número máximo de trabalhos simultâneos que um único usuário pode iniciar ao mesmo tempo. 25
Número máximo de trabalhos simultâneos em todo o locatário(por exemplo, pesquisas em todo o locatário) em sua organização. 5
Número máximo de trabalhos simultâneos em todo o locatário(por exemplo, pesquisas em todo o locatário) que um único usuário pode iniciar ao mesmo tempo. 5
Número máximo de trabalhos por dia em sua organização. 1 500

Observação

1 Esse limite é redefinido diariamente às 12:00 UTC.

Mais informações

Há limites adicionais relacionados a diferentes aspectos da pesquisa de conteúdo, como indexação de conteúdo. Para obter mais informações sobre esses limites, confira os seguintes artigos:

Para obter informações sobre pesquisas de conteúdo, confira:

Para os limites de caso relacionados à descoberta eletrônica (Standard) e à descoberta eletrônica (Premium), consulte:

Precisa de ajuda com problemas de descoberta eletrônica?

Confira o artigo Resolver problemas comuns de descoberta eletrônica para obter etapas básicas de solução de problemas que você pode tomar para identificar e resolve problemas que você pode encontrar durante uma pesquisa de descoberta eletrônica ou em outro lugar no processo de descoberta eletrônica.