Compartilhar via


Limites para Pesquisa de conteúdos e Deteção de Dados Eletrónicos (Standard)

Dica

A Deteção de Dados Eletrónicos (pré-visualização) está agora disponível no novo portal do Microsoft Purview. Para saber mais sobre como utilizar a nova experiência de Deteção de Dados Eletrónicos, veja Saiba mais sobre a Deteção de Dados Eletrónicos (pré-visualização).

São aplicados vários limites às ferramentas de pesquisa de Deteção de Dados Eletrónicos no portal de conformidade do Microsoft Purview. Isto inclui pesquisas executadas na página Pesquisa de conteúdos e pesquisas associadas a um caso de Deteção de Dados Eletrónicos na página Deteção de Dados Eletrónicos (Standard). Estes limites ajudam a manter o estado de funcionamento e a qualidade dos serviços prestados às organizações. Também existem limites relacionados com a indexação de mensagens de e-mail no Exchange Online para pesquisa. Não pode modificar os limites das pesquisas de Deteção de Dados Eletrónicos ou da indexação de e-mail, mas deve estar ciente dos mesmos para que possa ter estes limites em consideração ao planear, executar e resolver problemas de pesquisas de Deteção de Dados Eletrónicos.

Para obter limites relacionados com a ferramenta Deteção de Dados Eletrónicos (Premium) do Microsoft Purview, veja Limites na Deteção de Dados Eletrónicos (Premium)

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de testes do portal de conformidade do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Limites da pesquisa

A tabela seguinte lista os limites de pesquisa ao utilizar a ferramenta de pesquisa de conteúdos no portal de conformidade e para pesquisas associadas a um caso de Deteção de Dados Eletrónicos (Standard) do Microsoft Purview.

Descrição do limite Limite
O número máximo de caixas de correio ou sites que podem ser pesquisados numa única pesquisa Sem limite 1
O número máximo de itens encontrados em todas as caixas de correio de utilizador que podem ser apresentados na página de pré-visualização ao pré-visualizar os resultados da pesquisa. Os itens mais recentes são apresentados. 1000 2
O número máximo de caixas de correio de utilizador que podem ser pré-visualizadas para os resultados da pesquisa. Se existirem mais de 1000 caixas de correio que contenham conteúdo que corresponda à consulta de pesquisa, no máximo, apenas as 1000 caixas de correio com mais resultados de pesquisa estarão disponíveis para pré-visualização. 1.000
O número máximo de itens encontrados nos sites do SharePoint e do OneDrive para Empresas que são apresentados na página de pré-visualização ao pré-visualizar os resultados da pesquisa. Os itens mais recentes são apresentados. 200
O número máximo de sites (no SharePoint e no OneDrive para Empresas) que podem ser pré-visualizados para os resultados da pesquisa. Se existirem mais de 200 sites totais que contenham conteúdo que corresponda à consulta de pesquisa, apenas os 200 sites com mais resultados de pesquisa estarão disponíveis para pré-visualização. 200
O número máximo de itens por caixa de correio de pasta pública que são apresentados na página de pré-visualização ao pré-visualizar os resultados da pesquisa de conteúdos. 100
O número máximo de itens encontrados em todas as caixas de correio de pastas públicas que são apresentadas na página de pré-visualização ao pré-visualizar os resultados da pesquisa de conteúdos. 200
O número máximo de caixas de correio de pastas públicas que podem ser pré-visualizadas para os resultados da pesquisa. Se existirem mais de 500 caixas de correio de pastas públicas que contenham conteúdo que corresponda à consulta de pesquisa, apenas as 500 caixas de correio da pasta pública com mais resultados de pesquisa estarão disponíveis para pré-visualização. 500
O tamanho máximo de um item que pode ser visualizado na página de pré-visualização. 10 000 000 bytes (aproximadamente 9,5 MB)
O número máximo de carateres para a consulta de pesquisa (incluindo operadores e condições) para uma pesquisa. Caixas de correio: 10 000.

Sites: 4000 ao pesquisar todos os sites ou 2000 ao pesquisar até 20 sites. 3

O número máximo de variantes devolvido ao utilizar um caráter universal de prefixo para procurar uma expressão exata numa consulta de pesquisa ou ao utilizar um caráter universal de prefixo e o operador PRÓXIMO Booleano. 10 000 4
O número mínimo de carateres alfa para carateres universais de prefixo; por exemplo, time*, one*ou set*. 3
O número máximo de caixas de correio numa pesquisa na qual pode eliminar itens ao efetuar uma ação "procurar e remover" (utilizando o comando New-ComplianceSearchAction -Purge ). Se a pesquisa para a qual está a fazer uma ação de remoção tiver mais caixas de correio de origem do que este limite, a ação de remoção falhará. Para obter mais informações sobre a pesquisa e remoção, consulte Procurar e eliminar mensagens de e-mail na sua organização. 50.000
O número máximo de localizações numa pesquisa a partir da qual pode exportar itens. Se a pesquisa que está a exportar tiver mais localizações do que este limite, a exportação falhará. Para obter mais informações, veja Exportar resultados da pesquisa de conteúdos. 100.000

Observação

1 Embora possa procurar um número ilimitado de caixas de correio numa única pesquisa, só pode transferir os resultados de pesquisa exportados a partir de um máximo de 100 000 caixas de correio através da Ferramenta de Exportação de Deteção de Dados Eletrónicos no portal de conformidade.

2 A intenção da página de pré-visualização é mostrar uma amostra limitada dos resultados. Mesmo para pesquisas massivas com milhares de resultados, o número de itens apresentados na página de pré-visualização pode, e muitas vezes, ser muito menor do que o valor máximo possível de 1000. Para ver os resultados completos da pesquisa, tem de exportar os resultados.

3 Ao procurar localizações do SharePoint e do OneDrive para Empresas, os carateres nos URLs dos sites que estão a ser pesquisados são contabilizados em relação a este limite. Este limite entra em vigor após a expansão da consulta e inclui carateres da consulta de palavras-chave, quaisquer filtros de permissões de pesquisa aplicados ao utilizador e os URLs de todas as localizações do site. Isto significa que a consulta será expandida em relação a cada uma das palavras-chave. Por exemplo, se uma consulta de pesquisa tiver 15 palavras-chave e parâmetros e condições adicionais, a consulta é expandida 15 vezes, cada uma com os outros parâmetros e condições na consulta. Por isso, mesmo que o número de carateres na consulta de pesquisa possa estar abaixo do limite, é a consulta expandida que pode contribuir para exceder este limite.

5 Para consultas sem expressão (um valor de palavra-chave que não utiliza aspas duplas), utilizamos um índice de prefixo especial. Isto indica-nos que uma palavra ocorre num documento, mas não onde ocorre no documento. Para fazer uma consulta de expressão (um valor de palavra-chave com aspas duplas), temos de comparar a posição no documento com as palavras na expressão. Isto significa que não podemos utilizar o índice de prefixo para consultas de expressões. Neste caso, expandimos internamente a consulta com todas as palavras possíveis para as quais o prefixo se expande; por exemplo, "time*" pode expandir para "time OR timer OR times OR timex OR timeboxed OR ...". 10 000 é o número máximo de variantes para as quais a palavra pode expandir e não o número de documentos correspondentes à consulta. Não existe um limite superior para termos não expressões.

Tempos de pesquisa

A Microsoft recolhe informações de desempenho para pesquisas executadas por todas as organizações. Embora a complexidade da consulta de pesquisa possa afetar os tempos de pesquisa, o maior fator que afeta o tempo de duração das pesquisas é o número de caixas de correio pesquisadas. Embora a Microsoft não forneça um Contrato de Nível de Serviço para tempos de pesquisa, a tabela seguinte lista os tempos médios de pesquisa das pesquisas de coleção com base no número de caixas de correio incluídas na pesquisa.

Número de caixas de correio Tempo médio de pesquisa
100 30 segundos
1.000 45 segundos
10.000 4 minutos
25.000 10 minutos
50.000 20 minutos
100.000 25 minutos

Limites de exportação

A tabela seguinte lista os limites ao exportar os resultados de uma pesquisa de conteúdos. Estes limites também se aplicam quando exporta conteúdo de um caso de Deteção de Dados Eletrónicos (Standard).

Descrição do limite Limite
Quantidade máxima de dados exportáveis de uma única pesquisa1 2 TB
Máximo que uma organização pode exportar num único dia2 2 TB
Número máximo de caixas de correio para resultados de pesquisa que podem ser transferidos com a Ferramenta de Exportação de Deteção de Dados Eletrónicos 100.000
Tamanho máximo do ficheiro PST que pode ser exportado3 10 GB
Número máximo de exportações ou relatórios apresentados em casos de Pesquisa de Conteúdo ou Deteção de Dados Eletrónicos 1.000
Taxa a que os resultados da pesquisa de caixas de correio e sites são carregados para uma localização de Armazenamento do Azure fornecida pela Microsoft. Máximo de 2 GB por hora

Observação

1 Se os resultados da pesquisa forem superiores a 2 TB, considere utilizar intervalos de datas ou outros tipos de filtros para diminuir o tamanho total dos resultados da pesquisa.

2 Este limite é reposto diariamente às 00:00 UTC.

3 Se os resultados da pesquisa da caixa de correio de um utilizador forem superiores a 10 GB, os resultados da pesquisa da caixa de correio serão exportados em dois (ou mais) ficheiros PST separados. Se optar por exportar todos os resultados de pesquisa num único ficheiro PST, o ficheiro PST será derramado em ficheiros PST adicionais se o tamanho total dos resultados da pesquisa for superior a 10 GB.

Limites de indexação para mensagens de e-mail

A tabela seguinte descreve os limites de indexação que podem resultar na devolução de uma mensagem de e-mail como um item não indexado ou um item parcialmente indexado nos resultados de uma pesquisa de conteúdos.

Limite de indexação Observações Descrição
Tamanho máximo do anexo 1 150 MB O tamanho máximo de um anexo de e-mail que irá analisar a indexação. Qualquer anexo que seja superior a este limite não será analisado para indexação e a mensagem com o anexo será marcada como parcialmente indexada.
Número máximo de anexos 250 O número máximo de ficheiros anexados a uma mensagem de e-mail que será analisado para indexação. Se uma mensagem tiver mais de 250 anexos, os primeiros 250 anexos são analisados e indexados e a mensagem é marcada como parcialmente indexada porque tinha anexos adicionais que não foram analisados.
Profundidade máxima do anexo 30 O número máximo de anexos aninhados analisados. Por exemplo, se uma mensagem de e-mail tiver outra mensagem anexada à mesma e a mensagem anexada tiver um documento do Word anexado, o documento do Word e a mensagem anexada serão indexados. Este comportamento continuará até 30 anexos aninhados.
Número máximo de imagens anexadas 0 Uma imagem anexada a uma mensagem de e-mail é ignorada pelo analisador e não é indexada.
Tempo máximo despendido a analisar um item 30 segundos É despendido um máximo de 30 segundos a analisar um item para indexação. Se o tempo de análise exceder os 30 segundos, o item será marcado como parcialmente indexado.
Saída máxima do analisador 2 milhões de caracteres A quantidade máxima de saída de texto do analisador indexado. Por exemplo, se o analisador tiver extraído 8 milhões de carateres de um documento, apenas os primeiros 2 milhões de carateres serão indexados.
Tokens de anotação máximos Dois milhões Quando uma mensagem de e-mail é indexada, cada palavra é anotada com instruções de processamento diferentes que especificam como essa palavra deve ser indexada. Cada conjunto de instruções de processamento é denominado token de anotação. Para manter a qualidade do serviço no Office 365, existe um limite de 2 milhões de tokens de anotação para uma mensagem de e-mail.
Tamanho máximo do corpo no índice 67 milhões de carateres O número total de carateres no corpo de uma mensagem de e-mail e todos os respetivos anexos. Quando uma mensagem de e-mail é indexada, todo o texto no corpo da mensagem e em todos os anexos é concatenado numa única cadeia. O tamanho máximo desta cadeia indexada é de 67 milhões de carateres.
Máximo de tokens exclusivos no corpo 1 milhão Conforme explicado anteriormente, os tokens são o resultado da extração de texto do conteúdo, da remoção da pontuação e dos espaços e, em seguida, da divisão em palavras (denominadas tokens) armazenadas no índice. Por exemplo, a expressão "cat, mouse, bird, dog, dog" contém 5 tokens. No entanto, apenas 4 destes tokens são exclusivos. Existe um limite de 1 milhão de tokens exclusivos por mensagem de e-mail, o que ajuda a impedir que o índice seja demasiado grande com tokens aleatórios.

Observação

1 Analisar é o processo em que o serviço de indexação extrai texto do anexo, remove carateres desnecessários como pontuação e espaços e, em seguida, divide o texto em palavras (num processo chamado tokenização), que são depois armazenadas no índice.

Limites de tarefas

Descrição Limite
Número máximo de tarefas simultâneas na sua organização. 50
Número máximo de tarefas simultâneas que um único utilizador pode iniciar ao mesmo tempo. 25
Número máximo de tarefas simultâneas ao nível do inquilino (por exemplo, pesquisas ao nível do inquilino) na sua organização. 5
Número máximo de tarefas simultâneas ao nível do inquilino (por exemplo, pesquisas ao nível do inquilino) que um único utilizador pode iniciar de uma só vez. 5
Número máximo de tarefas por dia na sua organização. 1 500

Observação

1 Este limite é reposto diariamente às 00:00 UTC.

Mais informações

Existem limites adicionais relacionados com diferentes aspetos da pesquisa de conteúdo, como a indexação de conteúdos. Para obter mais informações sobre estes limites, consulte os seguintes artigos:

Para obter informações sobre pesquisas de conteúdos, consulte:

Para obter os limites de casos relacionados com a Deteção de Dados Eletrónicos (Standard) e a Deteção de Dados Eletrónicos (Premium), veja:

Precisa de ajuda com problemas de Deteção de Dados Eletrónicos?

Consulte o artigo Resolver problemas comuns de Deteção de Dados Eletrónicos para obter os passos básicos de resolução de problemas que pode seguir para identificar e resolver problemas que possa encontrar durante uma pesquisa de Deteção de Dados Eletrónicos ou em qualquer outro local no processo de Deteção de Dados Eletrónicos.