Ограничения для поиска контента и обнаружения электронных данных (стандартный)

К средствам поиска eDiscovery в Портал соответствия требованиям Microsoft Purview применяются различные ограничения. Сюда входят поисковые запросы, выполняемые на странице поиска контента, и поиски, связанные с делом обнаружения электронных данных на странице обнаружения электронных данных (стандартный). Эти ограничения помогают поддерживать работоспособность и качество услуг, предоставляемых организациям. Существуют также ограничения, связанные с индексированием сообщений электронной почты в Exchange Online для поиска. Вы не можете изменить ограничения для поиска по обнаружению электронных данных или индексирования электронной почты, но вы должны знать о них, чтобы вы могли учитывать эти ограничения при планировании, запуске и устранении неполадок поиска eDiscovery.

Ограничения, связанные с инструментом Microsoft Purview eDiscovery (Premium), см. в разделе Ограничения в обнаружении электронных данных (премиум)

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Ограничения поиска

В следующей таблице перечислены ограничения поиска при использовании средства поиска контента на портале соответствия требованиям и для поиска, связанного с Microsoft Purview eDiscovery (стандартный) делом.

Описание ограничения Ограничение
Максимальное количество почтовых ящиков или сайтов, по которым можно искать в одном поиске Без ограничения 1
Максимальное количество элементов, найденных во всех почтовых ящиках пользователей, которые могут отображаться на странице предварительного просмотра при просмотре результатов поиска. Отображаются самые новые элементы. 1000 2
Максимальное количество почтовых ящиков пользователей, для которых возможен предварительный просмотр результатов поиска. Если существует более 1000 почтовых ящиков, содержащих содержимое, соответствующее поисковому запросу, то для предварительной версии будут доступны только первые 1000 почтовых ящиков с наибольшим числом результатов поиска. 1,000
Максимальное количество элементов, найденных в SharePoint и OneDrive для бизнеса сайтов, отображаемых на странице предварительного просмотра при просмотре результатов поиска. Отображаются самые новые элементы. 200
Максимальное количество сайтов (в SharePoint и OneDrive для бизнеса), которые можно просмотреть для результатов поиска. Если имеется более 200 сайтов, содержащих содержимое, соответствующее поисковому запросу, для предварительной версии будут доступны только 200 сайтов с наибольшим числом результатов поиска. 200
Максимальное количество элементов в почтовом ящике общедоступных папок, отображаемых на странице предварительного просмотра при предварительном просмотре результатов поиска контента. 100
Максимальное количество элементов, найденных во всех почтовых ящиках общедоступных папок, которые отображаются на странице предварительного просмотра при предварительном просмотре результатов поиска контента. 200
Максимальное количество почтовых ящиков общедоступных папок, которые можно просмотреть для результатов поиска. Если существует более 500 почтовых ящиков общедоступных папок, содержащих содержимое, соответствующее поисковому запросу, для предварительной версии будут доступны только 500 почтовых ящиков общедоступных папок с наибольшим числом результатов поиска. 500
Максимальный размер элемента, который можно просмотреть на странице предварительного просмотра. 10 000 000 байт (приблизительно 9,5 МБ)
Максимальное количество символов поискового запроса (включая операторы и условия) для поиска. Почтовые ящики: 10 000.

Сайты: 4000 при поиске на всех сайтах или 2000 при поиске до 20 сайтов. 3

Максимальное количество вариантов, возвращаемое при использовании подстановочного знака префикса для поиска точной фразы в поисковом запросе или при использовании подстановочного знака префикса и логического оператора NEAR . 10 000 4
Минимальное количество альфа-символов для подстановочных знаков префикса; например, time*, one*или set*. 3
Максимальное количество почтовых ящиков в поиске, в которых можно удалить элементы, выполнив действие "поиск и очистка" (с помощью команды New-ComplianceSearchAction -Purge ). Если в поиске, для которого выполняется действие очистки, больше исходных почтовых ящиков, чем это ограничение, действие очистки завершится ошибкой. Дополнительные сведения о поиске и очистке см. в статье Поиск и удаление сообщений электронной почты в организации. 50 000
Максимальное количество расположений в поиске, из которых можно экспортировать элементы. Если в экспортируемом поиске больше расположений, чем это ограничение, экспорт завершится ошибкой. Дополнительные сведения см. в разделе Экспорт результатов поиска контента. 100,000

Примечание.

1 Хотя вы можете выполнять поиск неограниченного количества почтовых ящиков в одном поиске, вы можете скачать экспортированные результаты поиска только из 100 000 почтовых ящиков с помощью средства экспорта обнаружения электронных данных на портале соответствия требованиям.

2 Целью страницы предварительного просмотра является отображение ограниченной выборки результатов. Даже для массовых поисковых запросов с тысячами результатов количество элементов, отображаемых на странице предварительного просмотра, может, а часто и будет гораздо меньше максимального возможного значения в 1000. Чтобы просмотреть полные результаты поиска, необходимо экспортировать результаты.

3 При поиске в SharePoint и OneDrive для бизнеса расположений символы в URL-адресах сайтов, в которых выполняется поиск, учитываются в этом пределе. Это ограничение вступает в силу после расширения запроса и включает символы из ключевое слово запроса, все фильтры разрешений для поиска, примененные к пользователю, и URL-адреса всех расположений сайта. Это означает, что запрос будет развернут по каждому из ключевых слов. Например, если поисковый запрос содержит 15 ключевых слов и дополнительных параметров и условий, запрос расширяется 15 раз, каждый из которых содержит другие параметры и условия в запросе. Таким образом, несмотря на то, что количество символов в поисковом запросе может быть ниже ограничения, именно расширенный запрос может способствовать превышению этого ограничения.

5 Для запросов без фраз (значение ключевое слово, не использующее двойные кавычки) мы используем специальный индекс префикса. Это говорит нам о том, что слово встречается в документе, но не там, где оно встречается в документе. Чтобы выполнить запрос фразы (значение ключевое слово с двойными кавычками), необходимо сравнить позицию в документе для слов во фразе. Это означает, что индекс префикса нельзя использовать для запросов фраз. В этом случае мы внутренне расширяем запрос всеми возможными словами, к которым добавляется префикс. Например, "time*" может развернуться до "time OR timer OR times OR timex OR timeboxed OR ...". Максимальное число вариантов, которые можно добавить — 10 000, а не число документов, соответствующих запросов. Верхний предел для терминов, не относящихся к фразам, отсутствует.

Время поиска

Корпорация Майкрософт собирает сведения о производительности для поиска, выполняемого всеми организациями. Хотя сложность запроса тоже влияет на скорость его выполнения, главным фактором, определяющим время поиска, является число почтовых ящиков, в которых он ведется. Хотя корпорация Майкрософт не предоставляет соглашение об уровне обслуживания для времени поиска, в следующей таблице приведено среднее время поиска в коллекции на основе количества почтовых ящиков, включенных в поиск.

Число почтовых ящиков Среднее время поиска
100 30 секунд
1,000 45 секунд
10 000 4 минуты
25 000 10 минут
50 000 20 минут
100 000 25 минут

Ограничения экспорта

В следующей таблице перечислены ограничения при экспорте результатов поиска контента. Эти ограничения также применяются при экспорте содержимого из дела обнаружения электронных данных (standard).

Описание ограничения Ограничение
Максимальный объем экспортируемых данных из одного поиска1 2 ТБ
Максимум, который организация может экспортировать за один день2 2 ТБ
Максимальное количество почтовых ящиков для результатов поиска, которые можно скачать с помощью средства экспорта обнаружения электронных данных 100,000
Максимальный размер PST-файла, который можно экспортировать: 3 10 ГБ
Максимальное количество экспортов или отчетов, отображаемых в случаях поиска контента или обнаружения электронных данных 1,000
Скорость отправки результатов поиска из почтовых ящиков и сайтов в хранилище Azure, предоставляемое корпорацией Майкрософт. Не более 2 ГБ в час

Примечание.

1 Если результаты поиска больше 2 ТБ, попробуйте использовать диапазоны дат или другие типы фильтров, чтобы уменьшить общий размер результатов поиска.

2 Это ограничение сбрасывается ежедневно в 12:00 UTC.

3 Если результаты поиска из почтового ящика пользователя превышают 10 ГБ, результаты поиска для почтового ящика будут экспортированы в два (или более) отдельных PST-файлах. Если вы решили экспортировать все результаты поиска в одном PST-файле, PST-файл будет пролит в дополнительные PST-файлы, если общий размер результатов поиска превышает 10 ГБ.

Ограничения индексирования сообщений электронной почты

В следующей таблице описаны ограничения индексирования, которые могут привести к возврату сообщения электронной почты в виде неиндексированного элемента или частично индексированного элемента в результатах поиска контента.

Ограничение индексирования Примечания Описание
Максимальный размер вложения 1 150 МБ Максимальный размер вложения электронной почты, которое будет анализироваться для индексирования. Любое вложение, превышающее это ограничение, не будет проанализировано для индексирования, а сообщение с вложением будет помечено как частично индексировано.
Максимальное количество вложений 250 Максимальное количество файлов, вложенных в сообщение электронной почты, которое будет проанализировано для индексирования. Если сообщение содержит более 250 вложений, первые 250 вложений анализируются и индексируются, а сообщение помечается как частично проиндексированные, так как оно содержит дополнительные вложения, которые не были проанализированы.
Максимальная глубина вложения 30 Максимальное количество вложенных вложений, которые анализируются. Например, если к сообщению электронной почты прикреплено другое сообщение, а вложенное сообщение — Word документ, то Word документ и вложенное сообщение будут проиндексированы. Это поведение будет продолжаться для до 30 вложенных вложений.
Максимальное число вложенных изображений 0 Изображение, прикрепленное к сообщению электронной почты, пропускается анализатором и не индексируется.
Максимальное время, затраченное на синтаксический анализ элемента 30 секунд На анализ элемента для индексирования затрачивается не более 30 секунд. Если время синтаксического анализа превышает 30 секунд, элемент помечается как частично индексирован.
Максимальное количество выходных данных средства синтаксического анализа 2 миллиона символов Максимальный объем выходных данных текста из средства синтаксического анализа, который индексируется. Например, если средство синтаксического анализа извлекло из документа 8 миллионов символов, индексируются только первые 2 миллиона символов.
Максимальное число маркеров заметок 2 миллиона При индексировании сообщения электронной почты каждое слово помечается разными инструкциями по обработке, определяющими способ индексирования этого слова. Каждый набор инструкций по обработке называется маркером заметки. Для поддержания качества обслуживания в Office 365 существует ограничение в 2 миллиона маркеров заметок для сообщения электронной почты.
Максимальный размер тела в индексе 67 миллионов символов Общее количество символов в тексте сообщения электронной почты и всех его вложений. При индексировании сообщения электронной почты весь текст в тексте сообщения и во всех вложениях объединяется в одну строку. Максимальный размер индексированных строк составляет 67 миллионов символов.
Максимальное число уникальных маркеров в тексте 1 миллион Как уже говорилось ранее, маркеры являются результатом извлечения текста из содержимого, удаления знаков препинания и пробелов, а затем разделения его на слова (называемые маркерами), которые хранятся в индексе. Например, фраза "cat, mouse, bird, dog, dog" содержит 5 токенов. Но только 4 из них являются уникальными маркерами. Существует ограничение в 1 миллион уникальных токенов на сообщение электронной почты, что помогает предотвратить слишком большой индекс со случайными маркерами.

Примечание.

1 Синтаксический анализ — это процесс, в котором служба индексирования извлекает текст из вложения, удаляет ненужные символы, такие как знаки препинания и пробелы, а затем делит текст на слова (в процессе, называемом токенизацией), которые затем сохраняются в индексе.

Ограничения заданий

Описание Ограничение
Максимальное количество одновременных заданий в организации. 50
Максимальное количество одновременных заданий, которые может одновременно запустить один пользователь. 25
Максимальное количество одновременных заданий на уровне клиента (например, поиск на уровне клиента) в организации. 5
Максимальное количество одновременных заданий на уровне клиента (например, поиск на уровне клиента), которые один пользователь может запустить одновременно. 5
Максимальное число заданий в день в организации. 1 500

Примечание.

1 Это ограничение сбрасывается ежедневно в 12:00 UTC.

Дополнительная информация

Существуют дополнительные ограничения, связанные с различными аспектами поиска контента, такими как индексирование контента. Дополнительные сведения об этих ограничениях см. в следующих статьях:

Сведения о поиске содержимого см. в следующем разделе:

Ограничения случаев, связанные с обнаружением электронных данных (стандартный) и обнаружением электронных данных (премиум), см. в:

Нужна помощь по устранению проблем с обнаружением электронных данных?

Основные действия по устранению неполадок, которые можно предпринять для выявления и устранения проблем, которые могут возникнуть во время поиска eDiscovery или в другом месте процесса обнаружения электронных данных, см. в статье Устранение распространенных проблем с обнаружением электронных данных.