Сбор статистики и отчетов в Microsoft Purview eDiscovery (Премиум)

После создания оценки коллекции можно просмотреть статистику по извлеченным элементам, например расположение содержимого, содержащее большинство элементов, соответствующих условиям поиска, и количество элементов, возвращаемых поисковым запросом. Вы также можете просмотреть подмножество результатов.

Определив набор документов, которые требуется изучить, можно добавить результаты поиска в набор для проверки для сбора и обработки.

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Поиск статистики для оценок сбора

В этом разделе описывается статистика, доступная для оценки сбора данных. Эти статистические данные доступны на вкладке Статистика поиска на всплывающей странице оценки коллекции.

Оценки коллекции

В этом разделе отображается графическая сводка предполагаемых элементов, возвращаемых коллекцией. Это указывает количество элементов, соответствующих условиям поиска коллекции. Эти сведения дают представление о предполагаемом количестве элементов, возвращаемых коллекцией.

  • Предполагаемые элементы по расположениям: общее количество предполагаемых элементов, возвращенных коллекцией. Также отображается определенное количество элементов, расположенных в почтовых ящиках и расположенных на сайтах.
  • Предполагаемые расположения с попаданиями: общее количество расположений содержимого, содержащих элементы, возвращаемые коллекцией. Также отображается определенное количество расположений почтовых ящиков и сайтов.
  • Объем данных по расположению (в МБ) — общий размер всех предполагаемых элементов, возвращаемых коллекцией. Также отображается конкретный размер элементов почтового ящика и элементов сайта.

Раздел оценки коллекции для оценки коллекции.

Отчет о состоянии

В этом разделе отображается статистика поискового запроса коллекции и количество предполагаемых элементов, соответствующих различным частям поискового запроса. Эти статистические данные можно использовать для анализа количества элементов, соответствующих каждому компоненту поискового запроса. Это поможет уточнить критерии поиска для коллекции и при необходимости сузить область коллекции.

  • Тип расположения: тип расположения контента, к которому применяется статистика запросов. Значение Exchange указывает расположение почтового ящика; значение SharePoint указывает расположение сайта.
  • Часть: часть поискового запроса, к ней применима статистика. Главный означает, что статистика относится ко всему поисковому запросу. Ключевое слово указывает, что статистика в строке используется для определенного ключевое слово. Если для поискового запроса в коллекции используется список ключевое слово, статистика по каждому компоненту запроса включается в эту таблицу.
  • Условие. Фактический компонент (ключевое слово или условие) поискового запроса, который был выполнен для оценки коллекции, возвращающей статистику, отображаемую в соответствующей строке.
  • Расположения с попаданиями. Количество расположений содержимого (указанное в столбце Тип расположения), которые содержат элементы, соответствующие основному или ключевое слово запросу, указанному в столбце Условие.
  • Элементы: количество элементов (из указанного расположения содержимого), которые соответствуют запросу, указанному в столбце Условие . Как уже говорилось ранее, если элемент содержит несколько экземпляров искомого ключевое слово, он учитывается только один раз в этом столбце.
  • Размер (МБ) — общий размер всех найденных элементов (в указанном расположении содержимого), соответствующих поисковому запросу в столбце Условие .

Раздел отчета о состоянии для оценки коллекции.

Основные расположения

В этом разделе отображается статистика о конкретных расположениях содержимого с наибольшим количество элементов, возвращаемых коллекцией.

  • Расположение: имя расположения (адрес электронной почты почтовых ящиков и URL-адрес сайтов).
  • Тип расположения. Почтовый ящик будет иметь тип Exchange , а сайты SharePoint — тип SharePoint .
  • Элементы: предполагаемое количество элементов в расположении содержимого, возвращенное коллекцией.
  • Размер: общий размер предполагаемых элементов в каждом расположении содержимого.

Раздел

Статистика и отчеты для зафиксированных коллекций

В этом разделе описывается статистика, доступная после фиксации коллекции в наборе для проверки, включая фактическое количество элементов, добавленных в набор для проверки. Эта статистика (в дополнение к сведениям о наборе загрузки) предоставляет исторические сведения о содержимом, добавленном в дело.

После фиксации коллекции в наборе для проверки на всплывающей странице зафиксированного подключения отображаются следующие вкладки. Каждая из этих вкладок содержит различные типы сведений о коллекции.

Вкладки на всплывающей странице зафиксированной коллекции.

Вкладка "Сводка" для коллекций

Вкладка Сводка для зафиксированных коллекций содержит несколько разделов, в котором содержатся сведения об элементах коллекции, оценках и расположениях элементов, индексировании, типах файлов и т. д.

Обзор коллекции (предварительная версия)

В разделе Обзор коллекции на вкладке Сводка набора зафиксированных отзывов содержатся сведения о том, как элементы были найдены, извлечены и обработаны в составе коллекции. Сведения в этом разделе — это сводка сведений, собранных и отображаемых во время первоначальной оценки сбора, и включает сведения, собранные и обработанные во время фиксации сбора в наборе для проверки. Сведения, приведенные в этом разделе, помогут лучше понять, как окончательные данные сбора развиваются от оценочных данных во время фиксации и обработки сбора.

Эти сведения сегментированы и отображаются в следующих подразделах:

  • Расположения с хитами. В этом разделе приводится сводка количества искомых расположений и количества мест с попаданиями в зависимости от условий, определенных в оценке сбора. Здесь также отображается количество и тип искомых расположений.

    Места с хитами.

  • Оценки перед сбором. В этом разделе приводится сводка количества элементов и размера общих элементов, вычисляемых для оценки коллекции (до фиксации коллекции). Также отображается количество элементов, которые были частично проиндексированы .

    Предварительные оценки сбора.

  • Элементы коллекции. В этом разделе отображаются тип, количество и описание всех элементов, полученных из расположений с попаданиями во время фиксации коллекции в наборе для проверки. Во время этого процесса может происходить некоторое добавление и консолидация элементов во время обработки. Дополнения и консолидации могут включать типы, включенные в следующую таблицу:

    Тип элемента Описание типа элемента
    Элементы с хитами Предполагаемое количество элементов, найденных при поиске.
    Проверка повторяющихся наборов Элементы, которые уже находятся в том же наборе для проверки, не собираются.
    Поиск дубликатов Повторяющиеся экземпляры одних и тем же элементов не собираются.
    Все версии Собираются все версии элементов в SharePoint.
    Исторические версии Собираются исторические версии, поддерживаемые SharePoint.
    Облачные вложения Облачные вложения идентифицируются и собираются по ссылкам SharePoint.
    Версия как общая Общие версии элементов собираются в дополнение к последним версиям.
    Контекстные беседы Teams Собираются дополнительные сообщения чата, которые могут быть релевантными.
    Консолидированные расшифровки чатов Собранные сообщения чата объединяются в меньшее количество расшифровок HTML.
    Исключения получения Время ожидания доступа, пустые файлы и другие исключения.
    Всего собранных элементов Общее количество элементов, собранных из различных расположений.
  • Обработка для набора проверки. В этом разделе отображаются тип, количество и описание элементов, добавленных в набор проверки из оценки коллекции. Элементы распаковываются, сканируются на наличие текста, переиндексируются и обрабатываются при подготовке к проверке.

    Обработка для проверки набора.

Содержимое коллекции

Раздел Содержимое коллекции на вкладке Сводка набора зафиксированных отзывов содержит статистику и другие сведения о элементах, которые были собраны из источников данных в коллекции и добавлены в набор для проверки.

  • Всего извлеченных элементов. Общее количество элементов, добавленных в набор для проверки. Это число указывает сумму родительских и дочерних элементов, добавленных в набор для проверки.

    Совет

    Наведите указатель мыши на родительские или дочерние панели элементов, чтобы отобразить общее количество родительских или дочерних элементов.

  • Родительские элементы. Количество элементов, возвращенных коллекцией, которая использовалась для сбора элементов, добавленных в набор проверки. Это число соответствует (и равно) предполагаемому числу элементов, отображаемому в разделе Параметры коллекции . Количество родительских элементов, которые он собирает сведения, которые использовались для сбора элементов, добавленных в набор для проверки.

    Родительский элемент может содержать несколько дочерних элементов. Например, сообщение электронной почты является родительским элементом, если оно содержит вложенный файл или содержит облачное вложение. В этом случае вложенный файл или целевой файл облачного вложения считается дочерним элементом. При фиксации коллекции родительские элементы и все соответствующие дочерние элементы (например, вложенные файлы и облачные вложения) добавляются в набор для проверки как отдельные элементы или файлы.

  • Дочерние элементы. Количество дочерних элементов, добавленных в набор для проверки. Только дочерние элементы, которые являются вложениями файлов и облачными вложениями, добавляются в набор проверки как отдельные файлы. Другие типы дочерних элементов, такие как подписи электронной почты и изображения, извлекаются из родительского элемента, а затем обрабатываются с помощью оптического распознавания символов (OCR) для извлечения любого текста из дочернего элемента. Текст, извлеченный из этих типов дочерних элементов, затем добавляется в родительский элемент, чтобы его можно было просмотреть в наборе для проверки. Не добавляя дочерние элементы в набор для проверки в виде отдельного файла, обнаружение электронных данных (премиум) помогает упростить процесс проверки, ограничив количество потенциально нематериальных элементов в наборе для проверки.

  • Уникальные элементы. Количество уникальных элементов, добавленных в набор для проверки. Уникальные элементы являются уникальными для набора для проверки. Все элементы являются уникальными при добавлении первой коллекции в новый набор проверки, так как в наборе для проверки не было предыдущих элементов.

  • Идентифицированные повторяющиеся элементы. Количество элементов из коллекции, которые не были добавлены в набор для проверки, так как тот же элемент уже существует в наборе для проверки. Статистика о повторяющихся элементах может помочь объяснить различия между количеством предполагаемых элементов из оценки коллекции и фактическим количеством элементов, добавленных в набор для проверки.

Индексирование

Раздел Индексирование на вкладке Сводка зафиксированного набора проверки содержит сведения об индексировании элементов, добавленных в набор для проверки.

  • Новые индексированные элементы. Количество элементов, которые были недавно проиндексированы до их добавления в набор для проверки. Примерами только что индексированного элемента являются дочерние элементы, извлеченные из родительского элемента, а затем индексируются перед их добавлением в набор проверки. Кроме того, элементы, которые не находятся в источниках данных хранения и расположениях содержимого, не относящихся к хранению, перечисленных на вкладке Источники данных в случае, индексируются перед добавлением в проверку. Например, новые индексированные элементы будут включать элементы, собранные из дополнительных расположений.

  • Обновлены индексированные элементы. Количество частично индексированных элементов, которые были успешно проиндексированы и добавлены в набор проверки. Эта статистика указывает на частично индексированные элементы из расположений хранимого и нереплицированного содержимого , которые были успешно проиндексированы, когда коллекция была зафиксирована в наборе для проверки.

  • Ошибки индексирования. Количество частично индексированных элементов, которые не удалось проиндексировать до их добавления в набор проверки. Эти элементы могут потребовать исправления ошибок.

Типы файлов коллекции

В разделе Типы файлов коллекции на вкладке Сводка зафиксированного набора проверки отображается количество элементов для каждого типа файлов, включенных в коллекцию. Типы файлов включают электронную почту, изображения, документы, аудио, типы видеофайла и многое другое. Полный список поддерживаемых типов файлов см. в разделе Поддерживаемые типы файлов в eDiscovery (премиум).

Ошибки

В разделе Ошибки на вкладке Сводка набора зафиксированных отзывов отображается тип и количество ошибок, возникших во время фиксации сбора. Ошибки могут включать файлы нулевого размера, защищенные файлы, неправильно сформированные файлы, внутренние ошибки и многое другое. Отчет об ошибках в .csv формате можно скачать, выбрав Скачать отчет об ошибках в этом разделе.

Параметры коллекции

В разделе Параметры коллекции на вкладке Сводка зафиксированного набора проверки отображаются сведения о коллекции, которые использовались для сбора элементов, добавленных в набор для проверки. На этой вкладке отображаются сведения, аналогичные сведениям на вкладке Статистика поиска . В этом разделе приводится краткий снимок поискового запроса, используемого коллекцией, расположения контента, в которые был выполнен поиск, и предполагаемые результаты сбора. Как упоминалось ранее, количество предполагаемых элементов в этом разделе будет равно количеству родительских элементов, отображаемых в разделе Содержимое коллекции .

Вкладка "Источники данных" для коллекций

На вкладке Источники данных содержатся сведения о хранимых и нерепетиционных источниках данных. В разделе Источники хранимой данных отображаются все источники хранимой данных для каждого хранителя, включенного в коллекцию. В разделе Источники данных, не относящиеся к хранению , отображаются все источники данных, не относящиеся к хранению, для коллекции. Отображаемые сведения об источнике данных также доступны на вкладке main Источники данных для каждого случая.

Вкладка "Статистика поиска" для коллекций

Статистика, отображаемая на вкладке Статистика поиска , является той же статистикой, что и при последнем выполнении оценки сбора. Сюда входят оценки сбора, отчет о состоянии и основные расположения. Эти сведения сохраняются из оценки коллекции для исторических ссылок и могут быть сопоставлены с фактической коллекцией, которая была зафиксирована в наборе для проверки.

Различия между оценками сбора и фактической зафиксированной коллекцией

При выполнении оценки коллекции оценка количества элементов (и их общего размера), соответствующих условиям коллекции, отображается на вкладке Сводка и в разделе Оценки коллекции на вкладке Статистика поиска . После фиксации оценки коллекции в наборе для проверки фактическое количество элементов (и их общий размер), добавленных в набор для проверки, часто отличается от оценок. В большинстве случаев в набор для проверки добавляется больше элементов, чем было оценено из оценки коллекции. В следующем списке описаны наиболее распространенные причины этих различий и советы по их выявлению.

  • Дочерние элементы. Дочерние элементы (например, вложения файлов и облачные вложения), которые извлекаются из родительских элементов и добавляются как отдельные файлы. Количество дочерних элементов может увеличить количество элементов, добавленных в набор для проверки. Как правило, количество родительских элементов, определенных в разделе Содержимое коллекции на вкладке Сводка зафиксированной коллекции, должно быть равно числу предполагаемых элементов из оценки коллекции.

  • Повторяющиеся элементы. Элементы из оценки коллекции, которые уже были добавлены в набор проверки в предыдущей коллекции, не будут добавлены. Как упоминалось ранее, количество повторяющихся элементов в коллекции отображается в разделе Содержимое коллекции на вкладке Сводка .

  • Параметры конфигурации коллекции. При фиксации оценки коллекции в наборе для проверки необходимо включить потоки беседы, облачные вложения и версии документов. Все эти элементы, добавленные в набор для проверки, не включаются в оценки коллекции. Они идентифицируются и собираются только при фиксации коллекции. Выбор этих параметров, скорее всего, увеличит количество элементов, добавленных в набор для проверки.

    Например, несколько версий документов SharePoint не включаются в оценку для оценки коллекции. Но если выбрать параметр для включения всех версий документов при фиксации оценки коллекции, фактическое количество (и общий размер) элементов, добавленных в набор для проверки, будет увеличиваться.

    Дополнительные сведения об этих параметрах см. в разделе Фиксация оценки коллекции в наборе для проверки.

Ниже приведены другие причины, по которым ожидаемые результаты оценки коллекции могут отличаться от фактических зафиксированных результатов.

  • Способ оценки результатов для оценок сбора. Оценка результатов поиска, возвращаемых оценкой коллекции, — это оценка (а не фактическое количество) элементов, соответствующих критериям запроса коллекции. Чтобы скомпилировать оценку элементов электронной почты, из базы данных Exchange запрашивается список идентификаторов сообщений, соответствующих условиям поиска. Но при фиксации коллекции в наборе для проверки коллекция выполняется повторно, а фактические сообщения извлекаются из базы данных Exchange. Таким образом, различия могут возникать из-за того, как определяется предполагаемое количество элементов и фактическое количество элементов.

  • Изменения, происходящие между временем оценки и фиксацией оценок сбора. При фиксации оценки коллекции в наборе для проверки поиск выполняется повторно, чтобы собрать последние элементы в индексе поиска, которые соответствуют условиям поиска. Возможно, были созданы, отправлены или удалены дополнительные элементы, которые соответствуют условиям поиска в период между временем последнего выполнения оценки коллекции и фиксацией оценки коллекции в наборе для проверки. Кроме того, возможно, что элементы, которые были в индексе поиска, когда результаты оценки коллекции были оценены, больше не существуют, так как они были удалены из источника данных перед фиксацией коллекции. Одним из способов устранения этой проблемы является указание диапазона дат для коллекции. Другой способ — разместить удержание в расположениях содержимого, чтобы элементы сохранялись и не могли быть очищены.

  • Неиндексированные элементы. Если оценка коллекции включала поиск по всем почтовым ящикам Exchange или всем сайтам SharePoint, в набор для проверки будут добавлены только неиндексированные элементы из расположений контента, которые содержат элементы, соответствующие условиям коллекции. Иными словами, если в почтовом ящике или на сайте не найдены результаты, все неиндексированные элементы в этом почтовом ящике или на сайте не будут добавлены в набор для проверки. Однако неиндексированные элементы из всех расположений содержимого (даже те, которые не содержат элементов, соответствующих запросу коллекции) будут включены в предполагаемые результаты сбора.

  • Частично индексированные элементы. Этот параметр добавляет частично индексированные элементы из дополнительных источников данных в набор для проверки. Если коллекция искала дополнительные источники данных (как указано на странице Дополнительные расположения в мастере коллекций), могут быть частично индексированные элементы из этих расположений, которые нужно добавить в набор для проверки. Источники данных, не относящиеся к хранению, обычно не содержат частично индексированных элементов. Это связано с тем, что расширенный процесс индексирования переиндексирует элементы при добавлении в дело хранимых и нереплициальных источников данных. Кроме того, при добавлении частично индексированных элементов увеличится количество элементов, добавленных в набор для проверки.

    После добавления частично индексированных элементов в набор проверки можно применить фильтр для конкретного просмотра этих элементов. Дополнительные сведения см. в разделе Пример сценария. Фильтрация частично индексированных элементов

    Кроме того, если оценка коллекции включала определенные расположения содержимого (это означает, что определенные почтовые ящики или сайты, указанные на странице Дополнительные расположения в мастере оценки коллекции), то неиндексированные элементы (которые не исключены из условий коллекции) из расположений контента, указанных в поиске, будут экспортированы. В этом случае предполагаемое количество неиндексированных элементов и количество неиндексированных элементов, добавленных в набор для проверки, должно совпадать.