Поделиться через


Использование отчета об обработке в обнаружении электронных данных

Отчет об обработке

Обнаружение электронных данных включает диспетчер процессов , который перечисляет все процессы, ограниченные текущей страницей обнаружения электронных данных. Например, если вы находитесь на странице Поиск , диспетчер процессов перечисляет все процессы, относящиеся к текущему поиску. Если вы находитесь в случае, диспетчер процессов перечисляет все процессы, относящиеся к текущему делу. Каждый процесс в списке Диспетчер процессов содержит подробный отчет .zip файл, который содержит подробные сведения о процессе после завершения процесса. Вы можете скачать отчет о процессе .zip файл, чтобы получить дополнительные сведения о том, когда процесс выполнялся, примененные параметры, используемый запрос и были ли в процессе ошибки на уровне элемента или расположения.

Дополнительные сведения об обнаружении электронных данных в отчетах об обработке см. в следующем видео:

Важно!

Вы не можете удалить процессы, перечисленные на странице Диспетчер процессов . Время ожидания длительных процессов автоматически истекает через семь дней.

Типы и описания процессов

Действия пользователей активируют эти процессы при управлении поиском, проверкой наборов и удержанием.

Тип процесса Область Описание
Добавление элементов в другой набор для проверки Набор для проверки Пользователь добавляет документы из одного набора проверки в другой набор проверки в том же случае. Дополнительные сведения см. в разделе Добавление данных в набор для проверки из другой группы проверки.
Добавить в рецензирование Набор для проверки Пользователь добавляет результаты поиска в набор для проверки или элементы из другого набора проверки. Процесс копирует элементы в хранилище Azure, а затем повторно индексирует эти элементы в расположении хранилища Azure. Этот новый индекс используется при запросе и анализе элементов в наборе данных.
Применение или обновление удержания Hold Пользователь помещает источники данных на удержание или обновляет удержание.
Экспорт Поиск
Набор для проверки
Пользователь экспортирует документы из поиска или набора для проверки. После завершения процесса экспорта они могут скачать экспортированные данные на локальный компьютер.
Создание примера Поиск После того как пользователь создает и запускает новую оценку поиска (или повторно запускает существующую оценку поиска), средство поиска подготавливает пример подмножества элементов (которые соответствуют поисковому запросу), которые можно просмотреть. Предварительный просмотр результатов поиска помогает определить эффективность поиска.
Создание статистики Поиск После того как пользователь создает и запускает или повторно запускает оценку поиска, средство поиска выполняет поиск в индексе элементов, соответствующих поисковому запросу, и подготавливает оценку, которая включает количество и общий размер всех элементов по поиску, количество источников данных, которые искали, и другие релевантные шаблоны для поисковых хитов, таких как ключевые слова. Типы конфиденциальной информации и многое другое.
Импорт внешних данных Набор для проверки Пользователь отправляет внешние данные в набор для проверки. Данные также индексируются в ходе этого процесса. Дополнительные сведения см. в разделе Импорт внешних данных в набор для проверки.
Отредакт Набор для проверки После того как пользователь примечает документ в наборе для проверки и отредактирует его часть, он может преобразовать отредактованный документ в PDF-файл. Это гарантирует, что отредактированная часть не будет видна при экспорте документа для презентации. Дополнительные сведения см. в разделе Просмотр документов в наборе для проверки.
Запуск аналитики Поиск Пользователь анализирует данные в наборе для проверки, запуская средства аналитики обнаружения электронных данных, такие как обнаружение почти повторяющихся данных, анализ потоков электронной почты и анализ тем.
Tag Набор для проверки Этот процесс активируется, когда пользователь выбирает Начать процесс добавления тегов на панели Маркировка при проверке документов в наборе для проверки. Пользователь может начать этот процесс после добавления тегов к документам в наборе для проверки и их массового выбора на панели просмотра документов.

Состояние процесса

В следующей таблице описаны различные состояния состояния процессов:

Примечание.

Можно отменить только создание статистики и создание примеров процессов.

Состояние Описание
Заброшенных Процесс был остановлен автоматически. Эта остановка может быть вызвана чрезмерным временем обработки или другими причинами.
Canceled. Пользователь отменил процесс.
Завершение Процесс успешно завершен.
Не выполнено Процесс обнаружил ошибку и не завершился. Эта ошибка может быть вызвана неправильно отформатированным запросом.
Выполняется Процесс выполняется. Ход выполнения процесса можно отслеживать в диспетчере процессов для области.

Скачивание отчета

Все процессы поддерживают возможность скачивания упакованных отчетов. Имя упаковаемого отчета — Reports-*caseName-EntityName-ProcessName-timestamp*.zip, с EntityName заданным пользователем именем для поиска или удержания. В зависимости от процесса отчет содержит разные .csv файлы.

  • Сводка. Отслеживает время начала процесса, время его завершения, количество элементов или расположений и пользователя, отправившего запрос на обработку. Он также содержит используемый поисковый запрос и значение , если применяется граница соответствия . Для добавления в набор проверки и экспорта из процессов поиска сводный отчет содержит сводку факторов, влияющих на общее количество элементов, добавленных для проверки или экспорта. Имя отчета — Summary_*the date/time of the report*.csv.
  • Параметры: содержит параметр перечисления параметров для процесса и значений. Имя отчета — Settings_*the date/time of the report*.
  • Статистика. Содержит все статистические данные для процесса, включая все категории (если параметр был выбран во время отправки процесса), такие как типы конфиденциальной информации, типы данных и участники обмена данными. Имя отчета — Statistics_*the date/time of the report*.
  • Расположения. Отслеживает все источники данных и связанные расположения, ограниченные для процесса. Включает имя сущности пользователя или группы, расположение (URL-адрес почтового ящика или сайта) и счетчик, возвращаемый для этого расположения. Также включает состояние расположения (сведения об успешном выполнении или ошибке). Имя отчета — Locations_*the date/time of the report*.
  • Элементы. Отслеживайте все обработанные элементы, включая такие сведения, как идентификатор элемента, расположение элемента, тема или название элемента, класс или тип элемента, а также состояние успешного выполнения и ошибки. Имя отчета — Items_*the date/time of the report*.

В следующей таблице показаны типы процессов и доступные отчеты:

Тип процесса Сводка Параметры Статистика Расположение Элементы
Добавить в рецензирование Поддерживается. Поддерживается. Поддерживается. Поддерживается.
Применение политики удержания и повторного запуска Поддерживается. Поддерживается.
Экспорт (набор для проверки) Поддерживается. Поддерживается. Поддерживается. Поддерживается.
Экспорт (поиск) Поддерживается. Поддерживается. Поддерживается. Поддерживается.
Создание примера Поддерживается. Поддерживается. Поддерживается. Поддерживается.
Создание статистики Поддерживается. Поддерживается. Поддерживается. Поддерживается.
Отредакт Поддерживается. Поддерживается. Поддерживается.
Tag Поддерживается. Поддерживается.

Сводный отчет CSV

Все пакеты отчетов содержат Summary-*the date/time of the report*.csv файл. Этот файл содержит следующие сведения:

Обзор

В этом разделе отчета содержатся следующие сведения:

  • Идентификатор задания. Уникальный идентификатор, назначенный каждому процессу обнаружения электронных данных в справочных целях.
  • Имя дела: имя, присвоенное делу обнаружения электронных данных.
  • Имя поиска: имя, присвоенное конкретному поиску в случае обнаружения электронных данных при выполнении процесса. Эта информация относится только к таким процессам, как Создание статистики, Созданный пример, Добавление в набор проверки и Экспорт из поиска.
  • Имя набора проверки. Имя набора проверки, в который добавляются результаты поиска при выполнении процесса. Это относится только к процессам Добавить в набор проверки и Экспорт из набора проверки .
  • Имя экспорта: имя, присвоенное экспорту. Это относится только к процессам Добавить в набор проверки и Экспорт из набора проверки .
  • IsRetry: указывает, активируется ли текущий процесс операцией повтора неудачных расположений . Если значение равно Да, оно содержит агрегированное число попаданий, а в отчете о расположении содержатся подробные сведения о неудачных расположениях. Эти сведения относятся только к процессу создания статистики .
  • Запрос: условия запроса для применимых типов процессов.
  • StartTime: дата и время начала создания отчета.
  • EndTime: дата и время завершения создания отчета.
  • SubmittedBySmtp: SMTP-адрес пользователя, создающего отчет.
  • Примененный фильтр безопасности. Указывает, применялись ли фильтры безопасности во время выполнения процесса. Да указывает, что фильтры использовались для ограничения результатов на основе заданных условий, заданных администратором в PowerShell.
  • Ограничение расположения. Фильтры, применяемые для ограничения поиска определенными расположениями. Чтобы проверить, какие почтовые ящики фильтруются, используйте предоставленный запрос с командлетами Get-Mailbox или Get-Recipient и атрибутом -Filter . Например, если атрибут фильтра — Department -eq 'marketing', получите соответствующие почтовые ящики с командой Get-Recipient -Filter "Department -eq 'marketing'. В выходных данных перечислены все почтовые ящики, разрешенные для поиска.
  • Ограничение содержимого: запрос, используемый для фильтрации содержимого во время поиска. Содержимое, соответствующее этому запросу, включается в результаты поиска. Предоставленный запрос доступен для выполнения KeyQL поиска.

результатах поиска;

Сводка по количеству элементов, соответствующих поисковому запросу, включая частично индексированные элементы или элементы, в которых выполнялось расширенное индексирование (в зависимости от выбранного параметра). В этом разделе отчета содержатся следующие сведения:

  • Индексированные элементы: количество элементов, соответствующих запросу, которые изначально индексировались Exchange и SharePoint.
  • Частично индексированные элементы: количество частично индексированных элементов, которые могут не соответствовать запросу. Включено, если вы решили включить частично индексированные элементы.
  • Расширенные индексированные элементы: количество элементов, соответствующих запросу, если вы решили выполнить расширенное индексирование частично индексированных элементов.

Сводка по потреблению

В этом разделе отчета содержатся следующие сведения:

  • Данные содержимого Microsoft 365: общий размер данных для всех данных Microsoft 365.
  • Метаданные Microsoft 365: общий размер метаданных для всех данных Microsoft 365 и Microsoft 365 Copilot данных.
  • Данные содержимого ИИ, отличные от Microsoft 365: общий размер данных ИИ, отличных от Microsoft 365. Включает данные из Microsoft Fabric Copilot, Microsoft Security Copilot и другие данные ИИ из корпоративных и облачных приложений.
  • Метаданные ИИ, отличные от Microsoft 365: общий размер метаданных для всех данных ИИ, отличных от Microsoft 365.

Примечание.

Данные не экспортируются и не добавляются в набор проверки, если у вас нет активной подписки с оплатой по мере использования. Дополнительные сведения см. в статье Включение функций Microsoft Purview с оплатой по мере использования для новых клиентов.

Error

В этом разделе отчета содержатся следующие сведения:

  • Исключения получения: количество элементов, которые не были экспортированы или добавлены для проверки из-за таких исключений, как пустые файлы, время ожидания доступа и аналогичные проблемы.

Предупреждение

  • Элементы с ошибками обработки: количество элементов, в которых возникли ошибки обработки, но они по-прежнему экспортированы или добавлены в набор для проверки. Эти ошибки могут быть вызваны неподдерживаемыми типами файлов, проблемами расшифровки и подобными проблемами.

Всего

В этом разделе отчета содержатся следующие сведения:

  • Всего собранных элементов: общее количество элементов, экспортированных или добавленных в набор для проверки. Это число определяет элементы из предполагаемых результатов, параметры, которые могут увеличить или уменьшить количество полученных элементов, а также элементы, которые не были собраны из-за ошибок.

Сведения

Примечание.

В разделе Сведения этого отчета показано, как количество элементов может увеличиваться или уменьшаться в зависимости от выбранного параметра. В процессе вычисления используются эти параметры и обновляется количество вычислений поиска, поэтому в большинстве случаев счетчики не будут точно сложены. Эта информация дает представление об изменениях и причинах их возникновения.

В этом разделе отчета содержатся следующие сведения:

  • Дубликаты в наборе для проверки (пропущены): элементы, которые процесс пропускает, так как они уже существуют в наборе для проверки.
  • Облачные вложения: количество облачных вложений в сообщениях электронной почты и беседах Teams, поступающих из ссылок, которыми обмениваются через SharePoint или OneDrive. Это число сопоставляется с параметром Access links (облачные вложения) в сообщениях.
  • Версии облачных вложений. Количество собираемых версий облачных вложений в зависимости от того, следует ли включать в запрос не только последнюю версию.
  • Облачные вложения во время совместного использования. Количество версий облачных вложений, представляющих исходную версию, доступную из SharePoint или OneDrive. Это число применяется только к облачным вложениям, к которым применена метка хранения, которая сохраняет копию файла во время предоставления общего доступа.
  • Контекстная беседа: количество сообщений контекстного чата, собранных вместе с сообщением, соответствующим вашему запросу. Это число показывает количество дополнительных сообщений, собранных до и после сообщения с нажатием. Это число сопоставляется с параметром "Включить Teams и Viva Engage беседы".
  • Беседы Teams, объединенные в расшифровки: беседы чата Teams, которые процесс преобразует в файлы расшифровки HTML. Это преобразование приводит к тому, что многие сообщения чата Teams объединяются в одну расшифровку HTML. Это число сопоставляется с параметром "Упорядочить беседы в HTML-расшифровки".
  • Версии файлов SharePoint: количество собранных версий файлов SharePoint в зависимости от того, следует ли включать больше, чем только последнюю версию.
  • Элементы списка SharePoint, собранные в виде .csv файлов. Совпадения из одного списка SharePoint экспортируются или добавляются в набор для проверки как один csv-элемент списка SharePoint. Это число сопоставляется с параметром "Сбор файлов, присоединенных к спискам SharePoint, и их дочерних элементов".
  • Вложения списка: количество собранных вложений списка. Это число сопоставляется с параметром Включить вложения списка при сборе файлов, присоединенных к спискам SharePoint.
  • Элементы в папках SharePoint: количество элементов, развернутых из папок SharePoint, которые соответствуют запросу. Это число сопоставляется с параметром Собрать все элементы (даже если они не соответствуют поисковому запросу).
  • Элементы, извлеченные из родительских элементов: количество внедренных или присоединенных элементов, извлекаемых процессом из родительских элементов. Например, это число может включать вложения или внедренные изображения из сообщения электронной почты, соответствующего вашему запросу.

Csv-отчет о параметрах

Отчет о параметрах помогает проверить и интерпретировать конфигурацию отправленных процессов. Этот отчет включается в загружаемый пакет отчета. Он фиксирует определенные параметры, которые вы выбираете во время отправки процесса, такие как Создание статистики, Добавление в набор проверки и Экспорт.

Эти параметры напрямую влияют на область и формат результатов. Ниже приведены некоторые примеры этих параметров:

  • Включить версии документов. Определяет количество версий документа для включения, что может значительно увеличить объем экспортированных данных.
  • Упорядочивание бесед по расшифровкам HTML. Влияет на то, как беседы Teams потоковые и представлены.
  • Ссылки для доступа в сообщении. Влияет на получение файла из ссылки вложения в облаке, представленной в сообщениях электронной почты и беседах.
  • Различные форматы и параметры экспорта. Влияет на организацию и упаковку экспортированного содержимого.
  • Параметры расшифровки. Укажите, включена ли для конкретного процесса возможность расшифровки Exchange или SharePoint.

Понимание этих параметров имеет важное значение для обеспечения гибкости и прозрачности. Файл settings.csv служит ориентиром для того, что вы настроили во время отправки. Его можно использовать для согласования фактических выходных данных с предполагаемой конфигурацией. Это понимание особенно важно при проверке результатов или реагировании на юридические запросы или запросы соответствия.

Отчет CSV статистики

В этом отчете содержатся подробные сведения обо всех шаблонах, производных от попаданий поиска при завершении процесса создания статистики . Отчет содержит сведения об основных участниках обмена данными, типе верхнего элемента, типе конфиденциальной информации и т. д.

Отчет содержит следующие сведения:

  • DataSourceName: список имен источников данных, связанных с процессом. Эти сведения указывают имена людей или групп.
  • DateSourceType: Тип источника данных. Например, Group или TeamsGroup.
  • Расположение: сведения о расположении. Например, URL-адрес сайта или SMTP-адрес почтового ящика.
  • LocationType: тип расположения. Например, почтовый ящик или сайт.
  • LocationSubType: подтип типа расположения. Если тип расположения — Почтовый ящик, подтип может иметь PrimaryMailbox, SystemMailbox и другие подтипы. Если тип расположения — Site, может иметь OneDriveSite и другие подтипы.
  • OriginalStateName: собственная версия StatName.
  • StatName: имя StatType. Например, для ключевых слов StatType возможные значения — это ключевые слова, введенные в запросе.
  • StatType: Тип статистических данных. Например, ключевые слова, участники общения и многое другое.
  • Значение: значение или число, связанное со статистикой в текущем источнике данных.

Отчет CSV элементов

Этот отчет содержит подробные данные инвентаризации всех элементов, обработанных в процессе обнаружения электронных данных, например с помощью набора "Добавить для проверки" или "Экспорт ". Процесс автоматически создает этот отчет и включает его вместе с выходными данными для поддержки аудита, трассировки и последующего анализа. Этот отчет полезен для пользователей, которым необходимо проверить область и точность собранного или экспортированного содержимого.

Каждая строка в файле соответствует одному элементу и содержит следующие метаданные и многое другое:

  • Источник даты: определяет исходное расположение элемента (почтовый ящик, сайт SharePoint, чат Teams).

  • Составной путь: полный путь к элементу в исходном контейнере.

  • Тема и заголовок: строка темы (для сообщений электронной почты) или заголовок (для документов) элемента.

  • Дата: метка времени, связанная с элементом, например дата отправки или последнего изменения.

  • Добавлено: показывает, как элемент был включен в задание:

    • IndexedQuery: элемент индексируется и соответствует поисковому запросу.
    • UnindexedQuery: элемент включается на основе частично индексированного содержимого и заданных пользователем параметров.
  • Состояние: показывает, был ли элемент успешно получен и обработан. Если не удалось извлечь элемент (из-за проблем с доступом, истечения времени ожидания), в поле ErrorWarning указывается причина сбоя.

  • Другие метаданные: могут включать расширение файла, тип контента, рабочую нагрузку и другие соответствующие атрибуты в зависимости от типа источника и процесса.

Csv-отчет о расположениях

В этом отчете представлен обзор расположений, предназначенных для процесса обнаружения электронных данных, таких как Поиск, Добавление в набор проверки или Экспорт. Этот отчет поможет вам понять область процесса и оценить распределение и релевантность результатов поиска в разных расположениях.

Этот отчет может помочь в:

  • Тепловое сопоставление. Определите, какие расположения дали наиболее релевантное содержимое, а какие — нет, помогая визуализировать "горячие точки" релевантности данных.
  • Уточнение запроса. Сведения о том, какие источники может потребоваться исключить или точнее нацелить.
  • Аудит и проверка. Проверка включения предполагаемых расположений и оценка эффективности область поиска.

Проанализировав location.csv отчет, вы можете принять обоснованные решения о уточнении стратегии поиска и оптимизации область будущих рабочих процессов обнаружения электронных данных.

Примечание.

Если несколько почтовых ящиков используют один SMTP-адрес, в отчете о расположении может отображаться несколько строк. Такая ситуация возникает из-за того, что один SMTP-адрес может содержать различные подтипы почтовых ящиков, например основной, системный или архивный. Количество строк в отчете CSV может превышать число, указанное в расположении карта в представлении Статистика. Представление "Статистика" объединяет все почтовые ящики с одинаковым SMTP-адресом без различения подтипов. Для более подробной разбивки попаданий по подлокации используйте csv-отчет вместо представления Статистика . Расположения SharePoint и OneDrive также могут иметь архивные сайты и считаются отдельными расположениями в отчете.

Каждая строка в отчете представляет уникальное расположение содержимого и содержит следующие основные сведения:

  • Расположение: полный URL-адрес или SMTP-адрес расположения. Для поиска в масштабах всей организации расположения пусты для сайтов без попаданий. При необходимости используйте LocationID для идентификации URL-адреса сайта.

  • Идентификатор расположения: Идентификатор сайта для SharePoint или идентификатор почтового ящика для почтовых ящиков.

  • Подтип расположения. Указывает тип расположения, например PrimaryMailbox, SystemMailbox, ArchiveMailbox или OneDriveSite.

  • Count: количество элементов в расположении, соответствующих условиям поиска.

  • Размер: общий размер адаптивных элементов из расположения в байтах.

  • Состояние: указывает, успешно ли было обработано расположение. Если в расположении не удалось выполнить поиск или экспорт, в поле ErrorWarning указывается причина сбоя, например проблемы с разрешениями или превышение времени ожидания.