Поделиться через


Расширенное индексирование в обнаружении электронных данных

При добавлении источника данных в дело обнаружения электронных данных система переиндексирует любое содержимое, которое она считает частично индексируемым или с ошибками индексирования. Этот процесс повторной индексации называется расширенным индексированием. Многие причины могут привести к частичному индексации содержимого или возникновению ошибок индексирования. Эти ошибки могут включать файлы изображений, наличие изображений в файле, неподдерживаемые типы файлов или ограничения на индексирование размера файлов.

Расширенное индексирование доступно в eDiscovery с поддержкой функций premium. Система применяет расширенное индексирование при выполнении таких процессов, как создание статистики, добавление элементов для проверки набора и прямой экспорт. Вам не нужно ждать завершения расширенного индексирования, прежде чем выполнять поиск или добавлять элементы в набор проверки, как в предыдущих версиях обнаружения электронных данных. Кроме того, вам не нужно вручную запускать обновления при расширенном индексировании, чтобы убедиться, что только что добавленное содержимое в целевых расположениях необходимо переиндексировать.

Совет

Хотите попробовать функции обнаружения электронных данных уровня "Премиум"? См. требования к подписке для лицензирования Microsoft 365 корпоративный E5.

Для файлов #REF! расширенное индексирование выполняется только для элементов, помеченных как частично индексированные, или элементов с ошибками индексирования. В Exchange сообщения электронной почты с вложениями изображений не помечаются как частично индексированные или с ошибками индексирования. Это означает, что эти файлы не переиндексируются расширенным процессом индексирования.

Примечание.

Оптическое распознавание символов (OCR) автоматически выполняется во время расширенного индексирования. Дополнительные сведения о работе OCR и настройке параметров, связанных с OCR, см . в статье Сведения о параметрах поиска и аналитики в случаях обнаружения электронных данных.

Просмотр результатов расширенного индексирования

На панели мониторинга статистики можно просмотреть расширенные удары по индексации и выбрать, где применять расширенное индексирование. Вы можете просмотреть предполагаемые числа попаданий на количество дополнительных элементов из частично индексированных элементов, соответствующих поисковому запросу после их повторной индексации с помощью расширенного индексирования. Чтобы обеспечить полное расширенное индексирование для всех частично индексированных элементов в область без выборки, используйте добавление в набор проверки и экспорт с расширенным индексированием.

Вы также можете просмотреть расширенные индексированные элементы в результатах поиска в отчете о процессе. В этом отчете содержатся сведения о элементах, частично индексированных элементах и элементах, определяемых расширенным индексированием.

Для более детальной аналитики можно использовать отчеты CSV. Это может включать в себя, какие конкретные элементы были экспортированы или в каких расположениях был выполнен поиск. Эти отчеты указывают, был ли элемент включен из-за соответствия индексированного запроса или в результате расширенного индексирования. Отчет о расположении содержит количество попаданий и объем данных для каждого расположения, разбитый на соответствие стандартному индексу и расширенному индексу.

Расширенное индексирование области

Вы можете область расширенное индексирование частично индексированных элементов в местах, где уже есть индексированные попадания, частично индексированные элементы в местах, где нет индексированных попаданий, или и то, и другое.

  • Частично индексированные элементы из расположений с индексированных попаданий. Этот параметр является более целевым и ограничивает область только теми расположениями (почтовыми ящиками, сайтами), где некоторые содержимое было успешно проиндексировано и соответствует условиям поиска.

    Этот вариант подойдет в приведенных ниже ситуациях.

    • Вы хотите уменьшить уровень шума и сосредоточиться только на местах, которые уже известны как релевантные.
    • Вы проводите узкое исследование и хотите избежать просмотра нерелевантного содержимого.
    • Вы оптимизируете проверку эффективности и контроля затрат (например, в крупномасштабных случаях обнаружения электронных данных).
    • Вы хотите сначала определить приоритет расположения и частично индексированные элементы в расположениях с высоким уровнем релевантности к этому вопросу, а затем вернитесь к более полному анализу, который включает все расположения (в том числе без индексированных попаданий).
  • Частично индексированные элементы из всех искомых расположений. Этот параметр является более полным и включает частично индексированные элементы из каждого расположения, в котором выполняется поиск, независимо от того, соответствует ли какое-либо проиндексированное содержимое.

    Этот вариант подойдет в приведенных ниже ситуациях.

    • Вам нужна максимальная полнота для обеспечения правовой безопасности или соответствия нормативным требованиям.
    • Вы исследуете потенциальное сокрытие данных или вредоносное поведение, если соответствующее содержимое может существовать только в неиндексированных форматах (например, вложения на основе изображений или зашифрованные файлы).
    • Вы работаете со сценариями с высоким риском, когда отсутствие даже одного критического элемента может иметь юридические или бизнес-последствия.