Estadísticas e informes de recopilación en Microsoft Purview eDiscovery (Premium)

Después de crear una estimación de colección, puede ver estadísticas sobre los elementos recuperados, como las ubicaciones de contenido que contienen la mayoría de los elementos que coincidieron con los criterios de búsqueda y el número de elementos devueltos por la consulta de búsqueda. También puede obtener una vista previa de un subconjunto de los resultados.

Cuando haya identificado el conjunto de documentos que desea examinar más adelante, puede agregar los resultados de la búsqueda a un conjunto de revisión para recopilarlos y procesarlos.

Sugerencia

Si no es cliente de E5, use la prueba de soluciones de Microsoft Purview de 90 días para explorar cómo las funcionalidades adicionales de Purview pueden ayudar a su organización a administrar las necesidades de cumplimiento y seguridad de datos. Comience ahora en el centro de pruebas de portal de cumplimiento Microsoft Purview. Obtenga más información sobre los términos de suscripción y evaluación.

Búsqueda de estadísticas para las estimaciones de recopilación

En esta sección se describen las estadísticas disponibles para las estimaciones de recopilación. Estas estadísticas están disponibles en la pestaña Estadísticas de búsqueda de la página de control flotante de una estimación de colección.

Estimaciones de recopilación

En esta sección se muestra un resumen gráfico de los elementos estimados devueltos por la colección. Esto indica el número de elementos que coinciden con los criterios de búsqueda de la colección. Esta información proporciona una idea sobre el número estimado de elementos devueltos por la colección.

  • Elementos estimados por ubicaciones: el número total de elementos estimados devueltos por la colección. También se muestra el número específico de elementos ubicados en buzones y ubicados en sitios.
  • Ubicaciones estimadas con aciertos: el número total de ubicaciones de contenido que contienen elementos devueltos por la colección. También se muestra el número específico de ubicaciones de buzón y sitio.
  • Volumen de datos por ubicación (en MB): tamaño total de todos los elementos estimados devueltos por la colección. También se muestra el tamaño específico de los elementos de buzón y los elementos de sitio.

Sección Estimaciones de recopilación para una estimación de recopilación.

Informe de condiciones

En esta sección se muestran estadísticas sobre la consulta de búsqueda de recopilación y el número de elementos estimados que coincidieron con diferentes partes de la consulta de búsqueda. Puede usar estas estadísticas para analizar el número de elementos que coinciden con cada componente de la consulta de búsqueda. Esto puede ayudarle a refinar los criterios de búsqueda de la colección y, si es necesario, restringir el ámbito de la colección.

  • Tipo de ubicación: tipo de ubicación de contenido al que se aplican las estadísticas de consulta. El valor de Exchange indica una ubicación de buzón; Un valor de SharePoint indica una ubicación del sitio.
  • Parte: la parte de la consulta de búsqueda a la que se aplican las estadísticas. Principal indica la consulta de búsqueda completa. La palabra clave indica que las estadísticas de la fila son para una palabra clave específica. Si usa una lista de palabras clave cuando para la consulta de búsqueda de la colección, las estadísticas de cada componente de la consulta se incluyen en esta tabla.
  • Condición: componente real (palabra clave o condición) de la consulta de búsqueda que se ejecutó para la estimación de colección que devolvió las estadísticas mostradas en la fila correspondiente.
  • Ubicaciones con aciertos: número de ubicaciones de contenido (especificadas por la columna Tipo de ubicación ) que contienen elementos que coinciden con la consulta principal o de palabra clave enumerada en la columna Condición .
  • Elementos: el número de elementos (de la ubicación de contenido especificada) que coinciden con la consulta enumerada en la columna Condición . Como se explicó anteriormente, si un elemento contiene varias instancias de una palabra clave que se está buscando, solo se cuenta una vez en esta columna.
  • Tamaño (MB): el tamaño total de todos los elementos que se encontraron (en la ubicación de contenido especificada) que coinciden con la consulta de búsqueda en la columna Condición .

Sección informe de condición para una estimación de recopilación.

Ubicaciones principales

En esta sección se muestran estadísticas sobre las ubicaciones de contenido específicas con la mayoría de los elementos devueltos por la colección.

  • Ubicación: el nombre de la ubicación (la dirección de correo electrónico de los buzones y la dirección URL de los sitios).
  • Tipo de ubicación: un buzón tendrá un tipo de Exchange y los sitios de SharePoint tendrán un tipo de SharePoint .
  • Elementos: número estimado de elementos en la ubicación de contenido devuelta por la colección.
  • Tamaño: tamaño total de los elementos estimados en cada ubicación de contenido.

Sección Ubicaciones principales para una estimación de colección.

Estadísticas e informes para colecciones confirmadas

En esta sección se describen las estadísticas que están disponibles después de confirmar una colección en un conjunto de revisión, incluido el número real de elementos agregados al conjunto de revisión. Estas estadísticas (además de la información del conjunto de carga) proporcionan información histórica sobre el contenido agregado a un caso.

Después de confirmar una colección en un conjunto de revisión, se muestran las pestañas siguientes en la página de control flotante de la conexión confirmada. Cada una de estas pestañas contiene diferentes tipos de información sobre la colección.

Pestañas en la página de control flotante de la colección confirmada.

Pestaña Resumen de colecciones

La pestaña Resumen de las colecciones confirmadas contiene varias secciones que proporcionan información sobre los elementos de la colección, las estimaciones de elementos y las ubicaciones, la indexación, los tipos de archivo, etc.

Información general de la colección (versión preliminar)

La sección Información general de la colección de la pestaña Resumen de un conjunto de revisión confirmado contiene información sobre cómo se encontraron, recuperaron y procesaron los elementos como parte de la colección. La información de esta sección es un resumen de la información recopilada y mostrada durante la estimación inicial de la recopilación e incluye información recopilada y procesada durante la confirmación de la recopilación en el conjunto de revisión. Puede usar la información de esta sección para ayudar a mejorar la comprensión sobre cómo evolucionan los datos de recopilación finales a partir de los datos de estimación durante la confirmación y el procesamiento de la recopilación.

Esta información se segmenta y se muestra en las subs sections siguientes:

  • Ubicaciones con aciertos: en esta sección se resume el número de ubicaciones buscadas y el número de ubicaciones con aciertos en función de las condiciones definidas en la estimación de la colección. También muestra el número y el tipo de ubicaciones buscadas.

    Ubicaciones con aciertos.

  • Estimaciones previas a la recopilación: en esta sección se resume el número de elementos y el tamaño del total de elementos calculados para la estimación de la colección (antes de que se confirme la colección). También se muestra un recuento de los elementos que se indizaron parcialmente .

    Estimaciones previas a la recopilación.

  • Elementos de colección: en esta sección se muestra el tipo, el recuento y una descripción de todos los elementos recuperados de ubicaciones con aciertos durante la confirmación de la colección en el conjunto de revisión. Durante este proceso, puede haber alguna adición y consolidación de elementos durante el procesamiento. Las adiciones y consolidaciones pueden incluir tipos incluidos en la tabla siguiente:

    Tipo de elemento Descripción del tipo de elemento
    Elementos con aciertos Número estimado de elementos encontrados por la búsqueda.
    Revisar los duplicados del conjunto Los elementos que ya están en el mismo conjunto de revisión no se recopilan.
    Buscar duplicados No se recopilan instancias duplicadas de los mismos elementos.
    Todas las versiones Se recopilan todas las versiones de elementos de SharePoint.
    Versiones históricas Se recopilan las versiones históricas mantenidas por SharePoint.
    Datos adjuntos en la nube Los datos adjuntos en la nube se identifican y recopilan de vínculos de SharePoint.
    Versión como compartida Las versiones compartidas de los elementos se recopilan además de sus versiones más recientes.
    Conversaciones contextuales de Teams Se recopilan mensajes de chat adicionales que podrían ser relevantes.
    Transcripciones de chat consolidadas Los mensajes de chat recopilados se consolidan en menos transcripciones HTML.
    Excepciones de recuperación Tiempo de espera de acceso, archivos vacíos y otras excepciones.
    Total de elementos recopilados Número total de elementos recopilados de varias ubicaciones.
  • Procesamiento para revisar conjunto: en esta sección se muestra el tipo, el recuento y la descripción de los elementos que se agregaron al conjunto de revisión desde la estimación de la colección. Los elementos se descomprimen, examinan para buscar texto, se vuelven a indexar y se procesan como preparación para la revisión.

    Procesamiento para revisar el conjunto.

Contenido de la colección

La sección Contenido de la colección de la pestaña Resumen de un conjunto de revisión confirmado contiene estadísticas y otra información sobre los elementos que se recopilaron de los orígenes de datos de la colección y se agregaron al conjunto de revisión.

  • Total de elementos extraídos. Número total de elementos agregados al conjunto de revisión. Este número indica la suma de elementos primarios y secundarios agregados al conjunto de revisión.

    Sugerencia

    Mantenga el cursor sobre las barras de elementos primarios o secundarios para mostrar el número total de elementos primarios o secundarios.

  • Elementos primarios. Número de elementos devueltos por la colección que se usó para recopilar los elementos que se agregaron al conjunto de revisión. Este número corresponde (y es igual a) el número estimado de elementos que se muestra en la sección Parámetros de colección. Número de elementos primarios que recopila información que se usó para recopilar los elementos que se agregaron al conjunto de revisión.

    Un elemento primario puede contener varios elementos secundarios. Por ejemplo, un mensaje de correo electrónico es un elemento primario si contiene un archivo adjunto o tiene datos adjuntos en la nube. En este caso, el archivo adjunto o el archivo de destino de los datos adjuntos en la nube se considera un elemento secundario. Al confirmar una colección, los elementos primarios y los elementos secundarios correspondientes (como archivos adjuntos y datos adjuntos en la nube) se agregan al conjunto de revisión como elementos o archivos individuales.

  • Elementos secundarios. Número de elementos secundarios agregados al conjunto de revisión. Solo los elementos secundarios que son datos adjuntos de archivos y datos adjuntos en la nube se agregan al conjunto de revisión como archivos individuales. Otros tipos de elementos secundarios, como las firmas de correo electrónico y las imágenes, se extraen de un elemento primario y, a continuación, se procesan mediante reconocimiento óptico de caracteres (OCR) para extraer cualquier texto del elemento secundario. A continuación, el texto extraído de estos tipos de elementos secundarios se agrega a su elemento primario para que pueda verlo en el conjunto de revisión. Al no agregar elementos secundarios al conjunto de revisión como un archivo independiente, eDiscovery (Premium) ayuda a simplificar el proceso de revisión limitando el número de elementos potencialmente inmateriales en el conjunto de revisión.

  • Elementos únicos. Número de elementos únicos agregados al conjunto de revisión. Los elementos únicos son únicos para el conjunto de revisión. Todos los elementos son únicos cuando se agrega la primera colección a un nuevo conjunto de revisión porque no había elementos anteriores en el conjunto de revisión.

  • Elementos duplicados identificados. Número de elementos de la colección que no se agregaron al conjunto de revisión porque el mismo elemento ya existe en el conjunto de revisión. Las estadísticas sobre elementos duplicados pueden ayudar a explicar las diferencias entre el número de elementos estimados de una estimación de colección y el número real de elementos agregados al conjunto de revisión.

Indización

La sección Indexación de la pestaña Resumen de un conjunto de revisión confirmado contiene información de indexación sobre los elementos agregados al conjunto de revisión.

  • Nuevos elementos indexados. Número de elementos que se indizaron recientemente antes de agregarlos al conjunto de revisión. Los ejemplos de un elemento recién indexado son elementos secundarios extraídos de un elemento primario y, a continuación, indizados antes de que se agreguen al conjunto de revisión. Además, los elementos que no se encuentran en orígenes de datos de custodia y ubicaciones de contenido que no son de custodia que aparecen en la pestaña Orígenes de datos en el caso se indexan antes de que se agreguen a la revisión. Por ejemplo, los elementos recién indexados incluirían elementos recopilados de ubicaciones adicionales.

  • Elementos indexados actualizados. Número de elementos indizados parcialmente que se indexaron correctamente y se agregaron al conjunto de revisión. Esta estadística indica los elementos indizados parcialmente de las ubicaciones de contenido custodial y no custodial Pestaña Orígenes de datos que se indexaron correctamente cuando la colección se ha confirmado en el conjunto de revisión.

  • Errores de indexación. Número de elementos indizados parcialmente que no se pudieron indexar antes de agregarlos al conjunto de revisión. Estos elementos pueden requerir la corrección de errores.

Tipos de archivo de colección

La sección Tipos de archivo de colección de la pestaña Resumen de un conjunto de revisión confirmado muestra el recuento de elementos para cada tipo de archivo incluido en la colección. Los tipos de archivo incluyen el correo electrónico, la imagen, el documento, el audio, los tipos de archivo de vídeo y mucho más. Para obtener una lista completa de los tipos de archivo admitidos, vea Tipos de archivo admitidos en eDiscovery (Premium).

Errores

En la sección Errores de la pestaña Resumen de un conjunto de revisión confirmado se muestra el tipo y el número de errores encontrados durante la confirmación de recopilación. Los errores pueden incluir archivos de tamaño cero, archivos protegidos, archivos con formato incorrecto, errores internos, etc. Para descargar un informe de errores en formato .csv, seleccione Descargar el informe de errores en esta sección.

Parámetros de colección

La sección Parámetros de colección de la pestaña Resumen de un conjunto de revisión confirmado muestra la información de recopilación que se usó para recopilar los elementos que se agregaron al conjunto de revisión. Esta pestaña muestra información similar a la información de la pestaña Estadísticas de búsqueda . En esta sección se proporciona una captura rápida de la consulta de búsqueda usada por la colección, las ubicaciones de contenido que se buscaron y los resultados estimados de la colección. Como se explicó anteriormente, el número de elementos estimados de esta sección sería igual al número de elementos primarios que se muestran en la sección Contenido de la colección .

Pestaña Orígenes de datos para colecciones

La pestaña Orígenes de datos contiene información sobre los orígenes de datos de custodia y no custodia. La sección Orígenes de datos custodiales muestra todos los orígenes de datos de custodia de cada custodio incluido en la colección. La sección Orígenes de datos sin custodia muestra todos los orígenes de datos que no son de custodia para la colección. La información del origen de datos que se muestra también está disponible en la pestaña Orígenes de datos principal para cada caso.

Pestaña Estadísticas de búsqueda para colecciones

Las estadísticas mostradas en la pestaña Buscar estadísticas son las mismas estadísticas de la última vez que se ejecutó una estimación de recopilación. Esto incluye las estimaciones de recopilación, el informe de condición y las ubicaciones principales. Esta información se conserva de la estimación de la colección para la referencia histórica y se puede comparar con la colección real que se ha confirmado con el conjunto de revisión.

Diferencias entre las estimaciones de recopilación y la colección confirmada real

Al ejecutar una estimación de colección, se muestra una estimación del número de elementos (y su tamaño total) que cumplen los criterios de recopilación en la pestaña Resumen y en la sección Estimaciones de recopilación de la pestaña Estadísticas de búsqueda . Después de confirmar una estimación de colección en un conjunto de revisión, el número real de elementos (y su tamaño total) agregados al conjunto de revisión suele ser diferente de las estimaciones. En la mayoría de los casos, se agregan más elementos al conjunto de revisión de los estimados a partir de la estimación de la colección. En la lista siguiente se describen las razones más comunes de estas diferencias y sugerencias para identificarlas:

  • Elementos secundarios. Elementos secundarios (como archivos adjuntos y datos adjuntos en la nube) que se extraen de sus elementos primarios y se agregan como archivos individuales. El número de elementos secundarios puede aumentar el número de elementos que se agregan al conjunto de revisión. En general, el número de elementos primarios identificados en la sección Contenido de la colección de la pestaña Resumen de una colección confirmada debe ser igual al número de elementos estimados de la estimación de la colección.

  • Elementos duplicados. No se agregarán elementos de la estimación de colección que ya se hayan agregado al conjunto de revisión de una colección anterior. Como se explicó anteriormente, el número de elementos duplicados de la colección se muestra en la sección Contenido de la colección de la pestaña Resumen .

  • Opciones de configuración de recopilación. Al confirmar una estimación de recopilación en un conjunto de revisión, tiene que incluir subprocesos de conversación, datos adjuntos en la nube y versiones de documentos. Cualquiera de estos elementos que se agregan al conjunto de revisión no se incluye en las estimaciones de la estimación de la colección. Solo se identifican y recopilan cuando se confirma la colección. Seleccionar estas opciones probablemente aumentará el número de elementos agregados al conjunto de revisión.

    Por ejemplo, no se incluyen varias versiones de documentos de SharePoint en la estimación de la estimación de la colección. Pero si selecciona la opción para incluir todas las versiones del documento al confirmar una estimación de colección, el número real (y el tamaño total) de los elementos agregados al conjunto de revisión aumentará.

    Para obtener más información sobre estas opciones, consulte Confirmación de una estimación de recopilación en un conjunto de revisión.

Estas son otras razones por las que los resultados estimados de una estimación de colección pueden ser diferentes de los resultados confirmados reales.

  • La forma en que se calculan los resultados de las estimaciones de recopilación. Una estimación de los resultados de búsqueda devueltos por una estimación de colección es simplemente esa, una estimación (y no un recuento real) de los elementos que cumplen los criterios de consulta de colección. Para compilar la estimación de los elementos de correo electrónico, se solicita a la base de datos de Exchange una lista de los identificadores de mensaje que cumplen los criterios de búsqueda. Pero al confirmar la colección en un conjunto de revisión, la colección se vuelve a ejecutar y los mensajes reales se recuperan de la base de datos de Exchange. Por lo tanto, las diferencias pueden dar lugar a cómo se determina el número estimado de elementos y el número real de elementos.

  • Cambios que se producen entre el momento en que se estiman y confirman las estimaciones de recopilación. Al confirmar una estimación de colección en un conjunto de revisión, se vuelve a ejecutar la búsqueda para recopilar los elementos más recientes del índice de búsqueda que cumplen los criterios de búsqueda. Es posible que se hayan creado, enviado o eliminado elementos adicionales que cumplan los criterios de búsqueda en el tiempo comprendido entre la última ejecución de la estimación de recopilación y la confirmación de la estimación de la colección en un conjunto de revisión. También es posible que los elementos que estaban en el índice de búsqueda cuando se calcularon los resultados de la estimación de la colección ya no estén allí porque se purgaron de un origen de datos antes de confirmar la colección. Una manera de mitigar este problema es especificar un intervalo de fechas para una colección. Otra manera es colocar una suspensión en las ubicaciones de contenido para que los elementos se conserven y no se puedan purgar.

  • Elementos sin indexar. Si la estimación de la colección incluía la búsqueda en todos los buzones de Exchange o en todos los sitios de SharePoint, solo se agregarán al conjunto de revisión elementos sin indexar de ubicaciones de contenido que contengan elementos que coincidan con los criterios de recopilación. En otras palabras, si no se encuentra ningún resultado en un buzón de correo o sitio, los elementos sin indexar de ese buzón o sitio no se agregarán al conjunto de revisión. Sin embargo, los elementos sin indexar de todas las ubicaciones de contenido (incluso aquellos que no contienen elementos que coinciden con la consulta de colección) se incluirán en los resultados de la colección estimados.

  • Elementos indizados parcialmente: la selección de esta opción agrega elementos parcialmente indizados de orígenes de datos adicionales al conjunto de revisión. Si la colección ha buscado orígenes de datos adicionales (como se especifica en la página Ubicaciones adicionales del Asistente para colecciones), es posible que haya elementos indizados parcialmente de estas ubicaciones que quiera agregar al conjunto de revisión. Los orígenes de datos custodios y no custodios normalmente no tienen elementos indizados parcialmente. Esto se debe a que el proceso de indexación avanzada vuelve a indexar elementos cuando se agregan orígenes de datos de custodia y no custodia a un caso. Además, agregar elementos parcialmente indizados aumentará el número de elementos agregados al conjunto de revisión.

    Después de agregar elementos parcialmente indizados al conjunto de revisión, puede aplicar un filtro para ver específicamente estos elementos. Para obtener más información, vea Ejemplo de escenario: Filtrar elementos parcialmente indizados

    Como alternativa, si la estimación de la colección incluía ubicaciones de contenido específicas (lo que significa que se exportarán buzones o sitios específicos donde se especifiquen en la página Ubicaciones adicionales del Asistente para la estimación de recopilación), se exportarán los elementos no indexados (que no se excluyen por los criterios de recopilación) de las ubicaciones de contenido especificadas en la búsqueda. En este caso, el número estimado de elementos sin indexar y el número de elementos no indexados que se agregan al conjunto de revisión deben ser los mismos.