Probar un tipo de información confidencial de coincidencia exacta de datos

Sugerencia

Si no es cliente de E5, use la prueba de 90 días de soluciones de Microsoft Purview para explorar cómo las funcionalidades adicionales de Purview pueden ayudar a su organización a administrar las necesidades de cumplimiento y seguridad de los datos. Comience ahora en el centro de pruebas del portal de cumplimiento de Microsoft Purview. Obtenga más información sobre términos de suscripción y prueba.

Se aplica a

Una vez creado el tipo de información confidencial (SIT) de coincidencia exacta de datos (EDM) y una hora después de comprobar que la tabla de información confidencial ha terminado de cargarse e indexarse, puede probar si detecta o no la información que desea proteger mediante la función Test de la sección Tipos de información confidencial del Portal de cumplimiento de Microsoft Purview.

Nota:

Los cambios en una SIT de EDM existente pueden tardar algún tiempo en propagarse a través del sistema. Si realiza cambios en una SIT de EDM para solucionar problemas de detección, asegúrese de esperar al menos una hora después de realizar esos cambios antes de usar la función Test para validar su impacto.

Independientemente del método que use para las pruebas, los resultados de la prueba incluirán coincidencias tanto para el SIT de EDM específico como para los elementos primarios configurados para esa SIT de EDM.

Métodos para probar el SIT de EDM

Hay dos métodos que puede usar para probar el SIT de EDM.

Método Disponible en nueva experiencia de EDM Disponible en la experiencia EDM nueva y clásica
Método de tipo de información confidencial (SIT)
Método de clasificadores EDM No

Nota:

Si usa la experiencia clásica de EDM, debe usar el método SIT.

Prueba de una SIT de EDM con el método De tipos de información confidencial

Para probar una SIT de EDM con el método Tipos de información confidencial , siga estos pasos.

Seleccione la pestaña adecuada para el portal que está usando. Para obtener más información sobre el portal de Microsoft Purview, consulte Portal de Microsoft Purview. Para más información sobre el portal de cumplimiento, consulte portal de cumplimiento Microsoft Purview.

  1. Inicie sesión en el portal > de Microsoft PurviewInformation Protection> Tipos deinformación confidencialdeClassifiers>.

  2. Seleccione el SIT de EDM en la lista y, a continuación, seleccione el icono Prueba .

  3. En el panel flotante, cargue un archivo que contenga los datos que desea detectar. Por ejemplo, cree un archivo que contenga un subconjunto de las filas de la tabla de información confidencial. Si usó la característica de coincidencia configurable en el esquema para definir delimitadores omitidos, asegúrese de que el archivo de ejemplo incluye ejemplos con y sin esos delimitadores.

  4. Elija Probar.

  5. Después de cargar y examinar el archivo, compruebe si hay coincidencias con el SIT de EDM.

  6. Si la función Test de sit detecta una coincidencia, compruebe que sit no la está recortando o extrayendo el elemento coincidente incorrectamente. Entre los problemas comunes se incluyen los SIT que:

    • Extraer solo una subcadena de la cadena completa que se debe detectar
    • Recoger solo la primera palabra de una cadena de varias palabras
    • Incluir símbolos o caracteres adicionales en la extracción

Para obtener más información sobre el uso de expresiones regulares, vea Regular Expression Language - Quick Reference(Lenguaje de expresiones regulares: referencia rápida).

Prueba del sit de EDM con el método clasificador de EDM

Seleccione la pestaña adecuada para el portal que está usando. Para obtener más información sobre el portal de Microsoft Purview, consulte Portal de Microsoft Purview. Para más información sobre el portal de cumplimiento, consulte portal de cumplimiento Microsoft Purview.

  1. Inicie sesión en el portal > de Microsoft PurviewInformation Protection>Clasificadores de EDM deClassifiers>.

  2. Asegúrese de que el botón de alternancia Nueva experiencia de EDM esté establecido en Activado.

  3. Seleccione el SIT de EDM en la lista y, a continuación, seleccione el icono Prueba .

  4. Cargue un archivo que contenga los datos que desea detectar. Por ejemplo, cree un archivo que contenga un subconjunto de las filas de la tabla de información confidencial. Si usó la característica de coincidencia configurable en el esquema para definir delimitadores omitidos, asegúrese de que el archivo de ejemplo incluye ejemplos con y sin esos delimitadores.

  5. Después de cargar y examinar el archivo, compruebe si hay coincidencias con el SIT de EDM.

  6. Si la función Test de sit detecta una coincidencia, compruebe que sit no la está recortando o extrayendo el elemento coincidente incorrectamente. Entre los problemas comunes se incluyen los SIT que:

    • Extraer solo una subcadena de la cadena completa que se debe detectar
    • Recoger solo la primera palabra de una cadena de varias palabras
    • Incluir símbolos o caracteres adicionales en la extracción

Prueba de EDM SIT mediante PowerShell

Para probar con PowerShell, use el siguiente cmdlet de PowerShell:

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Independientemente del método que use para las pruebas, los resultados de la prueba incluirán coincidencias tanto para el SIT de EDM específico como para los elementos primarios configurados para esa SIT de EDM.

Nota:

Al crear o editar un tipo de información confidencial de EDM o el SIT principal en el que se basa un tipo EDM, todo el contenido nuevo (así como el contenido que se modifica después de realizar cambios en los SIT) se rastreará para el contenido que coincida con las nuevas definiciones. Sin embargo, el contenido preexistente no se rastreará hasta que se modifique o vuelva a indexar.

Para forzar el re rastreo del contenido existente en un sitio o biblioteca de SharePoint, o en OneDrive, siga las instrucciones de Solicitud manual de rastreo y re indexación de un sitio, una biblioteca o una lista.

Prueba de EDM SIT con directivas de protección de la información

Puede ver dónde se usa el SIT de EDM y qué precisión tiene en producción si lo usa en directivas:

  1. Cree una directiva de etiquetado automático y ejecútelo en Información general de simulación.

  2. Agregue contenido que desencadenará el SIT de EDM, junto con el contenido que no desencadenará el SIT de EDM, a una ubicación que la directiva está supervisando.

  3. Abra la pestaña Elementos para revisar para comprobar las coincidencias.

  4. Ajuste las directivas según corresponda.

Una vez que esté satisfecho con los resultados de las pruebas y el ajuste, el SIT personalizado basado en EDM está listo para su uso en las directivas de protección de la información, por ejemplo:

Sugerencias para solucionar problemas

Si EDM SIT no detecta ninguna coincidencia en los datos, las sugerencias siguientes podrían ayudarle a diagnosticar el problema.

Incidencia Consejos para solucionar el problema
No se encontraron coincidencias Confirme que los datos confidenciales se cargaron correctamente con los comandos explicados en Hash y cargue la tabla de origen de información confidencial para obtener datos exactos que coincidan con los tipos de información confidencial.
No se encontraron coincidencias Pruebe el SIT que usó al configurar el elemento principal en cada uno de los patrones. Esta prueba comprueba si sit puede coincidir con los ejemplos del elemento. El uso de sit definido incorrectamente como elemento de clasificación de una SIT de EDM es la causa más común de errores de detección en EDM.
El SIT seleccionado para un elemento principal en el tipo EDM no encuentra una coincidencia en el elemento o encuentra menos coincidencias de las esperadas Confirme que sit admite los separadores y delimitadores que se producen en el contenido. Asegúrese de incluir los delimitadores omitidos definidos en el esquema.
La SIT asociada al elemento principal busca coincidencias en el contenido, pero EDM SIT no.
  • Compruebe si las instrucciones REGEX detectan delimitadores de espacios en blanco al principio o al final de un elemento que desea detectar. Por ejemplo, busque instrucciones que incluyan el \s delimitador. Si se incluyen delimitadores de espacios en blanco, el espacio en blanco no coincidirá con el valor hash de la tabla de datos. En su lugar, use un delimitador de palabras, como \b.
  • Compruebe las instrucciones REGEX para asegurarse de que capturan toda la cadena que desea detectar, no solo una subcadena. Por ejemplo, considere este patrón para las direcciones de correo electrónico: \b[a-zA-Z]{2,30}@[a-zA-Z]{2,20}.[a-zA-Z]{2,3}\b. Este patrón coincidirá user@contoso.comcorrectamente con , pero solo se capturará user@contoso.co.jp en un formulario incompleto.
Una SIT de EDM con elementos primarios, pero sin elementos secundarios definidos, detecta elementos pero no detecta coincidencias (o detecta menos coincidencias de las esperadas) cuando se requieren elementos primarios y secundarios. Si los valores de una columna usada para la evidencia secundaria no se componen de una sola palabra o de cadenas que no contienen espacios, comas u otros separadores de palabras, hay dos maneras de probar:
  1. Seleccione la opción de coincidencia de varios tokens .
  2. Asocie los valores a una SIT que use un REGEX diseñado para detectar cadenas de varias palabras que siguen el patrón deseado (por ejemplo, un número fijo de palabras consecutivas que comienzan con un carácter en mayúsculas) o un diccionario de palabras clave que enumera todos los valores únicos de esa columna. Por ejemplo, si hay una columna de evidencia adicional para la ciudad o residencia de una persona, puede crear una lista con todos los nombres de ciudad únicos de la tabla y, a continuación, usarla para crear un tipo de información confidencial basada en diccionarios.

Use esta SIT como elemento de clasificación para la columna correspondiente en el SIT de EDM mediante la exportación y edición de la definición sit de EDM en XML. Para obtener más información, consulte Creación manual de un paquete de reglas.
La función de prueba SIT no detecta ninguna coincidencia. Compruebe que el SIT seleccionado incluye requisitos para palabras clave adicionales u otras validaciones. Para los SIT integrados, consulte Definiciones de entidades de tipo de información confidencial para determinar cuáles son los requisitos mínimos para coincidir con cada tipo.
La funcionalidad De prueba funciona, pero los elementos de SharePoint o OneDrive no se detectan en las reglas dlp o de etiquetado automático Compruebe que los documentos en los que espera encontrar coincidencias aparezcan realmente en el explorador de contenido. Las coincidencias solo se detectan en el contenido que se crea después de aplicar los cambios en sit. Por lo tanto, si no aparecen las coincidencias esperadas, vuelva a rastrear los sitios y bibliotecas de los elementos preexisterios. Para obtener más información sobre cómo volver a rastrear SharePoint y OneDrive, consulte Rastreo manual de solicitudes y re indexación de un sitio, una biblioteca o una lista.
Las reglas dlp o de etiquetado automático que requieren varias coincidencias no se desencadenan Asegúrese de que se cumplen los requisitos de proximidad para el SIT de EDM y los SIT base. Por ejemplo, si la distancia máxima entre el elemento principal y las palabras clave auxiliares es de 300 caracteres, pero las palabras clave solo están presentes en la primera fila de una tabla larga, es probable que solo las primeras filas de valores coincidentes cumplan los requisitos de proximidad. Modifique las definiciones de SIT para admitir reglas de proximidad más relajadas o use la opción Anywhere en el documento para las condiciones de pruebas adicionales.
La detección de una SIT de EDM es incoherente o errática Asegúrese de que el SIT que usó como base para el elemento principal de EDM SIT no detecta contenido innecesario. El uso de una SIT que coincida con demasiado contenido no relacionado, como cualquier palabra, cualquier número o todas las direcciones de correo electrónico, puede hacer que el servicio ignore las coincidencias pertinentes. Compruebe el número de elementos de contenido que coinciden con el tipo confidencial que usó para los elementos principales en el explorador de contenido.

Para calcular si sit coincide con demasiado contenido:
  1. Divida el número de elementos de contenido en el Explorador de contenido de Microsoft Purview por el número de días transcurridos desde que se creó el tipo confidencial.
  2. Si el número de coincidencias por día está en el intervalo de cientos de miles o más, es posible que el SIT principal sea demasiado amplio.

Para obtener recomendaciones y procedimientos recomendados sobre cómo seleccionar el tipo de información confidencial adecuado para una SIT de EDM, consulte Información sobre los tipos de información confidencial basados en coincidencias exactas de datos.