Creación de tipos de información confidencial personalizados

Si los tipos de información confidencial preconfigurados (SIT) no satisfacen sus necesidades, puede crear y definir SIT personalizados que satisfagan sus necesidades. También puede copiar y editar una SIT integrada.

Los SIT personalizados se agregan al paquete de Microsoft.SCCManaged.CustomRulePack reglas.

Hay dos métodos para crear una nueva SIT:

Sugerencia

Si no es cliente de E5, use la prueba de 90 días de soluciones de Microsoft Purview para explorar cómo las funcionalidades adicionales de Purview pueden ayudar a su organización a administrar las necesidades de cumplimiento y seguridad de los datos. Comience ahora en el centro de pruebas del portal de cumplimiento de Microsoft Purview. Obtenga más información sobre términos de suscripción y prueba.

Antes de empezar

SKU/suscripciones y licencias

Antes de empezar a usar las directivas DLP, confirme su suscripción a Microsoft 365 y cualquier complemento.

Para obtener información sobre las licencias, consulte Suscripciones de Microsoft 365, Office 365, Enterprise Mobility + Security y Windows 11 para empresas.

Importante

El soporte técnico y el servicio al cliente de Microsoft no puede ayudar a crear clasificaciones personalizadas o patrones de expresiones regulares. Los ingenieros de soporte técnico pueden proporcionar compatibilidad limitada con la característica, por ejemplo, proporcionar patrones de expresión regular de ejemplo con fines de simulación o ayudar a solucionar problemas de un patrón de expresión regular existente que no se desencadena según lo esperado. Sin embargo, no pueden proporcionar garantías de que cualquier desarrollo personalizado que coincida con el contenido cumplirá sus requisitos u obligaciones.

Creación de una SIT personalizada desde cero

Nota:

Microsoft Purview admite la creación de SIT personalizados que usan idiomas de caracteres de doble byte, como chino, japonés y coreano. Dado que estos lenguajes no usan delimitadores como lo hacen los idiomas de un solo byte, Purview agrega un espacio entre cada palabra en idiomas que usan caracteres de doble byte. También quita caracteres especiales, como signos de puntuación.

Use el procedimiento siguiente para definir completamente un nuevo tipo de información confidencial.

Seleccione la pestaña adecuada para el portal que está usando. Para obtener más información sobre el portal de Microsoft Purview, consulte Portal de Microsoft Purview. Para más información sobre el portal de cumplimiento, consulte portal de cumplimiento Microsoft Purview.

  1. Inicie sesión en el portal de Microsoft Purview.

  2. En el portal de cumplimiento Microsoft Purview, vaya a Information Protection> Tipos deinformación confidencialdeClassifiers> y elija Crear tipo de información confidencial.

  3. Rellene los valores de Nombre y Descripción y elija Siguiente.

  4. Elija Crear patrón. Puede crear varios patrones, cada uno con diferentes elementos y niveles de confianza, a medida que defina el nuevo tipo de información confidencial.

  5. Elija el valor predeterminado del Nivel de confianza para el patrón. Los valores son Confianza baja, Confianza media y Confianza alta.

  6. Elija y defina el elemento Primary. El elemento principal puede ser una Expresión regular con un validador opcional, una lista de palabras clave, un diccionario de palabras clave o una de las funciones preconfiguradas. Para obtener más información sobre las funciones sit usadas para la prevención de pérdida de datos, vea Funciones de tipo de información confidencial. Para obtener más información sobre la fecha y los validadores de suma de comprobación, vea Validadores de expresiones regulares de tipo de información confidencial.

  7. Rellene un valor para Proximidad de caracteres.

  8. (Opcional) Si los tiene, agregue elementos de soporte. Los elementos auxiliares pueden ser una expresión regular con un validador opcional, una lista de palabras clave, un diccionario de palabras clave o una de las funciones predefinidas. Los elementos auxiliares pueden tener su propia configuración de proximidad de caracteres .

  9. (Opcional) Agregar comprobaciones adicionales de la lista de comprobaciones disponibles.

  10. Seleccione Crear.

  11. Elija Siguiente.

  12. Elija el nivel de confianza recomendado de este tipo de información confidencial.

  13. Compruebe la configuración y elija Guardar.

    Importante

    Microsoft 365 usa el rastreador de búsqueda para identificar y clasificar información confidencial en sitios de SharePoint y OneDrive. Para identificar el nuevo tipo de información confidencial personalizado en el contenido existente, se necesita volver a rastrear el contenido. El contenido se rastrea en función de una programación, pero puede volver a rastrear de forma manual el contenido de una colección de sitios, lista o biblioteca. Para obtener más información, vea Solicitar manualmente el rastreo y una nueva indexación de un sitio, una biblioteca o una lista.

  14. La pestaña Tipos de información confidencial de la página Clasificadores muestra todos los tipos de información confidencial. Elija Actualizar y, a continuación, use la herramienta de búsqueda o examine la lista para buscar el nuevo SIT.

Copia y modificación de una SIT existente

En este procedimiento se explica cómo copiar y modificar una SIT existente mediante el Portal de cumplimiento.

Como alternativa, puede copiar y modificar SIT personalizados mediante PowerShell y aprovechar las funcionalidades de coincidencia exacta de datos (EDM) de Purview. Para obtener más información sobre estos métodos, vea:

Nota:

Estos SIT no se pueden copiar:

  • Número de licencia de conducir de Canadá
  • Número de licencia de conducir de la UE
  • Número del documento nacional de identidad de la UE
  • Número de pasaporte de la UE
  • Número de la seguridad social de la UE o identificación equivalente
  • Número de identificación fiscal de la UE
  • Clasificación Internacional de Enfermedades (CIE-10-MC)
  • Clasificación Internacional de Enfermedades (CIE-9-MC)
  • Número de licencia de conducir de EE. UU.

Copia y modificación de una SIT existente mediante Microsoft Purview o el portal de cumplimiento

Seleccione la pestaña adecuada para el portal que está usando. Para obtener más información sobre el portal de Microsoft Purview, consulte Portal de Microsoft Purview. Para más información sobre el portal de cumplimiento, consulte portal de cumplimiento Microsoft Purview.

  1. Inicie sesión en el portal de Microsoft Purview.

  2. > Information Protection Clasificadores>Tipos de información confidencial y seleccione el tipo de información confidencial que desea copiar.

  3. Se abre la página de información general del tipo de información confidencial. Seleccione Copiar. Cuando la copia está lista, aparece un mensaje que indica que se creó la copia con una opción para editarla. Elija .

  4. Asigne al tipo de información confidencial un Nombre y Descripción nuevos.

  5. Puede elegir crear un nuevo patrón o editar o quitar algunos o todos los patrones existentes.

    1. Para crear un nuevo patrón, elija Crear.
    2. Para editar un patrón existente, elija el icono Editar (lápiz) situado junto al patrón que desea cambiar.
    3. Para quitar un patrón, elija el icono Eliminar situado junto al patrón que desea quitar.
  6. Al crear o editar un patrón, elija el nivel de confianza predeterminado para el patrón. Los valores son Confianza baja, Confianza media y Confianza alta.

  7. Elegir y definir el Elemento principal. El elemento principal puede ser una expresión regular, una lista de palabras clave, un diccionario de palabras clave o una de las funciones preconfiguradas. Vea Funciones de tipo información confidencial.

  8. Rellene un valor para Proximidad de caracteres.

  9. (Opcional) Si tiene elementos auxiliares o comprobaciones adicionales que desea ejecutar, agréguelos. Si es necesario, puede organizar los elementos auxiliares en grupos.

  10. Si va a crear un nuevo patrón, elija Crear. Si va a editar un patrón existente, elija Actualizar.

  11. Elija Siguiente.

  12. Confirme la selección de nivel de confianza para este tipo de información confidencial y, a continuación, elija Siguiente.

  13. Revise la configuración y, a continuación, elija Guardar.

  14. Se crea el nuevo tipo de información confidencial. En el mensaje de confirmación, elija *Listo

Nota:

La protección de información de Microsoft Purview admite idiomas de juego de caracteres de doble byte para:

  • Chino (simplificado)
  • Chino (tradicional)
  • Coreano
  • Japonés

Este soporte está disponible para tipos de información confidencial. Para obtener más información, consulteCompatibilidad de Information Protection con las notas de la versión de conjuntos de caracteres de doble byte (versión preliminar).

Sugerencia

Para detectar patrones que contienen caracteres chino/japonés y caracteres de bytes únicos, o para detectar patrones que contengan chino/japonés e inglés, defina dos variantes de la palabra clave o regex.

  • Por ejemplo, para detectar una palabra clave como "机密的document", utilice dos variantes de la palabra clave; una con un espacio entre el texto japonés y el inglés y otra sin espacio entre el texto japonés y el inglés. Por lo tanto, las palabras clave que deben agregarse en el SIT deben ser "机密的document" y "机密的document". Del mismo modo, para detectar la frase "東京オリンピック2020", se deben utilizar dos variantes: "東京オリンピック 2020" y "東京オリンピック2020"".

Junto con caracteres de byte chino, japonés o doble, si la lista de palabras clave o frases también contiene palabras no chinas o japonesas (por ejemplo, solo inglés), se recomienda crear dos diccionarios o listas de palabras clave. Cree una para palabras clave que contengan caracteres de bytes chino, japonés o doble y otra para solo inglés.

  • Por ejemplo, si desea crear una palabra clave dictionary/list con tres frases "Extremadamente confidencial", "機密性が高い" y "机密的document", debe crear dos listas de palabras clave.
    1. Extremadamente confidencial
    2. 機密性が高い, 机密的document y 机密的 document

Al crear un regex con un guion de doble byte o un punto de doble byte, asegúrese de aplicar escape a ambos caracteres de la misma manera que se escaparía un guion o un punto en un regex. Aquí hay un ejemplo de regex como referencia:

(?<!\d)([4][0-9]{3}[\-?\-\t]*[0-9]{4})

No se deben usar caracteres especiales de doble byte en la palabra clave .

Se recomienda utilizar una coincidencia de cadenas en lugar de una coincidencia de palabras en una lista de palabras clave.