Compartir a través de


Modificación del esquema de coincidencia exacta de datos para usar la coincidencia configurable

Sugerencia

Si no es cliente de E5, use la prueba de 90 días de soluciones de Microsoft Purview para explorar cómo las funcionalidades adicionales de Purview pueden ayudar a su organización a administrar las necesidades de cumplimiento y seguridad de los datos. Comience ahora en el centro de pruebas de Microsoft Purview. Obtenga más información sobre términos de suscripción y prueba.

Se aplica a

  • Creación del tipo de información confidencial (SIT) de coincidencia exacta de datos (EDM) mediante PowerShell.

La clasificación basada en la coincidencia de datos exactos le permite crear tipos de información confidencial personalizados que hacen referencia a valores exactos en una base de datos de información confidencial. Cuando necesite permitir variantes de una cadena exacta, puede usar la coincidencia configurable para indicar a Microsoft Purview que ignore mayúsculas y minúsculas y algunos delimitadores.

Importante

Use este procedimiento para modificar un esquema EDM y un archivo de datos existentes.

  1. Desinstale la EdmUploadAgent.exe del equipo que usa para conectarse a Microsoft 365 con fines de carga de archivos de datos y esquema EDM

  2. Descargue el archivo deEdmUploadAgent.exe adecuado para su suscripción mediante los vínculos siguientes:

    • Comercial + GCC : la mayoría de los clientes comerciales deben usar esta opción
    • GCC-High : esta opción está específicamente para suscriptores en la nube gubernamental de alta seguridad
    • DoD: esta opción está específicamente para clientes en la nube del Departamento de Defensa de Estados Unidos
  3. Autorice al agente de carga de EDM, abra la ventana del símbolo del sistema (como administrador) y ejecute el siguiente comando:

    EdmUploadAgent.exe /Authorize
    
  4. Si no tiene una copia actual del esquema existente, debe descargar una copia del esquema existente. Para ello, ejecute este comando:

    EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
    
  5. Personalice el esquema para que cada columna use caseInsensitive y/o ignoredDelimiters. El valor predeterminado para caseInsensitive es "false" y para ignoredDelimiters, el valor predeterminado es una cadena vacía.

    Nota:

    El tipo de información confidencial personalizada subyacente o el tipo de información confidencial integrado que se usa para detectar el patrón regex general debe admitir la detección de las variaciones de entrada enumeradas con ignoreDelimiters. Por ejemplo, el tipo de información confidencial número de seguro social (SSN) de EE. UU. integrado puede detectar variaciones en los datos que incluyen guiones, espacios o falta de espacios entre los números agrupados que componen el SSN. Como resultado, los únicos delimitadores que son pertinentes para incluir en los datos de ignoredDelimiters EDM para SSN son: guion y espacio.

    Este es un esquema de ejemplo que simula la coincidencia sin distinción entre mayúsculas y minúsculas mediante la creación de las columnas adicionales necesarias para reconocer las variaciones de mayúsculas y minúsculas en los datos confidenciales.

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
               <Field name="PolicyNumber" searchable="true" />
               <Field name="PolicyNumberLowerCase" searchable="true" />
               <Field name="PolicyNumberUpperCase" searchable="true" />
               <Field name="PolicyNumberCapitalLetters" searchable="true" />
      </DataStore>
    </EdmSchema>
    

    En el ejemplo anterior, las variaciones de la columna original PolicyNumber no son necesarias si se agregan y caseInsensitiveignoredDelimiters .

    Para actualizar este esquema de modo que EDM use la coincidencia configurable, use las caseInsensitive marcas y ignoredDelimiters . Este es el aspecto que tiene:

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
             <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
      </DataStore>
    </EdmSchema>
    

    Para obtener información sobre los caracteres admitidos por la ignoredDelimiters marca, vea Uso de los campos caseInsensitive e ignoreDelimiters.

  6. Conectarse a Security & Compliance PowerShell

    Nota:

    Si su organización ha configurado la clave de cliente para Microsoft 365 en el nivel de inquilino, coincidencia exacta de datos usará su funcionalidad de cifrado automáticamente. Esto solo está disponible para los inquilinos con licencia E5 en la nube comercial. Para obtener más información, consulte Introducción a la clave de cliente.

  7. Actualice el esquema ejecutando el siguiente comando:

    Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    
  8. Si es necesario, actualice el archivo de datos para que coincida con la nueva versión de esquema.

    Sugerencia

    Opcionalmente, puede ejecutar una validación en el archivo CSV antes de cargarlo mediante la ejecución de:

    EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

    Por ejemplo: EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml

    Para obtener más información sobre todos los parámetros admitidos por EdmUploadAgent.exe, ejecute

    EdmUploadAgent.exe /?

  9. Abra una ventana del símbolo del sistema (como administrador) y ejecute el siguiente comando para aplicar un hash y cargar los datos confidenciales:

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]