Share via


Crear un archivo de muestra EDM SIT (nueva experiencia)

La creación y puesta a disposición de un tipo de información confidencial (SIT) basado en una coincidencia exacta de datos (EDM) es un proceso de varias fases. Se pueden usar en las directivas de prevención de pérdida de datos de Microsoft Purview, eDiscovery y determinadas tareas de gobernanza de contenido.

Sugerencia

Si no es cliente de E5, use la prueba de soluciones de Microsoft Purview de 90 días para explorar cómo las funcionalidades adicionales de Purview pueden ayudar a su organización a administrar las necesidades de cumplimiento y seguridad de datos. Comience ahora en el centro de pruebas de portal de cumplimiento Microsoft Purview. Obtenga más información sobre los términos de suscripción y evaluación.

Se aplica a

  • Nueva experiencia

Si quiere crear una sit de EDM con la experiencia clásica, consulte Creación de una experiencia clásica sit de EDM.

Antes de empezar

Dar formato al archivo de ejemplo

El sistema extraerá los nombres de columna del archivo de ejemplo para crear el esquema y recomendará los SIT base a los que asignar los datos de campo de ejemplo. Debe tener el mismo formato que el archivo de tabla de información confidencial de origen y debe contener valores sintéticos que sean representativos de los datos reales. El archivo se puede guardar en .csv (valores separados por comas), .tsv (valores separados por tabulaciones) o en formato separados por canalización (|), pero debe ser el mismo que el archivo de tabla de información confidencial de origen real. El formato .tsv se recomienda en los casos en los que los valores de datos incluyen comas, como direcciones postales.

  • Use entre 10 y 20 filas de datos para asegurarse de que el sistema tiene suficientes ejemplos con los que trabajar.
  • Los valores de campo que contienen comas deben estar entre comillas ".
  • La primera fila debe ser la fila de encabezado y contener nombres de columna.
  • El archivo debe contener al menos una fila de datos.
  • Cada fila de datos debe contener el número correcto de campos, correspondientes a los encabezados.
  • El archivo de ejemplo puede contener hasta 32 columnas.
  • El archivo de ejemplo no puede superar los 2,5 MB de tamaño.
  • Los nombres de columna (campo) deben comenzar con una letra, tener al menos tres caracteres de largo y constar solo de caracteres alfanuméricos (A-Z, a-z, 0-9) y no pueden incluir espacios, caracteres de subrayado u otros caracteres especiales.

Por ejemplo, si los datos reales usan el formato delimitado por tabulaciones (.tsv) y tiene este aspecto:

imagen que muestra una tabla separada por tabulaciones con cuatro columnas y tres filas de datos de datos reales artificiales

A continuación, el archivo de ejemplo debe tener los mismos encabezados de columna, pero usar valores sintéticos para las filas, como este

FirstName LastName PatientNumber CreditCardNumber
Eric Salomón 987-65-4321 9000000000000000
Lisa Taylor 123-45-6789 500000000000000
Andre Lawson 234-56-7890 200000000000000

Uso de las plantillas de archivo de ejemplo

Si se encuentra en las verticales de la industria de servicios financieros de EE. UU., U.S. Financial Services o U.S. Insurance, puede empezar con las siguientes plantillas de archivo de ejemplo para acelerar el proceso de creación de archivos de ejemplo. Estos archivos contienen los encabezados de columna más usados en los sectores respectivos, así como valores sintéticos en los campos.

Para usar estas plantillas:

  1. Descargue la plantilla de archivo de ejemplo para el sector.
  2. Compare los encabezados de columna de la plantilla con los datos de origen reales y elija los que desea usar como campos principales en el archivo de ejemplo personalizado.
  3. Compare el formato de los datos de origen reales con el formato de los valores sintéticos. Cambie el formato de los valores sintéticos para que coincidan con el formato de los valores de datos de origen.
  4. Guarde el archivo de ejemplo personalizado para usarlo al crear el esquema sit de EDM y el paquete de reglas.

Sugerencia

Al trabajar en la nueva experiencia, tiene la opción de cargar un archivo de ejemplo o escribir los valores de archivo de ejemplo manualmente. Se recomienda crear el archivo de ejemplo.

Paso siguiente