Creación de un paquete de reglas y esquema sit de EDM (nueva experiencia)
Puede crear el esquema de coincidencia exacta de datos (EDM) y el tipo de información confidencial de EDM (SIT) en la nueva experiencia mediante un único flujo de trabajo en el Portal de cumplimiento de Microsoft Purview.
Sugerencia
Si no es cliente de E5, use la prueba de soluciones de Microsoft Purview de 90 días para explorar cómo las funcionalidades adicionales de Purview pueden ayudar a su organización a administrar las necesidades de cumplimiento y seguridad de datos. Comience ahora en el centro de pruebas de portal de cumplimiento Microsoft Purview. Obtenga más información sobre los términos de suscripción y evaluación.
Se aplica a
- Nueva experiencia
Si desea crear una SIT de EDM con la experiencia clásica, consulte Creación de una sit de EDM (experiencia clásica). Si necesita ayuda para decidir qué experiencia usar, consulte Elección de la experiencia de creación de SIT de EDM adecuada para usted.
Antes de empezar
Asegúrese de completar los pasos de los artículos siguientes antes de comenzar los procedimientos descritos en este artículo.
- Exportación de datos de origen para tipos de información confidencial basados en coincidencias exactas de datos
- Creación del archivo de ejemplo sit de EDM (nueva experiencia)
Si no está familiarizado con los SIT basados en EDM o su implementación, es esencial familiarizarse con los conceptos de los artículos siguientes:
- Obtener más información acerca de los tipos de información confidencial
- Obtener información sobre los tipos de información confidencial basados en coincidencias exactas de datos
- Más información sobre la coincidencia de varios tokens
- Introducción a los tipos de información confidencial basados en las coincidencias exactas de datos
- Creación de una coincidencia exacta de datos con SIT (nueva experiencia)
- Definiciones de entidad de tipos de información confidencial
Permissions
Debe tener permisos de administrador global o administrador de cumplimiento para crear, probar e implementar un tipo de información confidencial personalizada a través del portal de cumplimiento. Para obtener más información sobre los roles y permisos, consulte Acerca de los roles de administrador en Office 365.
Consideraciones importantes
A continuación se muestran varias consideraciones importantes que debe tener en cuenta al crear el esquema de EDM y los SIT basados en EDM.
Antes de seleccionar los elementos principales, revise los SIT integrados para obtener una idea de cuáles satisfacen mejor sus necesidades.
Para cada SIT de EDM, debe seleccionar al menos un elemento principal y no más de 10 elementos principales. Si tiene un campo de datos corroborativos de varios tokens, elija una de las siguientes opciones:
- Seleccione Coincidencia de varios tokens.
- Asigne los elementos de los campos de varios tokens a una SIT que pueda detectar ese contenido. (Cuantos más campos con valores únicos asigne, más preciso será el SIT de EDM. La asignación de varios campos también ayuda a mejorar el rendimiento, reducir la carga de procesamiento y evitar tiempos de espera del sistema).
Al seleccionar los elementos principales de sit, seleccione los campos que garantizan que cada fila de la tabla de datos sea única. Por ejemplo, no use campos como
FirstName
oDateOfBirth
. ¿Por qué? Dado que es probable que los nombres y las fechas de nacimiento se dupliquen en toda la tabla de datos confidenciales. En su lugar, use campos con valores únicos, comoSocialSecurityNumber
oBankAccountNumber
.Recomendación: Compile el esquema EDM a partir de un archivo de datos de ejemplo. Al seguir esta recomendación, asegúrese de que el archivo de datos de ejemplo cumple los siguientes requisitos:
- Los datos deben organizarse como una tabla, con columnas y filas. Use los nombres de campo para los encabezados de columna. (Las filas de la tabla se corresponden con los elementos de datos individuales).
- Los nombres de campo solo pueden incluir caracteres alfanuméricos.
- Los nombres de campo deben comenzar con una letra y deben constar de al menos tres caracteres alfanuméricos.
- Si no se cumplen estos requisitos de nomenclatura, pueden producirse errores al cargar el archivo de datos de ejemplo.
Si usa un archivo de ejemplo de información confidencial para configurar el SIT de EDM, el sistema sugiere el SIT existente para cada campo que detecte mejor los datos cargados, si dicho SIT está disponible. Microsoft Purview establece de forma predeterminada la coincidencia de un solo token para detectar contenido confidencial. Por lo tanto, si ningún SIT existente puede detectar los datos de un campo en el esquema EDM, aplica el modo de coincidencia de un solo token. Es fundamental asegurarse de que la SIT sugerida para cada elemento detecte la cadena exacta que desea supervisar:
- Asegúrese de que la SIT sugerida no contenga ningún carácter circundante que difiera del contenido que desea detectar.
- Asegúrese de que la SIT sugerida no excluya ninguna parte válida de la cadena tal como se almacena en la tabla de información confidencial.
- Asegúrese de que el SIT que usa coincide estrechamente con el formato de los datos que desea detectar. Por ejemplo, busque algo parecido
Nine digits with optional hyphens or spaces
a , en lugar de simplementedigits
, o compruebe enA combination of 32 characters consisting of letters and digits
lugar de simplementetext strings
.
El uso de SIT que coinciden estrechamente con el formato de los datos que intenta detectar es otra manera de mejorar la precisión de los resultados y acortar el tiempo que tarda la coincidencia en completarse.
Nota:
Todos los datos se guardan mientras navega hacia delante (Siguiente) y hacia atrás (Atrás) a través de la herramienta mientras realiza las selecciones. La navegación hacia atrás solo permite pasar de una página de nivel superior a una página de nivel superior y de una subpágina a una subpágina. No se puede navegar hacia atrás desde una página de nivel superior a la subpágina anterior o desde una subpágina a una página de nivel superior anterior.
Creación del esquema EDM y SIT
El siguiente procedimiento proporciona instrucciones paso a paso para crear el esquema de EDM y los SIT mediante la nueva experiencia. Para obtener información general conceptual y un diagrama del proceso en su conjunto, vea Información general sobre el flujo de trabajo de EDM (nueva experiencia).
Instrucciones
En el portal de cumplimiento del inquilino, vaya aClasificadores de EDM de clasificación> de datos.
Asegúrese de que el botón de alternancia Nueva experiencia de EDM esté establecido en Activado.
Elija + Crear clasificador EDM.
Asigne un nombre a SIT y agregue una descripción. El sistema usa este nombre, anexado con la palabra esquema, para el esquema asociado que genera.
Elija Siguiente.
Seleccione el método que desea usar para el esquema: cargue un archivo que contenga datos de ejemplo o defina manualmente la estructura de datos. (El procedimiento recomendado es cargar un archivo de datos de ejemplo. El resto de este procedimiento asume esta opción).
En cualquier caso, necesita la información que se describe en Creación de un archivo de ejemplo sit de EDM (nueva experiencia) para el archivo de ejemplo.Elija Siguiente.
Seleccione el archivo de ejemplo y, a continuación, seleccione Cargar archivo. Elija Siguiente.
(Si se muestran errores durante la carga, direccionamiento y, a continuación, vuelva a intentarlo).En la página Seleccionar elementos principales :
- En la columna Elemento principal , seleccione el elemento principal. Cada elemento principal debe asignarse a una SIT. El procedimiento recomendado consiste en seleccionar campos que muestren coincidencia completa en la columna Validación de coincidencia .
- En la columna Modo de coincidencia de cada campo, designe cuál de las siguientes opciones de coincidencia se aplicarán:
- Opción 1: No haga nada para aceptar el SIT sugerido por el sistema.
- Opción 2: Expanda el menú desplegable. En Tipo de información confidencial (SIT), elija el icono de lápiz (Editar) y, a continuación, seleccione otro SIT existente.
- Opción 3: En Modo de coincidencia , seleccione Token único.
- Opción 4: En Modo de coincidencia , seleccione Multi-token.
Elija Siguiente.
Configure los valores de los datos de las columnas seleccionadas.
- El botón de alternancia Usar la misma configuración para todas las columnas está establecido en Activado de forma predeterminada. Si desea usar una configuración independiente para cada campo de datos, establezca el botón de alternancia en Desactivado.
- La opción Datos en columnas no distingue mayúsculas de minúsculas está seleccionada de forma predeterminada. Para aplicar la detección que distingue mayúsculas de minúsculas , desactive esta casilla.
- Si es necesario, seleccione la opción Omitir delimitadores y signos de puntuación para los datos de todas las columnas . A continuación, puede seleccionar los delimitadores y signos de puntuación que desea omitir de una lista o escribir delimitadores personalizados y signos de puntuación que se omitirán.
Importante
Si selecciona la opción Omitir delimitadores para la columna de elemento principal del esquema, asegúrese de que el SIT al que se asigna está diseñado para que coincida con los datos con y sin los delimitadores seleccionados.
- Choose Submit.
Una vez que haya terminado, EDM genera automáticamente una regla de detección para cada uno de los elementos principales que ha identificado. También crea una regla de confianza alta y una regla de confianza media . Las reglas de confianza alta tienen más requisitos coincidentes que las reglas de confianza media, que, a su vez, tienen más requisitos que las reglas de confianza baja. (Las reglas de baja confianza se deben crear manualmente). Puede revisar y editar estas reglas en la página Configurar reglas de detección para elementos principales .
Sugerencia
Los elementos que no están seleccionados como principal se pueden seguir usando como evidencia corroborativa (complementaria). Cuantos más elementos auxiliares se encuentren en una proximidad definida a los elementos primarios, mayor será la confianza en que la coincidencia sea un verdadero positivo.
Recomendaciones
Espere al menos una hora después de crear o editar un esquema antes de descargarlo y usarlo para la carga de datos de EDM. Esto ayuda a garantizar que el esquema se haya sincronizado con el sistema. Si un esquema se descarga demasiado pronto, es posible que se muestre un mensaje de error al intentar descargar el esquema a través de la línea de comandos.
No use el agente de carga de EDM para descargar, editar manualmente y, a continuación, volver a cargar un esquema. Al hacerlo, se produce un error porque el uso del agente de carga de EDM para descargar un esquema agrega etiquetas al esquema que no pasan las comprobaciones de creación de esquemas.
Para asegurarse de que se detectan todas las pruebas corroborativas, realice una de las siguientes acciones: - Recorte de campos de evidencia corroborativa de varios tokens al número máximo de tokens admitidos por la característica de varios tokens (actualmente cinco tokens).
: asigne el campo de varios tokens a una SIT que pueda detectar completamente los datos de varios tokens. - Después de crear o editar el SIT de EDM, pruébelo con el siguiente cmdlet de PowerShell y espere 24 horas antes de probarlo en una solución de directiva de prevención de pérdida de datos (DLP).
Test-DataClassification -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]”