Aumentar la precisión del clasificador

Los clasificadores, como los tipos de información confidencial (SIT) y los clasificadores entrenables, se usan en varios tipos de directivas para identificar información confidencial. Al igual que la mayoría de estos modelos, a veces identifican un elemento como confidencial que no lo es. O bien, es posible que no identifiquen un elemento como confidencial cuando realmente lo es. Estos se denominan falsos positivos y falsos negativos.

En este artículo se muestra cómo confirmar si los elementos coincidentes por un clasificador son verdaderos positivos (una coincidencia) o falsos positivos (no una coincidencia) y proporcionar comentarios de coincidencia/no coincidente . Puede usar esos comentarios para ajustar los clasificadores para aumentar la precisión. También puede enviar a Microsoft las versiones redactadas del documento, así como los comentarios de Match, Not a Match si desea ayudar a aumentar la precisión de los clasificadores que proporciona Microsoft.

Las experiencias Match, Not a match y Contextual Summary están disponibles en:

  • Explorador de contenido: para sitios de SharePoint, sitios de OneDrive
  • Página Elementos coincidentes de tipo de información confidencial: para sitios de SharePoint, sitios de OneDrive
  • Página Elementos coincidentes del clasificador entrenable: para sitios de SharePoint, sitios de OneDrive
  • Página de alertas de Prevención de pérdida de datos de Microsoft Purview (DLP): para sitios de SharePoint, OneDrive y correos electrónicos en Exchange
  • Página alertas de Microsoft Threat Protection (MTP): para sitios de SharePoint, sitios de OneDrive y correos electrónicos en Exchange

La experiencia de resumen contextual está disponible en:

  • Microsoft Purview Information Protection (MIP) Elementos coincidentes de simulación de etiquetado automático: para sitios de SharePoint, sitios de OneDrive

Sugerencia

Si no es cliente de E5, use la prueba de soluciones de Microsoft Purview de 90 días para explorar cómo las funcionalidades adicionales de Purview pueden ayudar a su organización a administrar las necesidades de cumplimiento y seguridad de datos. Comience ahora en el centro de pruebas de portal de cumplimiento Microsoft Purview. Obtenga más información sobre los términos de suscripción y evaluación.

Se aplica a

Clasificador Resumen contextual Panel de vista previa redactada Coincidencia y no coincidencia
SENTARSE
SIT personalizado No
SIT de huella digital No No
Coincidencia exacta de datos con SIT No* No No
Entidades con nombre No* No No
Examen de credenciales No* No No
Clasificadores entrenables integrados Sí**
Clasificador personalizado que se puede entrenar No No

* Estos clasificadores se admiten en elementos coincidentes de simulación de etiquetado automático de MIP: para sitios de SharePoint y sitios de OneDrive.

** Lista de clasificadores entrenables integrados y que admiten el resumen contextual.

Importante

Los comentarios de coincidencia o no coinciden y los elementos de compatibilidad de la experiencia de resumen contextual en: sitios de SharePoint & sitios de OneDrive: para el Explorador de contenido, tipo de información confidencial y elementos clasificadores entrenables coincidentes, alertas DLP y alertas MTP. Correos electrónicos en Exchange: para alertas DLP y alertas MTP. La experiencia de resumen contextual admite elementos en: sitios de SharePoint y sitios de OneDrive: para elementos coincidentes de simulación de MIP

Licencias y suscripciones

Para obtener información sobre las licencias y suscripciones pertinentes, consulte los requisitos de licencias para análisis de clasificación de datos: Información general sobre el contenido & El Explorador de actividad.

Limitaciones conocidas

  • El resumen contextual solo muestra un número limitado de coincidencias en cualquier elemento determinado, no todas las coincidencias.
  • La experiencia de resumen contextual y comentarios solo está disponible para los elementos creados o actualizados después de habilitar la experiencia de comentarios para el inquilino. Es posible que los elementos que se clasificaron antes de habilitar la característica no tengan disponible el resumen contextual y la experiencia de comentarios.

Cómo evaluar la precisión de la coincidencia y proporcionar comentarios

La experiencia de resumen contextual, en la que se indica si un elemento coincidente es un verdadero positivo (coincidencia) o un falso positivo (no una coincidencia), es similar en todos los lugares que aparece.

Importante

Ya debe haber implementado directivas DLP que usen SIT o clasificadores entrenables en sitios de OneDrive, sitios de SharePoint o buzones de Exchange. También debe haber tenido coincidencias de elementos antes de que aparezcan elementos en la página Resumen contextual .

Uso del Explorador de contenido

En este ejemplo se muestra cómo usar la pestaña Resumen contextual para enviar comentarios.

  1. Abra la páginaexplorador de contenido de clasificación>de portal de cumplimiento Microsoft Purview> Data.
  2. Escriba el nombre del clasificador SIT o entrenable para el que desea comprobar las coincidencias en Filtrar en etiquetas, tipos de información o categorías.
  3. Seleccione sit.
  4. Seleccione la ubicación y asegúrese de que hay un valor distinto de cero en la columna Archivos . (Las únicas ubicaciones admitidas son SharePoint y OneDrive).
  5. Abra la carpeta y seleccione un documento.
  6. Seleccione el vínculo en la columna Tipo de información confidencial del documento para ver qué SIT coinciden con el elemento y el nivel de confianza.
  7. Elija Cerrar.
  8. Abra un documento y seleccione la pestaña Resumen contextual .
  9. Revise el elemento y confirme si es o no una coincidencia.
  10. Si es una coincidencia, elija Cerrar. Has terminado.
  11. Si no es una coincidencia, elija No una coincidencia.
  12. Si comete un error y elige la opción incorrecta, seleccione Retirar comentarios junto a Cerrar. Esto vuelve a colocar el elemento en el estado No coincide/ con.
  13. Revise el elemento y redacte o anótese cualquier texto.
  14. Elija Cerrar.

Uso de la página Elementos coincidentes de tipo de información confidencial

Puede acceder a los mismos mecanismos de comentarios en la página Tipos de información confidencial .

  1. Abra el portal de cumplimiento Microsoft Purview y vaya aClasificadores> de clasificación> de datos Tiposde información confidencial.
  2. En el campo Buscar , escriba el nombre de la SIT cuya precisión desea comprobar.
  3. Abra el SIT. Esto abre la pestaña Información general . Aquí puede ver el recuento del número de elementos que coinciden, un recuento del número de elementos que no coinciden y el número de elementos con comentarios.
  4. Seleccione la pestaña Elementos coincidentes .
  5. Abra la carpeta y seleccione un documento. Solo SharePoint, OneDrive son ubicaciones admitidas aquí. Asegúrese de que hay un valor distinto de cero en la columna Archivos .
  6. Seleccione el vínculo de la columna Tipo de información confidencial de un elemento para ver qué SIT coinciden con el elemento y el nivel de confianza.
  7. Elija Cerrar.
  8. Abra un documento y, a continuación, seleccione la pestaña Resumen contextual .
  9. Revise el elemento y confirme si es una coincidencia.
  10. Si es una coincidencia, elija Match (Coincidencia) y, a continuación, Close (Cerrar).
  11. Si no es una coincidencia, elija **Not a Match ****
  12. Si comete un error y selecciona la opción incorrecta, seleccione Retirar comentarios junto a Cerrar. Esto vuelve a colocar el elemento en el estado No coincide/ con.
  13. Elija Cerrar.

Uso de la página Elementos coincidentes del clasificador entrenable

  1. Abra el portal de cumplimiento Microsoft Purview y vaya aClasificadores> de clasificación> de datosClasificadores que se pueden entrenar clasificadores.
  2. Seleccione el clasificador que se puede entrenar cuya precisión desea comprobar.
  3. Abra el clasificador que se puede entrenar. Esto abre la pestaña Información general . Aquí puede ver el recuento del número de elementos que coinciden, un recuento del número de elementos que no coinciden y el número de elementos con comentarios.
  4. Seleccione la pestaña Elementos coincidentes .
  5. Abra la carpeta y abra un documento. Solo SharePoint, OneDrive son ubicaciones admitidas aquí. Asegúrese de que hay un valor distinto de cero en la columna Archivos .
  6. Abra un documento y, a continuación, seleccione la pestaña Resumen contextual .
  7. Revise el elemento y confirme si es una coincidencia.
  8. Si es una coincidencia, elija Match (Coincidencia) y, a continuación, elija Close (Cerrar).
  9. Si no es una coincidencia, elija **Not a Match ****
  10. Si comete un error y selecciona la opción incorrecta, elija Retirar comentarios junto a Cerrar. Esto vuelve a colocar el elemento en el estado No coincide/ con.
  11. Elija Cerrar.

Página Usar alertas de prevención de pérdida de datos

  1. Abra el portal de cumplimiento Microsoft Purview y vaya a la páginaAlertas de prevención> de pérdida de datos.
  2. Elija una alerta.
  3. Elija Ver detalles.
  4. Elija la pestaña Eventos .
  5. Maximice la pestaña Detalles .
  6. Revise el elemento y confirme si es una coincidencia.
  7. Elija Acciones.
  8. Si es una coincidencia, cierre la ventana. Has terminado.
  9. Si no es una coincidencia, elija Acciones y, a continuación, No una coincidencia.
  10. Revise el elemento y redacte o anótese cualquier texto.
  11. Cierre la ventana.

Uso de los comentarios para ajustar los clasificadores

Si los SIT o los clasificadores entrenables están devolviendo demasiados falsos positivos en función de los comentarios, pruebe algunas de estas opciones para refinarlos y aumentar su precisión.

Clasificadores que se pueden entrenar

Siga los pasos descritos en Cómo volver a entrenar un clasificador en el explorador de contenido para aumentar la precisión de un clasificador que se puede entrenar.

Tipos de información confidencial

  • Aumente los umbrales de los tipos de información confidencial encontrados para determinar la gravedad. Es correcto usar umbrales diferentes para clasificadores individuales.

  • Comprenda los niveles de confianza y cómo se definen. Pruebe a usar una confianza baja con un recuento elevado de instancias o un nivel de confianza superior con un recuento de instancias bajo.

  • Clone y modifique los SIT integrados para incluir otras condiciones, como la presencia de palabras clave, la coincidencia de valores más estricta o requisitos de formato más estrictos.

  • Modifique una SIT personalizada para excluir prefijos, sufijos o patrones conocidos. Por ejemplo, una SIT personalizada para detectar números de teléfono podría desencadenarse para cada correo electrónico si las firmas de correo electrónico o los encabezados de documento incluyen números de teléfono. Excluir las secuencias de números de teléfono de la organización de la SIT personalizada puede impedir que la regla se desencadene para cada correo electrónico o documento.

  • Incluya más SIT basados en diccionarios como condiciones para restringir las coincidencias a los elementos que hablan de los artículos pertinentes. Por ejemplo, se puede mejorar una regla para la coincidencia de diagnósticos de pacientes al requerir la presencia de palabras como diagnóstico, diagnóstico, condición, síntoma y paciente.

  • En el caso de los SIT de entidad con nombre, como Todos los nombres completos, es mejor establecer un umbral de recuento de instancias mayor, como 10 o 50. Si se detectan juntos los nombres de persona y los números de seguridad social (SSN), es más probable que los SSN sean realmente SSN y se reduzca el riesgo de que la directiva no se desencadene porque se detectan demasiados SSN.