Obtenga información sobre los clasificadores entrenables
Categorizar y etiquetar el contenido para que pueda protegerse y controlarse correctamente es el punto de partida para la materia de protección de la información. Microsoft Purview tiene tres maneras de clasificar el contenido: manualmente, mediante la coincidencia automatizada de patrones y el uso de clasificadores.
Sugerencia
Si no es cliente de E5, use la prueba de 90 días de soluciones de Microsoft Purview para explorar cómo las funcionalidades adicionales de Purview pueden ayudar a su organización a administrar las necesidades de cumplimiento y seguridad de los datos. Comience ahora en el centro de pruebas del portal de cumplimiento de Microsoft Purview. Obtenga más información sobre términos de suscripción y prueba.
La categorización manual del contenido requiere juicio y acción humanos. Los usuarios y administradores clasifican el contenido a medida que lo encuentran. Puede usar las etiquetas preexistetas y los tipos de información confidencial, o bien puede usar las que cree usted mismo. A continuación, puede proteger el contenido y administrar su eliminación.
Estos mecanismos de categorización incluyen la búsqueda de contenido mediante:
- Valores de metadatos o palabras clave (lenguaje de consulta de palabras clave)
- Patrones identificados anteriormente de información confidencial como el seguro social, la tarjeta de crédito o los números de cuenta bancaria (definiciones de entidades de tipo información confidencial)
- Huella digital del documento: reconocimiento de un elemento porque es una variación en una plantilla
- La presencia de cadenas exactas que coinciden con datos exactos
A continuación, las etiquetas de confidencialidad y retención se pueden aplicar automáticamente para que el contenido esté disponible para su uso en Learn about Prevención de pérdida de datos de Microsoft Purview and autoapply polices for retention labels (Información sobre las directivas de Prevención de pérdida de datos de Microsoft Purview y aplicación automática para las etiquetas de retención).
Este método de categorización es adecuado para el contenido que no se puede identificar fácilmente mediante los métodos manuales o automatizados de coincidencia de patrones. Este método de categorización está diseñado para usar un clasificador para identificar un elemento en función de lo que es el elemento, no por elementos que están en el elemento (coincidencia de patrones). Un clasificador aprende a identificar un tipo de contenido examinando cientos de ejemplos del contenido que desea detectar.
Nota
En versión preliminar: Puede ver los clasificadores que se pueden entrenar en el explorador de contenido expandiendo Clasificadores entrenables en el panel filtros. Los clasificadores que se pueden entrenar mostrarán automáticamente el número de incidentes que se encuentran en SharePoint, Teams y OneDrive, sin necesidad de etiquetar. Si no desea usar esta característica, debe presentar una solicitud con Soporte técnico de Microsoft. Esto deshabilitará la presentación de los datos confidenciales que no se usan en ninguna directiva de etiquetado en el Explorador de contenido. También puede deshabilitar el examen de los datos. Si el examen está desactivado, el etiquetado de confidencialidad y las directivas DLP con esos clasificadores no funcionarán.
Los clasificadores están disponibles para su uso como condición para:
- Etiquetado automático de archivos de Office con etiquetas de confidencialidad
- La aplicación automática de una directiva de etiqueta de retención basada en una condición
- Cumplimiento de las comunicaciones
- Condiciones de etiqueta de confidencialidad. (Consulte Aplicar automáticamente una etiqueta de confidencialidad a los datos de Microsoft 365)
- Prevención de pérdida de datos
Importante
Los clasificadores solo funcionan con elementos que no están cifrados.
-
Clasificadores previamente entrenados : Microsoft ha creado y entrenado previamente varios clasificadores que puede empezar a usar sin entrenarlos. Estos clasificadores aparecen con el estado de
Ready to use
. - Clasificadores entrenables personalizados : si necesita identificar y clasificar el contenido más allá de lo que cubren los clasificadores previamente entrenados, puede crear y entrenar sus propios clasificadores.
Consulte Definiciones de clasificadores entrenables para obtener una lista completa de todos los clasificadores previamente entrenados.
Importante
Limitación de idioma: La compatibilidad con clasificadores personalizados está limitada al inglés.
Cuando los clasificadores previamente entrenados no satisfacen sus necesidades, puede crear y entrenar sus propios clasificadores. Hay más trabajo relacionado con la creación de los suyos propios, pero se adaptan mejor a las necesidades de su organización.
Para crear un clasificador entrenable personalizado, empiece por darle un conjunto de ejemplos que definitivamente están en la categoría y otro conjunto de ejemplos que definitivamente no lo son. Microsoft Purview procesa esos ejemplos y el clasificador realiza predicciones sobre si algún elemento determinado pertenece a la categoría que está compilando. A continuación, confirme los resultados, ordenando los verdaderos positivos, los verdaderos negativos, los falsos positivos y los falsos negativos para ayudar a aumentar la precisión de sus predicciones.
Al publicar el clasificador, ordena los elementos de ubicaciones como SharePoint, Exchange y OneDrive, y clasifica el contenido.
Por ejemplo, podría crear clasificadores entrenables para:
- Documentos legales: como privilegios de cliente de abogado, conjuntos de cierre, declaración de trabajo
- Documentos empresariales estratégicos: como comunicados de prensa, fusiones y adquisiciones, ofertas, planes de negocio o marketing, propiedad intelectual, patentes, documentos de diseño
- Información de precios: como facturas, cotizaciones de precios, órdenes de trabajo, documentos de licitación
- Información financiera, como inversiones de la organización, resultados trimestrales o anuales
En el diagrama de flujo siguiente se muestra el proceso de creación y publicación de un clasificador para su uso en soluciones de cumplimiento, como directivas de retención y supervisión de comunicaciones. Para obtener más detalles sobre cómo crear un clasificador personalizado que se puede entrenar, consulte Introducción a los clasificadores que se pueden entrenar.
Sugerencia
Si crea un nuevo sitio y una carpeta de SharePoint para los datos de inicialización, espere al menos una hora para que esa ubicación se indexe antes de crear el clasificador entrenable que usará esos datos de inicialización.
Ya no se admite el reentrenamiento de clasificadores personalizados publicados. Si necesita mejorar la precisión de un clasificador entrenable que ha publicado, quite el clasificador y comience de nuevo con conjuntos de muestras más grandes.
Para mejorar la precisión de un clasificador no publicado, revise los resultados de la prueba, actualice el conjunto de datos con datos adicionales y reinicie el entrenamiento.
- Etiquetas de retención
- Obtenga más información acerca de la prevención contra la pérdida de datos
- Etiquetas de confidencialidad
- Definiciones de entidad de tipos de información confidencial
- Impresión con dedo del documento
- Obtener información sobre los tipos de información confidencial basados en coincidencias exactas de datos