Más información sobre el reconocimiento óptico de caracteres en Microsoft Purview

El examen óptico de reconocimiento de caracteres (OCR) permite a Microsoft Purview examinar el contenido de las imágenes en busca de información confidencial. Una característica opcional, el examen de OCR se habilita primero en el nivel de inquilino. Una vez habilitada, seleccione las ubicaciones en las que desea examinar las imágenes. El examen de imágenes está disponible para dispositivos Exchange, SharePoint, OneDrive, Teams y Windows. Una vez configurada la configuración de OCR, las directivas existentes para la prevención de pérdida de datos (DLP), la administración de registros y la administración de riesgos internos (IRM) se aplican a imágenes y contenido basado en texto. Por ejemplo, supongamos que ha configurado el contenido de la condición DLP que contiene información confidencial e incluye un clasificador de datos, como el tipo de información confidencial "Tarjeta de crédito" (SIT). En este caso, Microsoft Purview busca números de tarjeta de crédito en texto e imágenes en todas las ubicaciones elegidas.

Flujo de trabajo de un vistazo

Fase Requisitos
Fase 1: Creación de una suscripción de Azure si es necesario Si su organización aún no tiene una suscripción de pago por uso de Azure para su inquilino, el administrador global debe empezar por crear una cuenta de Azure.
Fase 2: Configure la facturación de pago por uso para habilitar OCR. El administrador global o de SharePoint debe seguir las instrucciones de Configuración de la facturación de Microsoft Syntex en Azure para agregar una suscripción para OCR.
Fase 3: Configuración del examen de OCR El administrador de cumplimiento de su organización configura los valores de OCR para el inquilino.

Fase 1: Requisitos previos

Para usar el examen de OCR, el administrador global de la organización debe comprobar que hay una suscripción de pago por uso de Azure. Si no es así, deben configurarlo siguiendo las instrucciones de Creación de las suscripciones iniciales de Azure.

Fase 2: Configuración de la facturación

Al habilitar OCR, todos los tipos de información confidencial y clasificadores que se pueden entrenar pueden detectar caracteres que se encuentran en imágenes.

Dado que es una característica opcional, el administrador global debe configurar la facturación de pago por uso para habilitar OCR. Consulte las instrucciones de Configuración de la facturación de Microsoft Syntex en Azure para agregar una suscripción a OCR.

Nota:

Una vez que se especifica la información de facturación en Microsoft Syntex, el administrador de cumplimiento puede configurar OCR en Microsoft Purview, sin necesidad de configurar ni conceder licencias adicionales.

Puede encontrar información de precios de pago por uso de OCR en la página Configuración de la facturación de Microsoft Syntex en Azure.

Cargos

El cargo por usar OCR es de 1,00 USD por cada 1000 artículos escaneados. Cada imagen examinada cuenta como una transacción. Esto significa que las imágenes independientes (JPEG, JPG, PNG, BMP o TIFF) cuentan cada una como una sola transacción. También significa que cada página de un archivo PDF se cobra por separado. Por ejemplo, si hay 10 páginas en un archivo PDF, un examen OCR del archivo PDF cuenta como 10 exámenes independientes.

Nota:

Para reducir los costos de OCR, los cargos por escanear cada imagen única solo se incurren una vez.

Las imágenes pequeñas, como logotipos y firmas que se envían por correo electrónico a través de Microsoft Exchange, se examinan y facturan solo una vez por imagen única en todos los usuarios del inquilino. En todas las instancias posteriores, se reutilizarán los resultados del examen anterior.

Además, cada imagen examinada se puede usar en cualquier número de directivas en la prevención de pérdida de datos, la administración de riesgos internos, el etiquetado automático y la administración de registros sin cargo adicional.

Importante

Para obtener información sobre los requisitos de Adobe para usar características de Prevención de pérdida de datos de Microsoft Purview (DLP) con archivos PDF, consulte este artículo de Adobe: Microsoft Purview Information Protection Support in Acrobat.

Para ver la factura, siga las instrucciones que se describen en Supervisión del uso de pago por uso de Microsoft Syntex.

Estimación de la factura

Cuando empiece a usar OCR por primera vez, limite el uso a unas pocas personas y cargas de trabajo aplicables. Después de un breve período de tiempo, puede ver la factura en Azure y ver las estadísticas de uso & los cargos por cada día. Desde allí, puede extrapolar los costos del conjunto completo de usuarios. Además, puede usar la etiqueta "carga de trabajo" en Administración de costos de Azure para ver el desglose del uso por carga de trabajo.

Fase 3: Configuración de los valores de OCR

  1. En el portal de cumplimiento Microsoft Purview, vaya a Configuración.
  2. Seleccione Reconocimiento óptico de caracteres (OCR) para especificar los valores de configuración de OCR.
  3. Seleccione las ubicaciones donde desea examinar las imágenes.
  4. Seleccione los grupos de distribución que desea incluir o excluir de los exámenes ocres.
  5. Elegir listo

Las ubicaciones y soluciones admitidas se enumeran en la tabla siguiente.

Permissions

La cuenta que use para crear e implementar directivas debe ser miembro de uno de estos grupos de roles.

  • Administrador de cumplimiento
  • Administrador de datos de cumplimiento
  • Administrador global
  • Protección de la información
  • Administrador de Information Protection

Nota:

Ubicaciones y soluciones admitidas

Ubicación Soluciones admitidas
Exchange Prevención de pérdida de datos

Protección de la información: directivas de etiquetado automático

Administración de registros: aplicar automáticamente directivas de etiqueta de retención1
Sitios de SharePoint Prevención de pérdida de datos

Administración de riesgosinternos 2

Administración de registros: aplicar automáticamente directivas de etiqueta de retención1
Cuentas de OneDrive Prevención de pérdida de datos

Administración de registros: aplicar automáticamente directivas de etiqueta de retención1
Mensajes de canales y chats de Teams Prevención de pérdida de datos

Administración de riesgosinternos 2
Dispositivos Prevención de pérdida de datos

Administración de riesgosinternos 2

1 Admite palabras clave y tipos de información confidencial.
2 Tiene en cuenta los tipos de información confidencial y los clasificadores entrenables presentes en las imágenes para la puntuación de riesgos.


¿Qué tipos de archivo se admiten?

Esta funcionalidad admite el examen de imágenes en los siguientes tipos de archivo, con los requisitos indicados:

Tipos de archivo compatibles Requisitos de imagen
JPEG, JPG, PNG, BMP, TIFF y PDF (solo imagen) Tamaños de archivo: Los archivos de imagen no deben tener más de 20 MB para Exchange y Teams. Para los puntos de conexión de SharePoint, OneDrive y Windows, el tamaño máximo del archivo de imagen es de 50 MB.

Resolución de imágenes: La resolución de la imagen debe ser de al menos 50 x 50 píxeles y no superior a 16 000 x 16 000 px.

Importante

  • Solo se examinan las imágenes cargadas después de habilitar OCR.
  • Tanto el correo electrónico entrante (correo electrónico de usuarios fuera de la organización) como el correo electrónico saliente (correo electrónico enviado por los usuarios de la organización) están sujetos al examen de OCR. Para restringir los exámenes OCR solo a los correos electrónicos salientes, cambie la configuración de OCR del ámbito predeterminado de Todos los grupos de distribución a los grupos de distribución específicos y especifique los grupos de distribución internos que desea que OCR examine. Para obtener información sobre cómo cambiar esta configuración, consulte Fase 3: Configurar los valores de OCR.
  • No se admiten sugerencias de directivas de prevención de pérdida de datos para imágenes en Exchange.
  • Si excluye una ruta de acceso en la configuración de prevención de pérdida de datos del punto de conexión, OCR no examinará las imágenes de esas carpetas.
  • Cuando OCR está activado para dispositivos Windows, los dispositivos comienzan a enviar mensajes a la nube para su examen. El límite de ancho de banda predeterminado es de 1024 MB de datos por dispositivo y día. OCR deja de escanear imágenes una vez alcanzado este límite diario. Si desea continuar escaneando imágenes, puede aumentar el límite de ancho de banda.

¿Qué idiomas se admiten?

El examen ocr admite más de 150 idiomas.

Resumen

Vea también