Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Mediante el examen óptico de reconocimiento de caracteres (OCR), Microsoft Purview puede examinar imágenes en busca de información confidencial. El examen de OCR es una característica opcional que debe habilitar en el nivel de inquilino. Después de habilitarlo, seleccione las ubicaciones donde desea examinar las imágenes. Puede examinar imágenes en dispositivos Exchange, SharePoint, OneDrive, Teams, Windows y macOS. Al configurar los valores de OCR, Microsoft Purview aplica las directivas existentes para la prevención de pérdida de datos (DLP), la administración de registros y la administración de riesgos internos (IRM) a imágenes y contenido basado en texto. Por ejemplo, si configura el contenido de la condición DLP contiene información confidencial e incluye un clasificador de datos como el tipo de información confidencial de tarjeta de crédito (SIT), Microsoft Purview examina los números de tarjeta de crédito en texto e imágenes en todas las ubicaciones elegidas.
Flujo de trabajo de un vistazo
| Fase | Requisitos |
|---|---|
| Crear Azure suscripción si es necesario | Si su organización aún no tiene una suscripción de pago por uso Azure para su inquilino, el administrador global debe empezar creando una cuenta de Azure. |
| Estimación de los cargos de examen de OCR | Use el estimador de costos de OCR para calcular los cargos esperados para los casos de uso específicos. |
| Configure la facturación de pago por uso para habilitar OCR. | El administrador global o de SharePoint debe seguir las instrucciones de Configuración de la facturación de Microsoft Syntex en Azure para agregar una suscripción para OCR. |
| Configuración del examen de OCR | El administrador de cumplimiento de su organización configura los valores de OCR para el inquilino. |
Requisitos previos
Para usar el examen de OCR, el administrador global de la organización debe comprobar que hay una suscripción de pago por uso Azure. Si no es así, deben configurar la suscripción siguiendo las instrucciones de Creación de las suscripciones de Azure iniciales.
Configuración de la facturación
Al habilitar OCR, todos los tipos de información confidencial y clasificadores que se pueden entrenar pueden detectar caracteres que se encuentran en imágenes.
Dado que es una característica opcional, el administrador global debe configurar la facturación de pago por uso para habilitar OCR. Consulte las instrucciones de Configuración de la facturación de Microsoft Syntex en Azure para agregar una suscripción para OCR.
Nota:
Después de especificar la información de facturación en Microsoft Syntex, el administrador de cumplimiento puede configurar OCR en Microsoft Purview sin necesidad de configurar ni conceder licencias adicionales.
Puede encontrar información de precios de pago por uso de OCR en la página Configurar Microsoft Syntex facturación en Azure.
Estimación de los cargos de examen de OCR
Cada imagen examinada cuenta como una transacción. Este precio significa que las imágenes independientes (JPEG, JPG, PNG, BMP o TIFF) cuentan cada una como una sola transacción. También significa que cada página de un archivo PDF se cobra por separado. Por ejemplo, si hay 10 páginas en un archivo PDF, un examen OCR del archivo PDF cuenta como 10 exámenes independientes. Para obtener información sobre el uso del estimador de costos de OCR, consulte Estimación de los costos de OCR.
Nota:
Para reducir los costos de OCR, el servicio usa los siguientes mecanismos de almacenamiento en caché: las imágenes pequeñas, como logotipos y firmas que se envían por correo electrónico a través de Microsoft Exchange, se examinan y facturan solo una vez por imagen única entre todos los usuarios del inquilino durante una ventana móvil de cinco días. En el caso del punto de conexión, la memoria caché se mantiene durante 30 días. El almacenamiento en caché es local para cada dispositivo de punto de conexión y solo se almacenan los clasificadores identificados en la imagen y el hash de imagen. Los datos del cliente no se almacenan. No hay ningún mecanismo de almacenamiento en caché para imágenes independientes en SharePoint y OneDrive. Sin embargo, en los tipos de archivo incrustados, si solo se actualiza texto, las imágenes no se examinan de nuevo.
El servicio comprueba varios parámetros, incluidos el hash de secuencia de imágenes y el tamaño de la imagen, para ver si puede usar la memoria caché. Si algún parámetro no coincide, los OCR de servicio vuelven a usar la imagen.
Además, puede usar cada imagen escaneada en cualquier número de directivas en la prevención de pérdida de datos, la administración de riesgos internos, el etiquetado automático y la administración de registros sin cargo adicional.
Importante
Para obtener información sobre los requisitos de Adobe para usar características de Prevención de pérdida de datos de Microsoft Purview (DLP) con archivos PDF, consulte este artículo de Adobe: Microsoft Purview Information Protection Support in Acrobat.
Configuración de los valores de OCR
Para configurar el examen de OCR para el inquilino, siga estos pasos:
- Inicie sesión en el portal de Microsoft Purview.
- Seleccione Configuración.
- Seleccione Reconocimiento óptico de caracteres (OCR) para especificar los valores de configuración de OCR.
- Seleccione las ubicaciones donde desea examinar las imágenes.
- Seleccione los grupos que quiera incluir o excluir de los exámenes OCR.
- Seleccione Listo.
Para obtener la lista completa de ubicaciones en las que OCR examina las imágenes y las soluciones que actúan en función de los resultados, consulte Ubicaciones y soluciones admitidas.
Permissions
Para crear e implementar directivas, la cuenta debe ser miembro de uno de estos grupos de roles:
- Administrador de cumplimiento
- Administrador de datos de cumplimiento
- Administrador global
- Protección de la información
- Administrador de Information Protection
Nota:
En general, la configuración de OCR surte efecto aproximadamente una hora después de activarlas.
Nota:
Para obtener información sobre la funcionalidad de OCR en Cumplimiento de comunicaciones de Microsoft Purview, consulte Creación y administración de directivas de cumplimiento de comunicaciones.
Ubicaciones y soluciones admitidas
| Ubicación | Soluciones admitidas |
|---|---|
| Exchange | Prevención de pérdida de datos Protección de la información: directivas de etiquetado automático Administración de registros: directivas de etiquetas de retención de aplicación automática1 |
| Sitios de SharePoint | Prevención de pérdida de datos Administración de riesgosinternos 2 Administración de registros: directivas de etiquetas de retención de aplicación automática1 |
| Cuentas de OneDrive | Prevención de pérdida de datos Administración de registros: directivas de etiquetas de retención de aplicación automática1 |
| Mensajes de canales y chats de Teams | Prevención de pérdida de datos Administración de riesgosinternos 2 |
| Dispositivos | Prevención de pérdida de datos Administración de riesgosinternos 2 |
1 Admite palabras clave y tipos de información confidencial.
2 Tiene en cuenta los tipos de información confidencial y los clasificadores entrenables presentes en las imágenes para la puntuación de riesgos.
Tipos de archivo compatibles
Esta funcionalidad admite el examen de imágenes en los siguientes tipos de archivo, con los requisitos indicados:
| Ubicaciones | Tipos de archivo compatibles |
|---|---|
| Exchange | JPEG, JPG, PNG, BMP, TIFF y ARCHIVOS PDF (escaneados). Imágenes incrustadas en DOCX, PPTX, XLSX, RAR, TAR, ZIP, 7z y archivos PDF híbridos (que contienen texto e imágenes que se pueden buscar) con un límite de 20 imágenes incrustadas examinadas por archivo. |
| SharePoint y OneDrive | BMP, PNG, JPEG, JPG, JFIF, ARW, CR2, CRW, ERF, GIF, MEF, MRW, NEF, NRW, ORF, PEF, RAW, RW2, RW1, SR2, TIF, TIFF, HEIC, HEIF, ARI, BAY, CAP, CR3, DCS, DCR, DRF, EIP, FFF, IIQ, K25, KDC, MOS, PTX, PXN, RAF, RWL, SRF, SRW, X3F, DNG, ARCHIVOS PDF (digitalizados e híbridos que contienen texto e imágenes que se pueden buscar) Imágenes incrustadas en DOCX, PPTX, XLSX |
| Punto de conexión de Teams, Windows y macOS | JPEG, JPG, PNG, BMP, TIFF y PDF (solo imagen) |
Requisitos de imagen
| Requisito | Límite |
|---|---|
| Tamaño de archivo (Exchange, Teams) | 20 MB como máximo |
| Tamaño de archivo (puntos de conexión de SharePoint, OneDrive, Windows y macOS) | 50 MB como máximo |
| Resolución de imágenes | 50 × 50 px como mínimo, 16 000 × 16 000 px como máximo |
Importante
- Solo se examinan las imágenes cargadas después de habilitar OCR.
- OCR extrae solo los primeros 2 millones de caracteres de texto.
- De forma predeterminada, el correo electrónico entrante (correo electrónico de usuarios fuera de la organización), los correos internos (correo electrónico compartido dentro de los usuarios de la organización) y el correo electrónico saliente (enviado a usuarios fuera de la organización) están sujetos al examen de OCR. Para excluir los correos entrantes del examen OCR, cambie la configuración de OCR del ámbito predeterminado de Todos los grupos de remitentes a los grupos de remitentes específicos y especifique los grupos internos que desea que OCR examine. Para restringir los exámenes ocres a los correos enviados fuera de la organización únicamente, seleccione la opción en Configuración avanzada (solo Exchange). Después de seleccionar esta casilla, ni los correos entrantes ni las comunicaciones internas son OCRed. Para obtener información sobre cómo cambiar las configuraciones, consulte Configuración de OCR.
- Las sugerencias de directivas de prevención de pérdida de datos no se admiten para imágenes en Exchange.
- Si excluye una ruta de acceso en la configuración de prevención de pérdida de datos del punto de conexión, OCR no examina las imágenes de esas carpetas.
- Cuando OCR está activado para dispositivos Windows y macOS, los dispositivos comienzan a enviar mensajes a la nube para su examen. El límite de ancho de banda predeterminado es de 1024 MB de datos por dispositivo y día. OCR deja de escanear imágenes una vez alcanzado este límite diario. Si desea continuar escaneando imágenes, puede aumentar el límite de ancho de banda.
- En Dispositivo de punto de conexión, asegúrese de que la configuración de red no obstruye el OCR y que debe haber un carácter comodín que permita blob.core.windows.net puntos de conexión.
- Para Exchange, la característica admite imágenes incrustadas en DOCX, PPTX, XLSX, RAR, TAR, ZIP, 7z y ARCHIVOS PDF híbridos (que contienen texto e imágenes que se pueden buscar) con un límite de 20 imágenes incrustadas examinadas por archivo.
Idiomas admitidos
El examen ocr admite más de 150 idiomas.
Resumen
- Para usar OCR, configure Microsoft Syntex facturación de pago por uso. (No es necesario configurar Microsoft Syntex sí mismo).
- Configure OCR en el nivel de inquilino, por lo que una vez configurado OCR, estará disponible para toda la pila de Microsoft Purview.
- No es necesario crear clasificadores de datos independientes para OCR. Una vez configurado OCR, los tipos de información confidencial existentes, los tipos de información confidencial basados en coincidencias exactas de datos, los clasificadores entrenables y los SIT de huellas digitales examinan imágenes, así como documentos y correos electrónicos.
- Microsoft Purview eDiscovery admite OCR en el nivel de caso. Para obtener más información, vea Configuración de búsqueda y análisis en eDiscovery.