En savoir plus sur la reconnaissance optique de caractères dans Microsoft Purview

En utilisant l’analyse de reconnaissance optique de caractères (OCR), Microsoft Purview peut analyser les images à la recherche d’informations sensibles. L’analyse OCR est une fonctionnalité facultative que vous devez activer au niveau du locataire. Après l’avoir activé, sélectionnez les emplacements où vous souhaitez analyser les images. Vous pouvez analyser des images sur des appareils Exchange, SharePoint, OneDrive, Teams, Windows et macOS. Lorsque vous configurez les paramètres OCR, Microsoft Purview applique vos stratégies existantes pour la protection contre la perte de données (DLP), la gestion des enregistrements et la gestion des risques internes (IRM) aux images et au contenu textuel. Par exemple, si vous configurez le contenu de la condition DLP contenant des informations sensibles et incluez un classifieur de données tel que le type d’informations sensibles de carte de crédit (SIT), Microsoft Purview analyse les nombres de carte de crédit dans le texte et les images à tous les emplacements choisis.

Aperçu rapide du flux de travail

Phase	De quoi ai-je besoin ?
Créer Azure abonnement si nécessaire	Si votre organization n’a pas encore d’abonnement Azure paiement à l’utilisation pour votre locataire, votre administrateur général doit commencer par créer un compte Azure.
Estimer vos frais d’analyse OCR	Utilisez l’estimateur de coût OCR pour estimer les frais attendus pour vos cas d’usage spécifiques.
Configurez la facturation du paiement à l’utilisation pour activer l’OCR.	Votre administrateur général ou SharePoint doit suivre les instructions fournies dans Configurer Microsoft Syntex facturation dans Azure pour ajouter un abonnement pour la reconnaissance optique de caractères.
Configurer les paramètres d’analyse OCR	L’administrateur de conformité de votre organization configure les paramètres OCR pour votre locataire.

Configuration requise

Pour utiliser l’analyse OCR, l’administrateur général de votre organization doit vérifier qu’un abonnement Azure paiement à l’utilisation est en place. Si ce n’est pas le cas, ils doivent configurer l’abonnement en suivant les instructions fournies dans Créer vos abonnements Azure initiaux.

Configurer la facturation

Lorsque vous activez la reconnaissance optique de caractères, tous les types d’informations sensibles et les classifieurs pouvant être entraînés peuvent détecter les caractères qui se trouvent dans les images.

Étant donné qu’il s’agit d’une fonctionnalité facultative, votre administrateur général doit configurer la facturation du paiement à l’utilisation pour activer la reconnaissance optique de caractères. Reportez-vous aux instructions fournies dans Configurer Microsoft Syntex facturation dans Azure pour ajouter un abonnement pour la reconnaissance optique de caractères.

Remarque

Une fois que vous avez entré les informations de facturation dans Microsoft Syntex, votre administrateur de conformité peut configurer la reconnaissance optique de caractères dans Microsoft Purview sans aucune configuration ou licence supplémentaire requise.

Vous trouverez des informations sur la tarification ocre avec paiement à l’utilisation dans la page Configurer Microsoft Syntex facturation dans Azure page.

Estimer vos frais d’analyse OCR

Chaque image analysée compte comme une seule transaction. Cette tarification signifie que les images autonomes (JPEG, JPG, PNG, BMP ou TIFF) comptent chacune comme une seule transaction. Cela signifie également que chaque page d’un fichier PDF est facturée séparément. Par exemple, s’il y a 10 pages dans un fichier PDF, une analyse OCR du fichier PDF compte pour 10 analyses distinctes. Pour plus d’informations sur l’utilisation de l’estimateur de coût OCR, consultez Estimer vos coûts OCR.

Remarque

Pour réduire vos coûts ocre, le service utilise les mécanismes de mise en cache suivants : les petites images, telles que les logos et les signatures envoyés par courrier électronique via Microsoft Exchange, sont analysées et facturées une seule fois par image unique sur tous les utilisateurs du locataire pour une fenêtre mobile de cinq jours. Pour Point de terminaison, le cache est conservé pendant 30 jours. La mise en cache est locale pour chaque appareil de point de terminaison et seuls les classifieurs identifiés sur l’image et le hachage d’image sont stockés. Les données client ne sont pas stockées. Il n’existe aucun mécanisme de mise en cache pour les images autonomes dans SharePoint et OneDrive. Toutefois, dans les types de fichiers incorporés, si seul le texte est mis à jour, les images ne sont pas analysées à nouveau.

Le service vérifie plusieurs paramètres, notamment le hachage du flux d’image et la taille de l’image, pour voir s’il peut utiliser le cache. Si un paramètre ne correspond pas, les OCR de service resserent l’image.

En outre, vous pouvez utiliser chaque image analysée dans n’importe quel nombre de stratégies pour la protection contre la perte de données, la gestion des risques internes, l’étiquetage automatique et la gestion des enregistrements sans frais supplémentaires.

Importante

Pour plus d’informations sur les exigences d’Adobe pour l’utilisation des fonctionnalités de Protection contre la perte de données Microsoft Purview (DLP) avec des fichiers PDF, consultez cet article d’Adobe : Protection des données Microsoft Purview support dans Acrobat.

Configurer vos paramètres OCR

Pour configurer l’analyse OCR pour votre locataire, procédez comme suit :

Connectez-vous au portail Microsoft Purview.
Sélectionnez Paramètres.
Sélectionnez Reconnaissance optique de caractères (OCR) pour entrer vos paramètres de configuration OCR.
Sélectionnez les emplacements où vous souhaitez analyser les images.
Sélectionnez les groupes que vous souhaitez inclure ou exclure des analyses OCR.
Sélectionnez Terminé.

Pour obtenir la liste complète des emplacements où la reconnaissance optique de caractères analyse les images et les solutions qui agissent sur les résultats, consultez Emplacements et solutions pris en charge.

Autorisations

Pour créer et déployer des stratégies, votre compte doit être membre de l’un des groupes de rôles suivants :

Administrateur de conformité
Administrateur de conformité des données
Administrateur général
Protection des informations
Administrateur Information Protection

Remarque

En général, les paramètres OCR prennent effet environ une heure après leur activation.

Remarque

Pour plus d’informations sur la fonctionnalité OCR dans Conformité des communications Microsoft Purview, consultez Créer et gérer des stratégies de conformité des communications.

Emplacements et solutions pris en charge

Lieu	Solutions prises en charge
Exchange	Prévention des pertes de données Protection des informations : stratégies d’étiquetage automatique Gestion des enregistrements : Stratégies d’étiquette de rétention d’application automatique¹
Sites SharePoint	Prévention des pertes de données Gestion des risques internes² Gestion des enregistrements : Stratégies d’étiquette de rétention d’application automatique¹
Comptes OneDrive	Prévention des pertes de données Gestion des enregistrements : Stratégies d’étiquette de rétention d’application automatique¹
conversation et messages de canal Teams	Prévention des pertes de données Gestion des risques internes²
Appareils	Prévention des pertes de données Gestion des risques internes²

¹ Prend en charge les mots clés et les types d’informations sensibles.
² Prend en compte les types d’informations sensibles et les classifieurs pouvant être entraînés présents dans les images pour le scoring des risques.

Types de fichiers pris en charge

Cette fonctionnalité prend en charge l’analyse des images dans les types de fichiers suivants, avec les exigences indiquées :

Emplacements	Types de fichiers pris en charge
Exchange	JPEG, JPG, PNG, BMP, TIFF et PDF (analysés). Images incorporées dans DOCX, PPTX, XLSX, RAR, TAR, ZIP, 7z et pdf hybrides (contenant du texte et des images pouvant faire l’objet d’une recherche) avec une limite de 20 images incorporées analysées par fichier.
SharePoint et OneDrive	BMP, PNG, JPEG, JPG, JFIF, ARW, CR2, CRW, ERF, GIF, MEF, MRW, NEF, NRW, ORF, PEF, RAW, RW2, RW1, SR2, TIF, TIFF, HEIC, HEIF, ARI, BAY, CAP, CR3, DCS, DCR, DRF, EIP, FFF, IIQ, K25, KDC, MOS, PTX, PXN, RAF, RWL, SRF, SRW, X3F, DNG, PDF (numérisés et hybrides contenant du texte et des images pouvant faire l’objet d’une recherche) Images incorporées dans DOCX, PPTX, XLSX
Point de terminaison Teams, Windows et macOS	JPEG, JPG, PNG, BMP, TIFF et PDF (image uniquement)

Configuration requise pour l’image

Conditions requises	Limite
Taille du fichier (Exchange, Teams)	20 Mo max.
Taille de fichier (points de terminaison SharePoint, OneDrive, Windows et macOS)	50 Mo max.
Résolution d’image	50 × 50 px minimum, 16 000 × 16 000 px maximum

Importante

Seules les images chargées après l’activation de la reconnaissance optique de caractères sont analysées.
La reconnaissance optique de caractères extrait uniquement les 2 premiers millions de caractères du texte.
Par défaut, les e-mails entrants (messages provenant d’utilisateurs en dehors du organization), les courriers internes (e-mails partagés au sein des utilisateurs de l’organization) et les e-mails sortants (e-mails envoyés aux utilisateurs en dehors du organization) sont soumis à l’analyse OCR. Pour exclure les courriers entrants de l’analyse OCR, remplacez les paramètres OCR de l’étendue par défaut de Tous les groupes d’expéditeurs par les groupes d’expéditeurs spécifiques et spécifiez les groupes internes que vous souhaitez analyser. Pour limiter les analyses OCR aux messages envoyés en dehors du organization uniquement, sélectionnez l’option sous Paramètre avancé (Exchange uniquement) . Après avoir coché cette case, ni les messages entrants ni les communications internes ne sont OCRed. Pour plus d’informations sur la modification des configurations, consultez Configurer vos paramètres OCR.
Les conseils de stratégie de protection contre la perte de données ne sont pas pris en charge pour les images dans Exchange.
Si vous excluez un chemin dans les paramètres de protection contre la perte de données de point de terminaison, l’OCR n’analyse pas les images dans ces dossiers.
Lorsque la reconnaissance optique de caractères est activée pour les appareils Windows et macOS, les appareils commencent à envoyer des messages au cloud à des fins d’analyse. La limite de bande passante par défaut est de 1 024 Mo de données par appareil et par jour. La reconnaissance optique de caractères arrête l’analyse des images une fois cette limite quotidienne atteinte. Si vous souhaitez continuer à analyser les images, vous pouvez augmenter la limite de bande passante.
Pour Appareil de point de terminaison, assurez-vous que les paramètres réseau n’entravent pas la reconnaissance optique de caractères optiques et qu’un caractère générique doit être présent, autorisant blob.core.windows.net points de terminaison.
Pour Exchange, la fonctionnalité prend en charge les images incorporées dans DOCX, PPTX, XLSX, RAR, TAR, ZIP, 7z et les fichiers PDF hybrides (contenant du texte et des images pouvant faire l’objet d’une recherche) avec une limite de 20 images incorporées analysées par fichier.

Langues prises en charge

L’analyse OCR prend en charge plus de 150 langues.

Résumé

Pour utiliser la reconnaissance optique de caractères, configurez Microsoft Syntex facturation avec paiement à l’utilisation. (Vous n’avez pas besoin de configurer Microsoft Syntex elle-même.)
Configurez la reconnaissance optique de caractères au niveau du locataire. Une fois la reconnaissance optique de caractères configurée, elle est donc disponible pour l’ensemble de la pile Microsoft Purview.
Vous n’avez pas besoin de créer des classifieurs de données distincts pour l’OCR. Une fois la reconnaissance optique de caractères configurée, les types d’informations sensibles existants, les données exactes correspondent aux types d’informations sensibles basés sur les données, les classifieurs pouvant être formés et les SIT d’empreinte digitale analysent les images ainsi que les documents et les e-mails.
Microsoft Purview eDiscovery prend en charge la reconnaissance optique de caractères au niveau de la casse. Pour plus d’informations, consultez Paramètres de recherche et d’analyse dans eDiscovery.

Voir aussi

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-05-01

En savoir plus sur la reconnaissance optique de caractères dans Microsoft Purview

Aperçu rapide du flux de travail

Configuration requise

Configurer la facturation

Estimer vos frais d’analyse OCR

Configurer vos paramètres OCR

Autorisations

Emplacements et solutions pris en charge

Types de fichiers pris en charge

Configuration requise pour l’image

Langues prises en charge

Résumé

Voir aussi

Commentaires

Ressources supplémentaires