Vue d’ensemble du traitement de documents non structurés dans Microsoft Syntex
Remarque
Jusqu’en juin 2025, vous pouvez essayer gratuitement le traitement de documents non structurés et d’autres services Syntex sélectionnés si la facturation du paiement à l’utilisation est configurée. Pour plus d’informations et pour connaître les limitations, consultez Essayer Microsoft Syntex et explorer ses services.
Utilisez le modèle de traitement de document non structuré (méthode d’enseignement) pour classifier automatiquement les fichiers et extraire des informations. Il fonctionne mieux pour les documents non structurés, tels que les lettres ou les contrats.
Remarque
Microsoft respecte la confidentialité et la propriété des données que vous utilisez pour entraîner et traiter des modèles dans Syntex. Aucune des données de votre organisation n’est utilisée ou transférée par Microsoft pour entraîner des modèles IA, des modèles de langage volumineux ou d’autres modèles. Vos données restent en toute sécurité au sein du locataire de votre organisation. Pour plus d’informations, consultez Protection et confidentialité des données Microsoft.
Présentation des modèles non structurés
Le modèle de traitement de documents non structuré (anciennement appelé modèle de compréhension de document) utilise l’intelligence artificielle (IA) pour traiter les documents. Ces documents doivent comporter du texte qui peut être identifié sur la base de phrases ou de modèles. Le texte identifié désigne à la fois le type de fichier (sa classification) et ce que vous voulez extraire (ses extracteurs).
Remarque
Pour plus d’informations sur l’utilisation de Syntex et des exemples de scénarios, consultez Prise en main de l’adoption de Microsoft Syntex et Scénarios et cas d’usage pour Microsoft Syntex.
Les modèles de traitement de documents non structurés sont créés et gérés dans un type de site SharePoint appelé centre de contenu. Lorsqu’il est appliqué à une bibliothèque de documents SharePoint, le modèle associé à un type de contenu inclut des colonnes pour stocker les informations extraites. Le type de contenu que vous créez est stocké dans la Galerie de types de contenu SharePoint. Vous pouvez également choisir d’utiliser des types de contenu existants pour utiliser leur schéma.
Remarque
Les types de contenu en lecture seule ou scellés ne pouvant pas être mis à jour, ils ne peuvent pas être utilisés dans un modèle.
Ajoutez des classifieurs et des extracteurs à vos modèles de traitement de documents non structurés pour effectuer les actions suivantes :
Les classificateurs sont utilisés pour identifier et classer les documents téléchargés vers la bibliothèque de documents. Par exemple, un classifieur peut être « exercé » pour identifier tous les documentsrenouvellement de contrat qui sont chargés dans la bibliothèque. Le type de contenu renouvellement contrat est défini par vous lorsque vous créez votre classifieur.
Les extracteurs extraient des informations de ces documents. Par exemple, pour chaque document de renouvellement de contrat identifié dans votre bibliothèque de documents, les colonnes affichent la date de début du service et le client pour chaque document.
Vous pouvez utiliser des fichiers d’exemple pour former et tester vos classificateurs et extracteurs de votre modèle. Les exemples de fichiers fournissent vos exemples de modèles à rechercher lorsque vous essayez d’identifier et d’extraire des données de fichiers. Par exemple, vous devez former vos classificateurs et extracteurs de renouvellement de contrat avec des exemples de documents de renouvellement de contrat que votre entreprise utilise. Vous pouvez également utiliser des exemples de fichiers pour tester l’efficacité de votre modèle.
Une fois que vous avez publié votre modèle, utilisez le centre de contenu pour l’appliquer à toute bibliothèque de documents SharePoint à laquelle vous avez accès.
Configuration requise et limitations
Pour plus d’informations sur les exigences à prendre en compte lors du choix de ce modèle, consultez Configuration requise et limitations des modèles dans Microsoft Syntex.