Partager via


Document AI (préversion)

Extrayez des données structurées, notamment des champs nommés, des tableaux, des codes-barres, des classifications et des résumés à partir de formats de documents courants, de documents numérisés et de photos de documents à l’aide de l’IA. Prend également en charge l’écriture manuscrite et les photos et les analyses de faible qualité, ainsi que l’entrée de document numérique. Prend en charge un large éventail de langages et est en mesure d’analyser et d’déduire la structure sémantique de la disposition visuelle pour les documents.

Ce connecteur est disponible dans les produits et régions suivants :

Service classe Régions
Copilot Studio Premium Toutes les régions Power Automate , à l’exception des éléments suivants :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Applications logiques Norme Toutes les régions Logic Apps , à l’exception des suivantes :
     - Régions Azure Government
     - Régions Azure Chine
     - Us Department of Defense (DoD)
Power Apps Premium Toutes les régions Power Apps , à l’exception des suivantes :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Power Automate Premium Toutes les régions Power Automate , à l’exception des éléments suivants :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Contact
Nom Cloudmersive
URL https://www.cloudmersive.com
Messagerie électronique support@cloudmersive.com
Métadonnées du connecteur
Éditeur Cloudmersive, LLC
Site web https://www.cloudmersive.com
Politique de confidentialité https://www.cloudmersive.com/privacy-policy
Catégories IA; Contenu et fichiers

Cloudmersive Document AI Connector

L’API Cloudmersive Document AI vous permet d’utiliser l’IA de nouvelle génération pour extraire des données, des champs, des insights et du texte à partir de documents.

Prerequisites

Vous devez procéder comme suit :

  • Microsoft Power Apps, Power Automate ou Azure Logic Apps avec prise en charge du connecteur Premium
  • Une clé API Cloudmersive

Comment obtenir des informations d’identification

Pour utiliser ce connecteur, vous avez besoin d’un compte Cloudmersive. Vous pouvez vous inscrire à un compte Microsoft ou créer un compte Cloudmersive. Suivez les étapes ci-dessous pour obtenir votre clé API.

Obtenir la clé API et le secret

  • S’inscrire à un compte Cloudmersive
  • Cliquez sur Clés API

Ici, vous pouvez créer et voir votre ou vos clés API répertoriées dans la page Clés d’API. Copiez et collez simplement cette clé API dans cloudmersive Document AI Connector.

Vous êtes maintenant prêt à commencer à utiliser le connecteur CDR Cloudmersive.

Opérations prises en charge

Le connecteur prend en charge les opérations suivantes :

  • Enforce Policies to a Document to allow or block it using Advanced AI: Appliquez des stratégies à un document pour l’autoriser ou le bloquer à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Consomme 100 appels d’API par page.
  • Answer Questions about a Document in a structured way using Advanced AI: Réponse booléenne (oui/non), questions à choix multiples et réponses libres sur le contenu d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Consomme 100 appels d’API par page.
  • Extract Text from a Document using AI: extrayez du texte brut à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Prend en charge un large éventail de langues. Consomme 100 appels d’API par page.
  • Extract Field Values from a Document using AI: Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.
  • Extract Field Values from a Document using Advanced AI: Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.
  • Extract Tables of Data from a Document using AI: extrayez des tables, composées de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.
  • Extract Barcodes of from a Document using AI: extrayez tous les codes-barres d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC et WEBP. Consomme 100 appels d’API par page.
  • Extract All Fields and Tables of Data from a Document using AI: Extrayez tous les champs et tables, composés de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.
  • Extract Classification or Category from a Document using AI: Extraire la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document utilisant l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.
  • Extract Classification or Category from a Document using Advanced AI: Extraire la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document utilisant l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.
  • Extract Summary from a Document using AI: Crée un résumé de 1 paragraphe du document d’entrée à l’aide de l’intelligence artificielle. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.
  • Extract Text from a Document using AI as a Batch Job: crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Prend en charge un large éventail de langues. Nécessite un déploiement d’instance managée ou de cloud privé.
  • Extract Field Values from a Document using Advanced AI as a Batch Job: crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.
  • Extract All Fields and Tables of Data from a Document using AI as a Batch Job: crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez tous les champs et tables, composés de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.
  • Extract Classification or Category from a Document using AI as a Batch Job: crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document utilisant l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.
  • Get the status and result of an Extract Document Batch Job: retourne le résultat du travail asynchrone : les états possibles peuvent être DÉMARRÉs ou terminés. Cette API est disponible uniquement pour les déploiements cloudmersive Managed Instance et Cloud privé.

Création d’une connexion

Le connecteur prend en charge les types d’authentification suivants :

Par défaut Paramètres de création de connexion. Toutes les régions Non partageable

Faire défaut

Applicable : Toutes les régions

Paramètres de création de connexion.

Cette connexion n’est pas partageable. Si l’application power est partagée avec un autre utilisateur, un autre utilisateur est invité à créer une connexion explicitement.

Nom Type Descriptif Obligatoire
Apikey securestring Apikey pour cette API Vrai

Limitations

Nom Appels Période de renouvellement
Appels d’API par connexion 100 60 secondes

Actions

Appliquer des stratégies à un document pour l’autoriser ou le bloquer à l’aide de l’IA avancée

Appliquez des stratégies à un document pour l’autoriser ou le bloquer à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Consomme 100 appels d’API par page.

Extraire des codes-barres d’un document à l’aide de l’IA

Extrayez tous les codes-barres d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC et WEBP. Consomme 100 appels d’API par page.

Extraire des tables de données d’un document à l’aide de l’IA

Extrayez des tables, composées de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Extraire des valeurs de champ d’un document à l’aide de l’IA

Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Extraire des valeurs de champ d’un document à l’aide de l’IA avancée

Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Extraire des valeurs de champ d’un document à l’aide d’Advanced AI en tant que travail batch

Crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.

Extraire du texte d’un document à l’aide de l’IA

Extrayez du texte brut à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Prend en charge un large éventail de langues. Consomme 100 appels d’API par page.

Extraire du texte d’un document à l’aide de l’IA en tant que travail Batch

Crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Prend en charge un large éventail de langues. Nécessite un déploiement d’instance managée ou de cloud privé.

Extraire la classification ou la catégorie d’un document à l’aide de l’IA

Extrayez la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document utilisant l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Extraire la classification ou la catégorie d’un document à l’aide de l’IA avancée

Extrayez la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Extraire la classification ou la catégorie d’un document à l’aide de l’IA en tant que travail batch

Crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document utilisant l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.

Extraire le résumé d’un document à l’aide de l’IA

Crée un résumé de 1 paragraphe du document d’entrée à l’aide de l’intelligence artificielle. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Extraire tous les champs et tables de données d’un document à l’aide de l’IA

Extrayez tous les champs et tables, composés de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Extraire tous les champs et tables de données d’un document à l’aide de l’IA en tant que travail batch

Crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez tous les champs et tables, composés de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.

Obtenir l’état et le résultat d’un travail de traitement par lots de documents extraits

Retourne le résultat du travail asynchrone : les états possibles peuvent être DÉMARRÉs ou TERMINÉs. Cette API est disponible uniquement pour les déploiements cloudmersive Managed Instance et Cloud privé.

Répondre aux questions sur un document de manière structurée à l’aide de l’IA avancée

Répondez booléen (oui/non), aux questions de choix multiples et de réponse libre sur le contenu d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Consomme 100 appels d’API par page.

Appliquer des stratégies à un document pour l’autoriser ou le bloquer à l’aide de l’IA avancée

Appliquez des stratégies à un document pour l’autoriser ou le bloquer à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
InputFile
InputFile byte

Fichier d’entrée en tant que tableau d’octets

ID de la règle
RuleId string
Type de Règle
RuleType string

Les valeurs possibles sont ALLOW et DENY

RuleDescription
RuleDescription string

Description de la règle en langage naturel, par exemple Ne pas autoriser les documents contenant une langue offensive

RecognitionMode
RecognitionMode string

Optionnel; Mode de reconnaissance - Normal (valeur par défaut) fournit la plus grande précision mais une vitesse plus lente, tandis que Normal fournit une réponse plus rapide mais une précision inférieure pour les images de faible qualité

Retours

Résultat de l’exécution d’une opération d’application de stratégie de document

Extraire des codes-barres d’un document à l’aide de l’IA

Extrayez tous les codes-barres d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC et WEBP. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de l’extraction de codes-barres à partir d’un document

Extraire des tables de données d’un document à l’aide de l’IA

Extrayez des tables, composées de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de l’extraction de tables à partir d’un document

Extraire des valeurs de champ d’un document à l’aide de l’IA

Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Champs souhaités à extraire, séparés par des virgules
FieldNames string

Champs souhaités à extraire, séparés par des virgules

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de l’extraction de champs à partir d’un document

Extraire des valeurs de champ d’un document à l’aide de l’IA avancée

Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

InputFile
InputFile byte

Fichier de document d’entrée pour effectuer l’opération sous forme de tableau d’octets

Nom de champ
FieldName string

Nom du champ à extraire

FieldOptional
FieldOptional boolean

Facultatif : True si le champ est facultatif, false si nécessaire (valeur par défaut)

FieldDescription
FieldDescription string

Facultatif mais recommandé : Description du champ : utilisez-le pour décrire ce qu’est le champ, comment il est mis en forme, ce qui est unique à son sujet, etc.

FieldExample
FieldExample string

Facultatif : Exemple d’étiquette ou de valeur du champ

MaximumPagesProcessed
MaximumPagesProcessed integer

Facultatif : limiter le nombre de pages traitées

Preprocessing
Preprocessing string

Facultatif : définissez le niveau de prétraitement de l’image pour améliorer la précision. Les valeurs possibles sont « Auto », « SmoothEdges », « SmoothEdgesPlus », « ContrastEdges », « ContrastEdgesPlus », « Invert », « Binarize », « Compatability » et « None ». La valeur par défaut est Automatique. Définissez sur SmoothEdges pour lisser les bords durs dans l’image d’entrée afin d’améliorer la précision de la reconnaissance. Définissez sur SmoothEdgesPlus pour lisser les bords durs à un degré plus élevé. Définissez sur ContrastEdges et ContrastEdgesPlus pour améliorer le contraste et la lisibilité pour les images noirs et blancs ou gris de faible qualité. Définissez sur Invert pour inverser l’image d’entrée. Définissez la valeur Binarize pour binariser l’image d’entrée. Définissez la compatibilité sur Compatability pour une compatibilité maximale des fonctionnalités PDF.

ResultCrossCheck
ResultCrossCheck string

Facultatif : définissez le niveau de vérification croisée de la précision de sortie à effectuer sur l’entrée. Les valeurs possibles sont « None », « Advanced » et « Ultra ». La valeur par défaut est None. Ultra génère la plus grande précision, mais au coût des temps de traitement plus longs.

RotateImageDegrees
RotateImageDegrees double

Facultatif : faire pivoter l’image d’entrée avant la reconnaissance par le nombre spécifié de degrés ; les valeurs valides sont comprises entre -360 et +360.

Retours

Résultat de l’extraction de champs à partir d’un document

Extraire des valeurs de champ d’un document à l’aide d’Advanced AI en tant que travail batch

Crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez les valeurs de champ (par exemple, numéro de facture, date de facture, numéro de téléphone de carte de visite, etc.) à partir d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

InputFile
InputFile byte

Fichier de document d’entrée pour effectuer l’opération sous forme de tableau d’octets

Nom de champ
FieldName string

Nom du champ à extraire

FieldOptional
FieldOptional boolean

Facultatif : True si le champ est facultatif, false si nécessaire (valeur par défaut)

FieldDescription
FieldDescription string

Facultatif mais recommandé : Description du champ : utilisez-le pour décrire ce qu’est le champ, comment il est mis en forme, ce qui est unique à son sujet, etc.

FieldExample
FieldExample string

Facultatif : Exemple d’étiquette ou de valeur du champ

MaximumPagesProcessed
MaximumPagesProcessed integer

Facultatif : limiter le nombre de pages traitées

Preprocessing
Preprocessing string

Facultatif : définissez le niveau de prétraitement de l’image pour améliorer la précision. Les valeurs possibles sont « Auto », « SmoothEdges », « SmoothEdgesPlus », « ContrastEdges », « ContrastEdgesPlus », « Invert », « Binarize », « Compatability » et « None ». La valeur par défaut est Automatique. Définissez sur SmoothEdges pour lisser les bords durs dans l’image d’entrée afin d’améliorer la précision de la reconnaissance. Définissez sur SmoothEdgesPlus pour lisser les bords durs à un degré plus élevé. Définissez sur ContrastEdges et ContrastEdgesPlus pour améliorer le contraste et la lisibilité pour les images noirs et blancs ou gris de faible qualité. Définissez sur Invert pour inverser l’image d’entrée. Définissez la valeur Binarize pour binariser l’image d’entrée. Définissez la compatibilité sur Compatability pour une compatibilité maximale des fonctionnalités PDF.

ResultCrossCheck
ResultCrossCheck string

Facultatif : définissez le niveau de vérification croisée de la précision de sortie à effectuer sur l’entrée. Les valeurs possibles sont « None », « Advanced » et « Ultra ». La valeur par défaut est None. Ultra génère la plus grande précision, mais au coût des temps de traitement plus longs.

RotateImageDegrees
RotateImageDegrees double

Facultatif : faire pivoter l’image d’entrée avant la reconnaissance par le nombre spécifié de degrés ; les valeurs valides sont comprises entre -360 et +360.

Retours

Résultat de l’exécution d’un travail de traitement par lots de documents fractionnés

Extraire du texte d’un document à l’aide de l’IA

Extrayez du texte brut à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Prend en charge un large éventail de langues. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de l’extraction de texte à partir d’un document

Extraire du texte d’un document à l’aide de l’IA en tant que travail Batch

Crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Prend en charge un large éventail de langues. Nécessite un déploiement d’instance managée ou de cloud privé.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de l’exécution d’un travail de traitement par lots de documents fractionnés

Extraire la classification ou la catégorie d’un document à l’aide de l’IA

Extrayez la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document utilisant l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Classification souhaitée à extraire
Categories string

Classification souhaitée à extraire

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de la classification d’un document à l’aide de l’IA

Extraire la classification ou la catégorie d’un document à l’aide de l’IA avancée

Extrayez la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

InputFile
InputFile byte

Fichier de document d’entrée pour effectuer l’opération sous forme de tableau d’octets

CategoryName (Nom de catégorie)
CategoryName string

Nom de la classification

CategoryDescription
CategoryDescription string

Facultatif mais recommandé : Description de la classification en langugage naturel

Preprocessing
Preprocessing string

Facultatif : définissez le niveau de prétraitement de l’image pour améliorer la précision. Les valeurs possibles sont « Auto », « SmoothEdges », « SmoothEdgesPlus », « Compatability » et « None ». La valeur par défaut est Automatique. Définissez sur SmoothEdges pour lisser les bords durs dans l’image d’entrée afin d’améliorer la précision de la reconnaissance. Définissez sur SmoothEdgesPlus pour lisser les bords durs à un degré plus élevé. Définissez la compatibilité sur Compatability pour une compatibilité maximale des fonctionnalités PDF.

ResultCrossCheck
ResultCrossCheck string

Facultatif : définissez le niveau de vérification croisée de la précision de sortie à effectuer sur l’entrée. Les valeurs possibles sont « None », « Advanced », « Ultra » et « Hyper ». La valeur par défaut est None. Ultra et Hyper produisent la précision la plus élevée, mais au coût des temps de traitement plus longs.

MaximumPagesProcessed
MaximumPagesProcessed integer

Facultatif : limiter le nombre de pages traitées

RotateImageDegrees
RotateImageDegrees double

Facultatif : faire pivoter l’image d’entrée avant la reconnaissance par le nombre spécifié de degrés ; les valeurs valides sont comprises entre -360 et +360.

Retours

Résultat de la classification d’un document à l’aide de l’IA

Extraire la classification ou la catégorie d’un document à l’aide de l’IA en tant que travail batch

Crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez la classification ou la catégorie (par exemple, facture, reçu, formulaire fiscal ou formulaire 1040, formulaire 1040 EZ, etc.) à partir d’un document utilisant l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.

Paramètres

Nom Clé Obligatoire Type Description
Classification souhaitée à extraire
Categories string

Classification souhaitée à extraire

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de l’exécution d’un travail de traitement par lots de documents fractionnés

Extraire le résumé d’un document à l’aide de l’IA

Crée un résumé de 1 paragraphe du document d’entrée à l’aide de l’intelligence artificielle. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de la synthèse d’un document

Extraire tous les champs et tables de données d’un document à l’aide de l’IA

Extrayez tous les champs et tables, composés de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG et WEBP. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Facultatif : définissez le niveau de prétraitement de l’image pour améliorer la précision. ...
preprocessing string

Facultatif : définissez le niveau de prétraitement de l’image pour améliorer la précision. ...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de l’extraction de champs à partir d’un document

Extraire tous les champs et tables de données d’un document à l’aide de l’IA en tant que travail batch

Crée un travail de traitement par lots asynchrone pour le traitement d’un document volumineux en tant que travail de traitement par lots IA. Extrayez tous les champs et tables, composés de lignes et de colonnes de données, à partir d’un document à l’aide de l’IA. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Nécessite un déploiement d’instance managée ou de cloud privé.

Paramètres

Nom Clé Obligatoire Type Description
Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...
recognitionMode string

Optionnel; Mode de reconnaissance - Avancé (par défaut) fournit le plus haut...

Document d’entrée, ou photos d’un document, pour extraire des données à partir de
InputFile file

Document d’entrée, ou photos d’un document, pour extraire des données à partir de

Retours

Résultat de l’exécution d’un travail de traitement par lots de documents fractionnés

Obtenir l’état et le résultat d’un travail de traitement par lots de documents extraits

Retourne le résultat du travail asynchrone : les états possibles peuvent être DÉMARRÉs ou TERMINÉs. Cette API est disponible uniquement pour les déploiements cloudmersive Managed Instance et Cloud privé.

Paramètres

Nom Clé Obligatoire Type Description
ID du travail par lots pour obtenir l’état de
AsyncJobID string

ID du travail par lots pour obtenir l’état de

Retours

Résultat de l’exécution d’une opération de travail par lots

Répondre aux questions sur un document de manière structurée à l’aide de l’IA avancée

Répondez booléen (oui/non), aux questions de choix multiples et de réponse libre sur le contenu d’un document à l’aide de l’IA avancée. Les formats de document d’entrée pris en charge incluent DOCX, PDF, PNG et JPG. Consomme 100 appels d’API par page.

Paramètres

Nom Clé Obligatoire Type Description
InputFile
InputFile byte

Fichier d’entrée en tant que tableau d’octets

QuestionId
QuestionId string

ID unique de la question, par exemple 1 ou 2A

QuestionText
QuestionText string

Question en langage naturel pour poser le document dans lequel la réponse est résolue en OUI ou NON, par exemple « Ce document est-il signé et contre-signé par les deux parties ? »

QuestionId
QuestionId string

ID unique de la question, par exemple 1 ou 2A

QuestionText
QuestionText string

Question en langage naturel pour poser le document dans lequel la réponse se résout à un nombre fixe de choix fournis, par exemple « Quelle est la loi en vigueur de ce contrat ? »

ChoiceId
ChoiceId string

ID unique du choix de réponse, par exemple 3C

ChoiceText
ChoiceText string

Texte de description de ce choix, par exemple « Delaware »

QuestionId
QuestionId string

ID unique de la question, par exemple 7 ou 5A

QuestionText
QuestionText string

Question en langage naturel pour poser le document dans lequel la réponse est résolue en réponse libre, par exemple « Qui est l’équivalent de ce contrat ? »

RecognitionMode
RecognitionMode string

Optionnel; Mode de reconnaissance - Normal (valeur par défaut) fournit la plus grande précision mais une vitesse plus lente, tandis que Normal fournit une réponse plus rapide mais une précision inférieure pour les images de faible qualité

Retours

Résultat de l’exécution d’une opération de réponse aux questions de document

Définitions

DocumentAdvancedClassificationResult

Résultat de la classification d’un document à l’aide de l’IA

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

DocumentCategoryResult
DocumentCategoryResult string

Catégorie appliquée au document ; si une catégorie n’a pas pu être identifiée, « autre » sera utilisée. Les espaces sont remplacés par des traits de soulignement.

Score de Confiance
ConfidenceScore double

Score de confiance compris entre 0,0 et 1,0, où les valeurs > 0,8 indiquent une confiance élevée

DocumentClassificationResult

Résultat de la classification d’un document à l’aide de l’IA

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

DocumentCategoryResult
DocumentCategoryResult string

Catégorie appliquée au document ; si une catégorie n’a pas pu être identifiée, « autre » sera utilisée. Les espaces sont remplacés par des traits de soulignement.

DocumentPolicyResult

Résultat de l’exécution d’une opération d’application de stratégie de document

Nom Chemin d’accès Type Description
CleanResult
CleanResult boolean

True si le document est conforme à toutes les stratégies, et false s’il ne le fait pas

RiskScore
RiskScore double

Score de risque compris entre 0,0 et 1,0 où les valeurs supérieures à 0,5 augmentent les niveaux de risque

RuleViolations
RuleViolations array of PolicyRuleViolation

Violations de la stratégie

DocumentQuestionAnswerItem

Répondre à une question d’entrée

Nom Chemin d’accès Type Description
QuestionId
QuestionId string

ID de la question d’entrée

AnswerValue
AnswerValue string

Valeur de réponse de réponse, mise en forme sous forme de chaîne, pour cette question. Les questions booléennes retournent OUI ou NON.

AnswerRationale
AnswerRationale string

Justification expliquant pourquoi cette réponse a été donnée

Score de Confiance
ConfidenceScore double

Score de confiance compris entre 0,0 et 1,0 où les valeurs supérieures à 0,8 indiquent une confiance élevée

DocumentQuestionAnswersResult

Résultat de l’exécution d’une opération de réponse aux questions de document

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si l’opération a été effectuée correctement ou false sinon

Score de Confiance
ConfidenceScore double

Score de confiance compris entre 0,0 et 1,0 où les valeurs supérieures à 0,8 indiquent une confiance élevée

AnswerResults
AnswerResults array of DocumentQuestionAnswerItem

ExtractBarcodesAiResponse

Résultat de l’extraction de codes-barres à partir d’un document

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

Code-barresResults
BarcodeResults array of ExtractedBarcodeItem

Résultats de la valeur de table de l’opération d’extraction

ExtractDocumentBatchJobResult

Résultat de l’exécution d’un travail de traitement par lots de documents fractionnés

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

AsyncJobID
AsyncJobID string

Lors de la création d’un travail, un ID de travail asynchrone est retourné. Utilisez l’API GetAsyncJobStatus pour vérifier l’état de ce travail à l’aide de l’AsyncJobID et obtenir le résultat une fois terminé.

ExtractDocumentJobStatusResult

Résultat de l’exécution d’une opération de travail par lots

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si l’opération pour vérifier l’état du travail a réussi, false sinon

AsyncJobStatus
AsyncJobStatus string

Retourne l’état du travail asynchrone, le cas échéant. Les états possibles sont STARTED et COMPLETED

AsyncJobID
AsyncJobID string

ID du travail

ExtractTextResult
ExtractTextResult ExtractTextResponse

Résultat de l’extraction de texte à partir d’un document

ExtractFieldsAndTablesResult
ExtractFieldsAndTablesResult ExtractFieldsAndTablesResponse

Résultat de l’extraction de champs à partir d’un document

ExtractFieldsResult
ExtractFieldsResult ExtractFieldsResponse

Résultat de l’extraction de champs à partir d’un document

ExtractClassificationResult
ExtractClassificationResult DocumentClassificationResult

Résultat de la classification d’un document à l’aide de l’IA

Message d'erreur
ErrorMessage string

Message d’erreur (le cas échéant)

ExtractFieldsAdvancedResponse

Résultat de l’extraction de champs à partir d’un document

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

Results
Results array of FieldAdvancedValue

Résultats de la valeur de champ de l’opération d’extraction

Score de Confiance
ConfidenceScore double

Score de confiance compris entre 0,0 et 1,0, où les valeurs > 0,8 indiquent une confiance élevée

ExtractFieldsAndTablesResponse

Résultat de l’extraction de champs à partir d’un document

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

FieldResults
FieldResults array of FieldValue

Résultats de la valeur de champ de l’opération d’extraction

TableResults
TableResults array of TableResult

Résultats de la valeur de table de l’opération d’extraction

ExtractFieldsResponse

Résultat de l’extraction de champs à partir d’un document

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

Results
Results array of FieldValue

Résultats de la valeur de champ de l’opération d’extraction

ExtractTablesResponse

Résultat de l’extraction de tables à partir d’un document

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

TableResults
TableResults array of TableResult

Résultats de la valeur de table de l’opération d’extraction

ExtractTextResponse

Résultat de l’extraction de texte à partir d’un document

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

PageResults
PageResults array of ExtractedTextPage

Résultats de la page de l’opération d’extraction

ExtractedBarcodeItem

Résultat du code-barres extrait

Nom Chemin d’accès Type Description
BarcodeType
BarcodeType string

Type de code-barres identifié, valeurs possibles : AZTEC, CODABAR, CODE_39, CODE_93, CODE_128, DATA_MATRIX, EAN_8, EAN_13, ITF, MAXICODE, PDF_417, QR_CODE, RSS_14, RSS_EXPANDED, UPC_A, UPC_E, All_1D, UPC_EAN_EXTENSION, MSI, PLESSEY, IMB, UNKNOWN

Code-barresValue
BarcodeValue string

Valeur du code-barres sous forme de chaîne

ExtractedTextPage

Page extraite d’un document d’entrée

Nom Chemin d’accès Type Description
PageNumber
PageNumber integer

Index de numéro de page, basé sur 1

TextResult
TextResult string

Contenu texte de la page

FieldAdvancedValue

Résultat de la valeur de champ de l’extraction de champs à partir d’un document

Nom Chemin d’accès Type Description
Nom de champ
FieldName string

Nom du champ (notez que les espaces seront remplacés par un trait de soulignement)

FieldStringValue
FieldStringValue string

Valeur de chaîne du champ extrait du document

FieldValue

Résultat de la valeur de champ de l’extraction de champs à partir d’un document

Nom Chemin d’accès Type Description
Nom de champ
FieldName string

Nom du champ (notez que les espaces seront remplacés par un trait de soulignement)

FieldStringValue
FieldStringValue string

Valeur de chaîne principale ou première du champ extrait du document

AdditionalFieldStringValues
AdditionalFieldStringValues array of string

Valeurs supplémentaires pour ce champ lorsque le même champ est présent avec plusieurs valeurs, par exemple, si deux instances du même formulaire se produisent dans le même document

PolicyRuleViolation

Instances d’une violation de règle de stratégie

Nom Chemin d’accès Type Description
ID de la règle
RuleId string

ID de la règle ; si aucun ID n’a été fourni, l’ID est l’index de base 1 de la règle

RuleViolationRiskScore
RuleViolationRiskScore double

Score de risque compris entre 0,0 et 1,0 où les valeurs supérieures à 0,5 augmentent les niveaux de risque

RuleViolationRationale
RuleViolationRationale string

Justification du langage naturel de l’IA pour la raison pour laquelle cette stratégie a été violée

SummarizeDocumentResponse

Résultat de la synthèse d’un document

Nom Chemin d’accès Type Description
Réussite
Successful boolean

True si elle réussit, false sinon

DocumentSummaryText
DocumentSummaryText string

Résumé du document

TableResult

Table extraite d’un document

Nom Chemin d’accès Type Description
Titre
Title string

Titre du tableau (facultatif)

Rows
Rows array of TableResultRow

Lignes de la table

TableResultCell

Cellule d’une ligne d’un tableau extrait d’un document

Nom Chemin d’accès Type Description
CellHeader
CellHeader string

En-tête de colonne de cellule

CellValue
CellValue string

Valeur de cellule sous forme de chaîne

TableResultRow

Ligne d’une table extraite d’un document

Nom Chemin d’accès Type Description
Cellules
Cells array of TableResultCell

Cellules de la ligne