Bien démarrer : Form Recognizer Studio

Cet article s’applique à :Coche Form Recognizer v3.0Form Recognizer v3.0. Version antérieure :Form Recognizer v2.1

Form Recognizer Studio est un outil en ligne permettant d’explorer, de comprendre et d’intégrer visuellement des fonctionnalités du service Form Recognizer dans vos applications. Vous pouvez commencer à explorer les modèles pré-entraînés avec un exemple ou vos propres documents. Vous pouvez également créer des projets pour générer des modèles personnalisés et référencer ces modèles dans vos applications à l’aide du Kit de développement logiciel (SDK) Python et d’autres démarrages rapides.

Prérequis pour les nouveaux utilisateurs

Conseil

Créez une ressource Cognitive Services si vous envisagez d’accéder à plusieurs services Cognitive Services sous un seul point de terminaison/clé. Pour l’accès à Form Recognizer uniquement, créez une ressource Form Recognizer. Notez que vous avez besoin d’une ressource de service unique si vous avez l’intention d’utiliser l’authentification Azure Active Directory.

Modèles

Les modèles prédéfinis vous aident à ajouter des fonctionnalités Form Recognizer à vos applications sans avoir à créer, à former et à publier vos propres modèles. Vous pouvez choisir entre plusieurs modèles prédéfinis, chacun ayant son propre ensemble de champs de données pris en charge. Le choix de modèle à utiliser pour l’opération d’analyse dépend du type de document à analyser. Form Recognizer prend actuellement en charge les modèles prédéfinis suivants :

Analyse de documents

  • Document général : extrait le texte, les tableaux, la structure, les paires clé-valeur.
  • Disposition : Extrait le texte, les tableaux, les marques de sélection et les informations de structure à partir de documents (PDF, TIFF) et d’images (JPG, PNG, BMP).
  • Lecture : extrait les lignes de texte, les mots, leur emplacement, les langues détectées et le style manuscrit s’il est détecté dans des documents (PDF, TIFF) et des images (JPG, PNG, BMP).

Prédéfinie

  • Facture : Extrait le texte, les marques de sélection, les tableaux, les paires clé-valeur et les informations clés des factures.
  • Reçu : Extrait le texte et les informations clés des reçus.
  • Carte d’assurance maladie : extrait l’assureur, le membre, l’ordonnance, le numéro du groupe et d’autres informations clés des cartes d’assurance maladie américaines.
  • W-2 : extrait le texte et les informations clés de formulaires fiscaux W-2.
  • Document d’identité : Extrait le texte et les informations clés des permis de conduire et des passeports internationaux.
  • Carte de visite : Extrait le texte et les informations clés des cartes de visite.

Custom

  • Modèles personnalisés d’extraction : extrait des informations à partir de formulaires et de documents avec des modèles personnalisés d’extraction. Entraînez rapidement un modèle en n’étiquetant que cinq documents exemples.
  • Modèle de classification personnalisée : entraîne un classifieur personnalisé à faire la distinction entre les différents types de documents dans vos applications. Entraînez rapidement un modèle avec seulement deux classes et cinq exemples pour chaque classe.

Modèles contrôlés d’aperçu

Notes

Pour demander l’accès contrôlé aux modèles d’aperçu dans Form Recognizer Studio, remplissez et envoyez le formulaire de demande d’aperçu privé Form Recognizer.

  • Document général avec champs de requête : extrait les étiquettes, les valeurs telles que les noms, les dates et les montants dans les documents.
  • Contrat : extrait les informations sur le titre et les parties signataires (dont les noms, les références et les adresses) des contrats.
  • Carte de vaccination : extrait le nom du titulaire de la carte, le fournisseur de service de santé et les dossiers de vaccination à partir des cartes de vaccination covid-19 des États-Unis.
  • Formulaire fiscal US 1098 : extrait les informations sur les intérêts hypothécaires à partir de formulaires fiscaux US 1098.
  • Formulaire fiscal US 1098-E : extrait les prêts étudiants à partir de formulaires fiscaux US 1098-E.
  • Formulaire fiscal US 1098-T : extrait les informations sur les frais de scolarité à partir de formulaires fiscaux US 1098-T.

Notes

Pour demander l’accès contrôlé aux modèles d’aperçu dans Form Recognizer Studio, remplissez et envoyez le formulaire de demande d’aperçu privé Form Recognizer.

Une fois que vous avez terminé les étapes préalables requises, accédez à Form Recognizer Studio General Documents.

Dans l’exemple suivant, nous utilisons la fonctionnalité Documents généraux. Les étapes pour utiliser d’autres fonctionnalités pré-entraînées à l’instar des modèles Formulaire fiscal W2, Lecture, Disposition, Facture, Reçu, Carte de visite et Documents d’identité se ressemblent.

Sélection de l’API General Document pour analyser un document dans Form Recognizer Studio.

  1. Sélectionnez une fonctionnalité du service Form Recognizer dans la page d’accueil de Studio.

  2. Cet étape est un unique, sauf si vous avez déjà sélectionné la ressource de service lors d’une utilisation antérieure. Sélectionnez votre abonnement Azure, votre groupe de ressources et votre ressource. (Vous pouvez modifier les ressources à tout moment en sélectionnant « Paramètres » dans le menu supérieur.) Vérifiez et confirmez vos sélections.

  3. Sélectionnez le bouton Analyser pour exécuter l’analyse sur l’exemple de document ou essayez votre document en utilisant la commande Ajouter.

  4. Utilisez les contrôles au bas de l’écran pour effectuer un zoom avant et arrière et faire pivoter l’affichage du document.

  5. Observez le contenu extrait mis en surbrillance dans la vue du document. Placez la souris sur les clés et les valeurs pour afficher les détails.

  6. Sous l’onglet Résultat de la section de sortie, parcourez la sortie JSON pour comprendre le format de la réponse du service.

  7. Sous l’onglet Code, parcourez l’exemple de code pour l’intégration. Copiez et téléchargez pour commencer.

Prérequis supplémentaires pour les projets personnalisés

En plus du compte Azure et d’une ressource Form Recognizer ou Cognitive Services, il vous faut :

Conteneur de stockage d'objets blob Azure

Un compte de Stockage Blob Azure de performances standard. Vous créez des conteneurs pour stocker et organiser vos données d’entraînement dans votre compte de stockage. Si vous ignorez comment créer un compte de stockage Azure avec un conteneur, suivez les démarrages rapides suivants :

  • Créer un compte de stockage. Lorsque vous créez votre compte de stockage, veillez à sélectionner performanceStandard dans le champ Détails de l’instance → Performance.
  • Créer un conteneur. Lors de la création de votre conteneur, définissez le champ Niveau d’accès public sur Conteneur (accès en lecture anonyme pour les conteneurs et les objets blob) dans la fenêtre Nouveau conteneur .

Configuration de CORS

CORS (Cross Origin Resource Sharing) doit être configuré sur votre compte Stockage Azure pour qu’il soit accessible à partir de Form Recognizer Studio. Pour configurer CORS dans le Portail Azure, vous devez accéder à l’onglet CORS de votre compte de stockage.

  1. Sélectionnez l’onglet CORS pour le compte de stockage.

    Capture d’écran du menu de paramétrage CORS dans le Portail Azure.

  2. Commencez par créer une entrée CORS dans le service BLOB.

  3. Définissez le paramètre Origines autorisées sur https://formrecognizer.appliedai.azure.com.

    Capture d’écran montrant la configuration de CORS pour un compte de stockage.

    Conseil

    Vous pouvez utiliser le caractère générique « * » au lieu d’un domaine précis pour autoriser tous les domaines d'origine à effectuer des demandes via CORS.

  4. Sélectionnez les 8 options disponibles pour Méthodes autorisées.

  5. Approuvez tous les En-têtes autorisés et tous les En-têtes exposés en entrant un * dans chaque champ.

  6. Affectez à Âge maximal la valeur 120 secondes ou toute autre valeur acceptable.

  7. Sélectionnez le bouton enregistrer en haut de la page pour enregistrer les changements apportés.

CORS doit à présent être configuré pour utiliser le compte de stockage à partir de Form Recognizer Studio.

Ensemble d’exemples de documents

  1. Accédez au portail Azure et naviguez comme suit : votre compte de stockageStockage des donnéesConteneurs

    Capture d’écran : menu de stockage des données dans le portail Azure.

  2. Sélectionnez un conteneur dans la liste.

  3. Sélectionnez Télécharger dans le menu en haut de la page.

    Capture d’écran : bouton de chargement du conteneur dans le portail Azure.

  4. La fenêtre Charger l’objet blob s’affiche.

  5. Sélectionnez le ou les fichiers à charger.

    Capture d’écran : fenêtre télécharger l’objet blob dans le portail Azure.

Notes

Par défaut, Studio utilisera uniquement les formulaires situés à la racine de votre conteneur. Toutefois, vous pouvez utiliser des données organisées en dossiers en spécifiant le chemin d'accès au dossier dans les étapes de création du projet de formulaire personnalisé. ConsultezOrganiser vos données dans des sous-dossiers

Modèles personnalisés

Pour créer des modèles personnalisés, vous commencez par configurer votre projet :

  1. Sur la page d’accueil Studio, sélectionnez la carte Modèle personnalisé pour ouvrir la page Modèles personnalisés.

  2. Utilisez la commande « Créer un projet » pour démarrer l’Assistant Nouvelle configuration de projet.

  3. Entrez les détails du projet, sélectionnez l’abonnement Azure et la ressource, ainsi que le conteneur de stockage Blob Azure qui contient vos données.

  4. Passez en revue et envoyez vos paramètres pour créer le projet.

  5. Dans la vue Étiquetage, définissez les étiquettes et les types que vous souhaitez extraire.

  6. Sélectionnez le texte dans le document et cliquez sur l’étiquette dans la liste déroulante ou dans le volet des étiquettes.

  7. Étiquetez quatre documents supplémentaires pour obtenir au moins cinq documents étiquetés.

  8. Sélectionnez la commande Entraîner et entrez le nom du modèle, puis indiquez si vous souhaitez que le modèle personnalisé (formulaire) ou le modèle neuronal (document) personnalisé commence l’entraînement de votre modèle personnalisé.

  9. Une fois que le modèle est prêt, utilisez la commande Tester pour le valider avec vos documents de test et observer les résultats.

Démonstration de modèle personnalisé Form Recognizer

Étiquetage en tant que tableaux

Notes

  • Avec la version d’API 2022-06-30-préversion et versions ultérieures, les modèles personnalisés ajoutent la prise en charge des champs tabulaires sur plusieurs pages (tables).
  • Avec la version d’API versions 2022-06-30-préversion et ultérieures, les modèles neuraux personnalisés prennent en charge les champs tabulaires (tables) et les modèles formés avec la version d’API 2022-08-31, ou version ultérieure acceptent les étiquettes de champs tabulaires.
  1. Utilisez la commande Supprimer pour supprimer les modèles qui ne sont pas requis.

  2. Téléchargez les détails du modèle pour les voir hors connexion.

  3. Sélectionnez plusieurs modèles et combinez-les dans un nouveau modèle à utiliser dans vos applications.

Utilisation de tables en tant que modèle visuel :

Pour les modèles de formulaire personnalisés, durant la création de vos modèles personnalisés, vous devrez peut-être extraire des collections de données de vos documents. Les collectes de données peuvent apparaître sous plusieurs formats. Utilisation de tables en tant que modèle visuel :

  • Nombre dynamique ou variable de valeurs (lignes) pour un ensemble donné de champs (colonnes)

  • Collection spécifique de valeurs pour un ensemble donné de champs (colonnes et/ou lignes)

Étiqueter en tant que tableau dynamique

Utilisez des tables dynamiques afin d’extraire le nombre variable de valeurs (lignes) pour un ensemble donné de champs (colonnes) :

  1. Ajoutez une nouvelle étiquette de type « Tableau », sélectionnez le type « Tableau dynamique » et nommez votre étiquette.

  2. Ajoutez le nombre de colonnes (champs) et de lignes (pour les données) dont vous avez besoin.

  3. Sélectionnez le texte dans votre page, puis cliquez sur la cellule à affecter au texte. Répétez cette opération pour toutes les lignes et toutes les colonnes de toutes les pages de tous les documents.

Exemple d’étiquetage en tant que tableau dynamique dans Form Recognizer

Étiqueter en tant que tableau fixe

Utilisez des tables fixes afin d’extraire une collection spécifique de valeurs pour un ensemble donné de champs (colonnes et/ou lignes) :

  1. Créez une nouvelle étiquette de type « Tableau », sélectionnez le type « Tableau fixe » et nommez-le.

  2. Ajoutez le nombre de colonnes et de lignes dont vous avez besoin qui doivent correspondre aux deux ensembles de champs.

  3. Sélectionnez le texte dans votre page, puis cliquez sur la cellule pour l’affecter au texte. Répétez cette opération pour les autres documents.

Exemple d’étiquetage en tant que tableau fixe dans Form Recognizer

Détection de signature

Notes

Les champs de signature ne sont actuellement pris en charge que pour les modèles personnalisés. Lors de l’entraînement d’un modèle neuronal personnalisé, les champs de signature étiquetés sont ignorés.

Pour étiqueter en vue d’une détection de signature : (formulaire personnalisé uniquement)

  1. Dans la vue d’étiquetage, créez une nouvelle étiquette de type « Signature » et nommez-la.

  2. Utilisez la commande Région pour créer une zone rectangulaire à l’emplacement attendu de la signature.

  3. Sélectionnez la région dessinée et cliquez sur l’étiquette de type Signature pour l’affecter à votre région dessinée. Répétez cette opération pour les autres documents.

Exemple d’étiquetage pour la détection de signature dans Form Recognizer

Étapes suivantes

Prise en main de Form Recognizer Studio.