Partager via


Nouveautés d’Azure AI Intelligence documentaire

Ce contenu s’applique à : coche v4.0 (préversion) coche v3.1 (GA) coche v3.0 (GA) coche v2.1 (GA)

Le service Intelligence documentaire est mis à jour régulièrement. Ajoutez cette page aux favoris pour vous tenir informé des notes de publication, des améliorations apportées aux fonctionnalités et de la plus récente documentation.

Important

Les versions d’API en préversion sont mises hors service une fois l’API de disponibilité générale publiée. La version d’API 2023-02-28-preview va être mise hors service. Si vous utilisez toujours l’API en préversion ou les versions de Kit de développement logiciel (SDK) associées, veuillez mettre à jour votre code pour cibler la dernière version d’API 2023-07-31 (disponibilité générale).

Août 2024

L'API REST de Document Intelligence 2024-07-31-preview est désormais disponible. L’API de préversion introduit de nouvelles fonctionnalités mises à jour :

  • La version préliminaire publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes. Le nouveau modèle d'extraction de champ de document dans AI Studio est uniquement disponible dans la région Centre-Nord des États-Unis :

  • USA Est

  • USA Ouest 2

  • Europe Ouest

  • USA Centre Nord 

  • 🆕 Modèle d'extraction de champ de document (génératif personnalisé)

    • Utilisez l’IA générative pour extraire des champs de documents et de formulaires. Document Intelligence propose désormais un nouveau modèle d'extraction de champs de documents qui utilise de grands modèles de langage (LLM) pour extraire des champs de documents non structurés ou de formulaires structurés avec une grande variété de modèles visuels. Avec des valeurs fondées et des scores de confiance, la nouvelle extraction basée sur l'IA générative s'intègre dans vos processus existants.
  • 🆕 Composition de modèles avec des classificateurs personnalisés

    • Document Intelligence ajoute désormais la prise en charge de la composition d'un modèle avec un modèle de classification personnalisé explicite. En savoir plus sur les avantages de l’utilisation de la nouvelle fonctionnalité de composition.
  • Modèle de classification personnalisé

    • Le modèle de classification personnalisé prend désormais également en charge la mise à jour du modèle sur place.
    • Le modèle de classification personnalisé ajoute la prise en charge de l'opération de copie de modèle pour permettre la sauvegarde et la reprise après sinistre.
    • Le modèle de classification personnalisé prend désormais en charge la spécification explicite des pages à classer à partir d'un document d'entrée.
  • 🆕 Modèle de documents hypothécaires

    • Extraire les informations de l’évaluation (formulaire 1004).
    • Extraire les informations de la validation de l'emploi (formulaire 1005).
  • 🆕 Vérifier le modèle

    • Extraire le bénéficiaire, le montant, la date et d'autres informations pertinentes des chèques.
  • 🆕 Modèle de bulletin de paie

    • Nouveau pré-configuré pour traiter les talons de paie afin d'extraire les salaires, les heures, les déductions, le salaire net et plus encore.
  • 🆕 Modèle de relevé bancaire

    • Nouveau pré-intégré pour extraire les informations de compte, y compris les soldes de début et de fin, les détails des transactions à partir des relevés bancaires.
  • 🆕 Modèle fiscal américain

    • Nouveau modèle fiscal américain unifié qui peut extraire des formulaires tels que W-2, 1098, 1099 et 1040.
  • 🆕 PDF consultable. Le modèle de lecture prédéfini prend désormais en charge la sortie PDF pour télécharger des PDF avec du texte intégré à partir des résultats d'extraction, ce qui permet d'utiliser le PDF dans des scénarios tels que la recherche de copie de contenu.

  • Le modèle de mise en page prend désormais en charge une détection des figures améliorée, où les figures des documents peuvent désormais être téléchargées sous forme de fichier image à utiliser pour une meilleure compréhension des figures. Le modèle de mise en page présente également des améliorations du modèle OCR pour le ciblage du texte numérisé pour les caractères uniques, le texte encadré et les documents texte denses.

  • 🆕 API par lots

    • Document Intelligence ajoute désormais la prise en charge de l'opération d'analyse par lots pour prendre en charge l'analyse d'un ensemble de documents afin de simplifier l'expérience du développeur et d'améliorer l'efficacité.
  • Fonctionnalités du module complémentaire

    • La qualité d'extraction des champs de requête de l'IA est améliorée avec le dernier modèle.

Mai 2024

Document Intelligence Studio ajoute la prise en charge de l’authentification Microsoft Entra (anciennement Azure Active Directory). Pour plus d’informations, consultez Vue d’ensemble de Document Intelligence Studio.

Février 2024

L'API REST de Document Intelligence 2024-07-31-preview est désormais disponible. L’API de préversion introduit de nouvelles fonctionnalités mises à jour :

  • La version préliminaire publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes :

    • USA Est
    • USA Ouest 2
    • Europe Ouest
  • Le modèle de disposition prend désormais en charge la détection de figure et l’analyse hiérarchique de la structure des documents (sections et sous-sections). La qualité de l’ordre de lecture et de la détection des rôles logiques par l’IA est également améliorée.

  • Modèles d’extraction personnalisés

    • Les modèles d’extraction personnalisés prennent désormais en charge les scores de confiance de cellule, de ligne et de table. En savoir plus sur la confiance de table, de ligne et de cellule.
    • Les modèles d’extraction personnalisés ont des améliorations de la qualité de l’IA pour l’extraction de champs.
    • Le modèle d’extraction de modèle personnalisé prend désormais en charge l’extraction de champs qui se chevauchent. En savoir plus sur les champs qui se chevauchent et leur utilisation.
  • Modèle de classification personnalisé

    • Le modèle de classification personnalisé prend désormais en charge la formation incrémentielle pour les scénarios dans lesquels vous devez mettre à jour le modèle classifieur avec des échantillons ou des classes supplémentaires. En savoir plus sur la formation incrémentielle.
    • Le modèle de classification personnalisé ajoute la prise en charge des types de documents Office (.docx, .pptx et .xls). En savoir plus sur la prise en charge des types de documents développés.
  • Modèle de facture

    • Prise en charge des nouveaux paramètres régionaux :
    Paramètres régionaux Code
    Arabe (ar)
    Bulgare (bg)
    Grec (el)
    Hébreu (he)
    Macédonien (mk)
    Russe (ru) Serbe (cyrillique) (sr-cyrl)
    Ukrainien (uk)
    Thaï (th)
    Turc (tr)
    Vietnamien (vi)
    • Prise en charge des nouveaux codes monétaires :
    Devise Paramètres régionaux Code
    BAM Mark convertible de Bosnie (ba)
    BGN Lev bulgare (bg)
    ILS Nouveau shekel israélien (il)
    MKD Denar macédonien (mk)
    RUB Rouble russe (ru)
    THB Baht thaïlandais (th)
    TRY Livre turque (tr)
    UAH Hryvnia ukrainienne (ua)
    VND Dong vietnamien (vn)
    • Expansion des éléments fiscaux pris en charge pour l’Allemagne (de), l’Espagne (es), le Portugal (pt) et le Canada anglais (en-CA).
  • Modèle d’ID

  • 🆕 Documents hypothécaires

    • Extraire des informations du formulaire 1003 – Uniform Residential Loan Application.
    • Extraire des informations du formulaire 1008 – Uniform Underwriting and Transmittal Summary.
    • Extraire des informations à partir de la divulgation de clôture de l’hypothèque.
  • 🆕 Modèle de carte de crédit

    • Extraire des informations à partir de cartes bancaires.
  • 🆕 Certificat de mariage

    • Nouveau prédéfini pour extraire des informations à partir des certificats de mariage.

Décembre 2023

Les bibliothèques de clients Intelligence documentaire ciblant l’API REST 2023-10-31-preview sont désormais disponibles.

Novembre 2023

L’API REST31-10-2023-préversiond’Intelligence documentaire est désormais disponible. L’API de préversion introduit de nouvelles fonctionnalités mises à jour :

  • La version préliminaire publique 2023-10-31-préversion est actuellement disponible uniquement dans les régions Azure suivantes :

    • USA Est
    • USA Ouest 2
    • Europe Ouest
  • Modèle Read

    • Extension linguistique pour l’écriture manuscrite : russe (ru), arabe (ar), thaï (th).
    • Conformité au Cyber Executive Order (EO).
  • Modèle de disposition

    • Prise en charge des fichiers Office et HTML.
    • Prise en charge de la sortie markdown.
    • Améliorations de l’extraction de table, de l’ordre de lecture et de la détection des titres de section.
    • Dans Intelligence documentaire 2023-10-31-preview, le modèle de document général (prebuilt-document) est déconseillé. À l’avenir, pour extraire des paires clé-valeur à partir de documents, utilisez le modèle prebuilt-layout avec le paramètre de chaîne de requête features=keyValuePairs facultatif activé.
  • Modèle de reçu

    • Extrait maintenant la devise pour tous les champs liés aux prix.
  • Modèle de carte d’assurance maladie

    • Prise en charge de nouveaux champs pour les informations de Medicare et Medicaid.
  • Modèles de documents fiscaux américains

    • Nouveau modèle fiscal 1099. Prend en charge le formulaire de base 1099 et variantes suivantes : A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB​.
  • Modèle de facture

    • Prise en charge du champ KVK.
    • Prise en charge du champ BPAY.
    • Nombreuses améliorations relatives aux champs.
  • Classification personnalisée

    • Prise en charge de documents multilingues.
    • Nouvelles options de fractionnement de page : fractionnement automatique, toujours fractionner par page, aucun fractionnement.
  • Fonctionnalités du module complémentaire

    • Des champs de requête sont disponibles avec la version 2023-10-31-preview.
    • Les fonctionnalités de module complémentaire sont disponibles dans tous les modèles, à l’exception du modèle de lecture.

Remarque

Avec la publication en disponibilité générale de l’API 2022-08-31, les API en préversion associées sont dépréciées. Si vous utilisez les versions de l’API 2021-09-30-preview, 2022-01-30-preview, ou 2022-06-30-preview, mettez à jour vos applications pour cibler la version d’API 2022-08-31. Pour plus d’informations, consultez le guide de migration.

Juillet 2023

Remarque

Form Recognizer est désormais Azure AI Intelligence Documentaire !

  • Les services Azure AI Document englobent tout ce qui était auparavant connu sous le nom de Cognitive Services et Azure Applied AI Services.
  • Il n’y a aucune modification de la tarification.
  • Les noms Cognitive Services et Azure Applied AI continuent d’être utilisés dans la facturation Azure, l’analyse des coûts, la liste de prix et les API de prix.
  • Aucun changement cassant ne concerne les interfaces de programmation d’applications (API) et les bibliothèques de clients.
  • Certaines plateformes attendent toujours la mise à jour du changement de nom. Toutes les mention de Form Recognizer ou Intelligence documentaire dans notre documentation font référence au même service Azure.

Intelligence documentaire v3.1 (GA)

L’API Intelligence documentaire version 3.1 est désormais en disponibilité générale (GA) ! La version de l’API correspond à 2023-07-31. L’API v3.1 introduit de nouvelles fonctionnalités mises à jour :

Mises à jour de l’expérience utilisateur du studio Intelligence documentaire

✔️ Options d’analyse

  • Document Intelligence prend désormais en charge des fonctionnalités d’analyse plus sophistiquées et Studio autorise un point d’entrée (bouton Options d’analyse) pour configurer facilement les fonctionnalités du module complémentaire.

  • En fonction du scénario d’extraction de document, configurez la plage d’analyse, la plage de pages de document, la détection facultative et les fonctionnalités de détection Premium.

    Capture d'écran animée montrant l'utilisation du bouton d'analyse des options pour configurer les options dans Studio.

    Remarque

    L’extraction de police n’est pas visualisées dans Document Intelligence Studio. Toutefois, vous pouvez vérifier la section de styles de la sortie JSON pour obtenir les résultats de la détection de police.

✔️ Étiquetage automatique des documents avec des modèles prédéfinis ou l’un de vos propres modèles

  • Dans la page d’étiquetage des modèles d’extraction personnalisés, vous pouvez désormais étiqueter automatiquement vos documents à l’aide de l’un des modèles prédéfinis du service Intelligence documentaire ou de modèles que vous avez précédemment entraînés.

    Capture d'écran animée montrant l'étiquetage automatique dans Studio.

  • Pour certains documents, il peut y avoir des étiquettes en double après l’exécution de l’étiquette automatique. Veillez à modifier les étiquettes afin qu’il n’y ait pas d’étiquettes en double dans la page d’étiquetage par la suite.

    Capture d'écran montrant l'avertissement d'étiquette en double après l'étiquetage automatique.

✔️ Tables d’étiquetage automatique

  • Dans la page d’étiquetage du modèle d’extraction personnalisée, vous pouvez désormais étiqueter automatiquement les tables du document sans avoir à étiqueter les tables manuellement.

    Capture d'écran animée montrant l'étiquetage de table automatique dans Studio.

✔️ Ajouter des fichiers de test directement à votre jeu de données d’entraînement

  • Une fois que vous avez entraîné un modèle d’extraction personnalisé, utilisez la page de test pour améliorer la qualité de votre modèle en chargeant des documents de test dans un jeu de données d’entraînement si nécessaire.

  • Si un score de confiance faible est retourné pour certaines étiquettes, vérifiez que vos étiquettes sont correctes. Si ce n’est pas le cas, ajoutez-les au jeu de données d’entraînement et réétiquetez pour améliorer la qualité du modèle.

Capture d'écran animée montrant comment ajouter des fichiers de test à l'ensemble de données de formation.

✔️ Utiliser les options de liste de documents et les filtres dans les projets personnalisés

  • Utilisez la page d’étiquetage du modèle d’extraction personnalisé. Vous pouvez désormais naviguer facilement dans vos documents de formation en utilisant la fonctionnalité de recherche, de filtrage et de tri.

  • Utilisez le mode grille pour afficher un aperçu des documents ou utilisez l’affichage liste pour faire défiler les documents plus facilement.

    Capture d'écran des options et filtres d'affichage de la liste des documents.

✔️ Partage de projet

Mai 2023

Présentation de la documentation actualisée pour la build 2023

Avril 2023

Annonce de la publication de préversion publique de bibliothèque client la plus récente d’Intelligence documentaire

Mars 2023

Important

Les fonctionnalités 2023-02-28-preview sont actuellement disponibles uniquement dans les régions suivantes :

  • Europe Ouest
  • USA Ouest 2
  • USA Est

Février 2023


Janvier 2023

  • Modèle de reçu prédéfini : langues prises en charge ajoutées. Le modèle de reçu prend désormais en charge ces langues et paramètres régionaux ajoutés

    • Japonais : Japon (ja-JP)
    • Français : Canada (fr-CA)
    • Néerlandais : Pays-Bas (nl-NL)
    • Anglais : Émirats arabes unis (en-AE)
    • Portugais : Brésil (pt-BR)
  • Modèle de facture prédéfini : langues prises en charge ajoutées. Le modèle de facture prend désormais en charge ces langues et paramètres régionaux ajoutés

    • Anglais : États-Unis (en-US), Australie (en-AU), Canada (en-CA), Royaume-Uni (en-UK), Inde (en-IN)
    • Espagnol - Espagne (es-ES)
    • Français - France (fr-FR)
    • Italien - Italie (it-IT)
    • Portugais - Portugal (pt-PT)
    • Néerlandais : Pays-Bas (nl-NL)
  • Modèle de facture prédéfini : champs reconnus ajoutés. Le modèle de facture reconnaît maintenant ces champs ajoutés

    • Code devise
    • Modes de paiement
    • Remise totale
    • Éléments fiscaux (en-IN uniquement)
  • Modèle d’ID prédéfini : ajout de types de documents pris en charge. Le modèle d’ID prend désormais en charge ces types de documents ajoutés

    • ID militaire des États-Unis

Conseil

Toutes les mises à jour de janvier 2023 sont disponibles avec l’API REST version 2022-08-31 (disponibilité générale).

  • Modèle de réception prédéfini : prise en charge de langues supplémentaires :

    Le modèle de reçu prédéfini prend désormais en charge les langues suivantes :

    • Anglais : Émirats arabes unis (en-AE)
    • Néerlandais : Pays-Bas (nl-NL)
    • Français : Canada (fr-CA)
    • Allemand (de-DE)
    • Italien (it-IT)
    • Japonais : Japon (ja-JP)
    • Portugais : Brésil (pt-BR)
  • Modèle de facture prédéfini : prise en charge de langues supplémentaires et extractions de champs

    Le modèle de facture prédéfini prend désormais en charge les langues suivantes :

    • Anglais : Australie (en-AU), Canada (en-CA), Royaume-Uni (en-UK), Inde (en-IN)
    • Portugais : Brésil (pt-BR)

    Le modèle de facture prédéfini prend désormais en charge les extractions de champs suivantes :

    • Code devise
    • Modes de paiement
    • Remise totale
    • Éléments fiscaux (en-IN uniquement)
  • Modèle de document d’ID prédéfini : prise en charge de types de documents supplémentaires

    Le modèle de document d’ID prédéfini prend désormais en charge les types de documents suivants :

    • Expansion des permis de conduire prenant en charge l’Inde, le Canada, le Royaume-Uni et l’Australie
    • Cartes d’identité et documents militaires américains
    • Cartes d’identité et documents indiens (PAN et Aadhaar)
    • Cartes d’identité et documents d’Australie (carte photo, pièce d’identité de passe-clé)
    • Cartes d’identité et documents canadiens (carte d’identité, carte Maple)
    • Cartes d’identité et documents au Royaume-Uni (carte d’identité nationale/régionale)

Décembre 2022

  • Mises à jour du studio Intelligence documentaire

    La version de décembre de Studio Intelligence documentaire inclut les dernières mises à jour de Studio Intelligence documentaire. Il existe des améliorations significatives de l’expérience utilisateur, principalement avec la prise en charge de l’étiquetage de modèle personnalisé.

    • Étendue de pages. Studio prend désormais en charge l’analyse de pages spécifiées d’un document.

    • Étiquetage de modèle personnalisé :

      • Exécuter automatiquement l’API Disposition. Vous pouvez choisir d’exécuter automatiquement l’API Disposition pour tous les documents de votre stockage d’objets blob pendant le processus de configuration d’un modèle personnalisé.

      • Rechercher. Studio inclut désormais des fonctionnalités de recherche pour localiser des mots dans un document. Cette amélioration facilite la navigation lors de l’étiquetage.

      • Navigation. Vous pouvez sélectionner des étiquettes pour cibler des mots étiquetés dans un document.

      • Étiquetage automatique de table. Après la sélection de l’icône de table dans un document, vous pouvez choisir d’étiqueter automatiquement la table extraite dans la vue étiquetage.

      • Sous-types d’étiquettes et sous-types de deuxième niveau Studio prend désormais en charge les sous-types pour les colonnes de table, les lignes de table et les sous-types de deuxième niveau pour des types tels que les dates et les nombres.

  • La génération de modèles neuronaux personnalisés est désormais prise en charge dans la région US Gov Virginie.

  • Les versions d’API en préversion 2022-01-30-preview et 2021-09-30-preview seront mis hors service le 31 janvier 2023. Effectuez une mise à jour vers la version d’API 2022-08-31 pour éviter toute interruption de service.


Novembre 2022

  • Annonce de la dernière version stable des bibliothèques Azure AI Intelligence documentaire
    • Cette version inclut des modifications et des mises à jour importantes pour les bibliothèques de clients .NET, Java, JavaScript et Python. Pour plus d’informations, consultez Azure SDK DevBlog.
    • Les améliorations les plus significatives sont l’introduction de deux nouveaux clients, le DocumentAnalysisClient et .DocumentModelAdministrationClient

Octobre 2022

  • Contenu versionné d’Intelligence documentaire

    • La documentation sur Intelligence documentaire est mise à jour pour présenter une expérience versionnée. À présent, vous pouvez choisir d’afficher le contenu ciblant l’expérience v3.0 GA ou l’expérience v2.1 GA. L’expérience v3.0 est la valeur par défaut.

      Capture d’écran de la page d’accueil Intelligence documentaire indiquant le menu déroulant des versions.

  • Exemple de code Studio Intelligence documentaire

    • L’exemple de code de l’expérience d’étiquetage Studio Intelligence documentaire est désormais disponible sur GitHub. Les clients peuvent développer et intégrer Intelligence documentaire dans leur propre expérience utilisateur ou générer leur propre expérience utilisateur à l’aide de l’exemple de code Studio Intelligence documentaire.
  • Extension linguistique

    • Avec la dernière préversion, les modèles Read avec reconnaissance optique de caractères, de mise en page et de modèles personnalisés d’Intelligence documentaire prennent en charge 134 nouvelles langues. Ces ajouts linguistiques incluent le grec, le letton, le serbe, le thaï, l’ukrainien et le vietnamien, ainsi que plusieurs langues latines et cyrilliques. Intelligence documentaire offre désormais un total de 299 langues prises en charge dans les versions les plus récentes en disponibilité générale et en préversion. Reportez-vous aux pages des langues prises en charge pour afficher toutes les langues prises en charge.
    • Utilisez le paramètre api-version=2022-06-30-preview d’API REST lors de l’utilisation de l’API ou du Kit de développement logiciel (SDK) correspondant pour prendre en charge les nouvelles langues de vos applications.
  • Nouveau modèle de contrat prédéfini

    • Nouveau modèle prédéfini qui extrait des informations des contrats comme les parties, le titre, l’ID de contrat, la date d’exécution et plus encore. Le modèle de contrats est actuellement en préversion, demandez l’accès ici.
  • Expansion régionale pour l’entraînement des modèles neuronaux personnalisés

    • L’entraînement des modèles neuronaux personnalisés est désormais pris en charge dans des régions supplémentaires.
      • USA Est
      • USA Est 2
      • Gouvernement des États-Unis – Arizona

Septembre 2022

Remarque

À compter de la version 4.0.0, un nouveau jeu de clients a été introduit pour tirer parti des fonctionnalités les plus récentes du service Intelligence documentaire.

La version GA de la version SDK 4.0.0 inclut les mises à jour suivantes :

  • Version 4.0.0 GA (2022-09-08)
  • Prend en charge les clients API REST v3.0 et v2.0

Package (NuGet)

Journal des modifications/Historique des versions

Guide de migration

ReadMe

Exemples

  • L’extension de région pour l’apprentissage de modèles neuronaux personnalisés est désormais prise en charge dans six nouvelles régions

    • Australie Est
    • USA Centre
    • Asie Est
    • France Centre
    • Sud du Royaume-Uni
    • USA Ouest 2
    • Pour obtenir la liste complète des régions où l’entraînement est pris en charge, consultez Modèles neuronaux personnalisés.

    • Publication de la version 4.0.0 GA du SDK Intelligence documentaire :

      • Les bibliothèques de clients Intelligence documentaire versions 4.0.0 (.NET/C#, Java, JavaScript) et 3.2.0 (Python) sont en disponibilité générale et prêtes à être utilisées dans les applications de production.
      • Pour plus d’informations sur les bibliothèques de clients Intelligence documentaire, consultez la vue d’ensemble du SDK.
      • Mettez à jour vos applications à l’aide du guide de migration de votre langage de programmation.

Août 2022

Version préliminaire d’août 2022 de la bêta du SDK Intelligence documentaire inclut les mises à jour suivantes :

  • Intelligence documentaire v3.0 en disponibilité générale

    • L’API REST Intelligence documentaire v3.0 est désormais en disponibilité générale, ce qui signifie qu’elle peut être utilisée dans les applications de production. Mettez à jour vos applications avec l’API REST version 2022-08-31.
  • Mises à jour du studio Intelligence documentaire

    • Étapes suivantes. Sous chaque page de modèle, Studio comporte désormais une section Étapes suivantes. Les utilisateurs peuvent rapidement consulter des exemples de code, des instructions de résolution des problèmes et des informations tarifaires.
    • Modèles personnalisés. Studio permet désormais de réorganiser les étiquettes dans les projets de modèles personnalisés afin d’améliorer l’efficacité de l’étiquetage.
    • Copie des modèles Les modèles personnalisés peuvent être copiés dans les services Intelligence documentaire à partir de Studio. Cette opération permet de promouvoir un modèle formé dans d’autres environnements et régions.
    • Suppression de documents. Studio prend désormais en charge la suppression de documents à partir de jeux de données étiquetés dans les projets personnalisés.
  • Mises à jour du service Intelligence documentaire

    • prebuilt-read. Désormais, le modèle Read avec reconnaissance optique de caractères est également disponible dans Intelligence documentaire avec deux nouvelles fonctionnalités, la détection des paragraphes et de la langue. Read d’Intelligence documentaire cible des scénarios de documents avancés, alignés sur les grandes fonctionnalités d’analyse des documents d’Intelligence documentaire.
    • prebuilt-layout. Le modèle Layout extrait les paragraphes et indique si le texte extrait est un paragraphe, un titre, un en-tête de section, une note de bas de page, un en-tête de page, un pied de page ou un numéro de page.
    • prebuilt-invoice. Désormais, les champs TotalVAT et Line/VAT seront respectivement remplacés par les champs existants TotalTax et Line/Tax.
    • prebuilt-idDocument. Prise en charge de l’extraction de données pour les cartes d’identité, les cartes de sécurité sociale et les cartes vertes américaines. Prise en charge des informations relatives aux visas de passeport.
    • prebuilt-receipt. Prise en charge étendue des paramètres régionaux pour le français (fr-FR), l’espagnol (es-ES), le portugais (pt-PT), l’italien (it-IT) et l’allemand (de-DE).
    • prebuilt-businessCard. Prise en charge de l’analyse des adresses pour extraire les sous-champs de composants d’adresses tels que l’adresse, la ville, l’état, le pays/la région et le code postal.
  • Amélioration de la qualité de l’IA

    • prebuilt-read. La prise en charge des caractères uniques, des dates manuscrites, des montants, des noms et d’autres données importantes courantes dans les reçus et les factures a été améliorée, de même que le traitement des documents PDF numériques.
    • prebuilt-layout. Meilleure détection des tableaux rognés et sans bordure, et meilleure reconnaissance des cellules longues.
    • prebuilt-document. Amélioration de la détection des valeurs et des cases à cocher.
    • custom-neural. Amélioration de la précision de la détection et de l’extraction des tables.

Juin 2022

  • Version préliminaire de la bêta de juin 2022 du SDK Intelligence documentaire inclut les mises à jour suivantes :

Février 2022

  • La préversion d’Intelligence documentaire v3.0 propose plusieurs nouvelles fonctionnalités et améliorations :

    • Le Modèle neural personnalisé, ou modèle de document personnalisé, est un nouveau modèle personnalisé permettant d’extraire du texte et des marques de sélection de documents structurés, semi-structurés et non structurés.
    • Le modèle prédéfini W-2 est un nouveau modèle prédéfini permettant d’extraire des champs des formulaires W-2 dans le cadre d’une déclaration fiscale et d’une vérification des revenus.
    • L’API Read extrait les lignes de texte imprimé, les mots, les emplacements de texte, les langues détectées et le texte manuscrit, s’il détecté.
    • Le modèle pré-entraîné Document général est maintenant mis à jour pour prendre en charge les marques de sélection, en plus du texte d’API, des tables, de la structure et des paires clé-valeur dans des formulaires et des documents.
    • API de facture Le modèle prédéfini de facture étend la prise en charge aux factures en espagnol.
    • Studio Intelligence documentaire ajoute de nouvelles démos pour Read, W2 et des exemples de reçus d’hôtel, ainsi que la prise en charge de l’entraînement de nouveaux modèles neuronaux personnalisés.
    • Expansion de langues Les fonctionnalités Read, Disposition et Formulaire personnalisé de Intelligence documentaire prennent en charge 42 nouvelles langues, notamment l’arabe, l’hindi et d’autres langues utilisant des scripts arabes et dévanâgarîs, pour étendre la couverture à 164 langues. La prise en charge de la langue manuscrite s’étend au japonais et au coréen.
  • Prise en main de la nouvelle API de préversion v3.0.

  • Extraction de données avec les modèles Intelligence documentaire :

    Modèle Extraction de texte Paires clé-valeur Marques de sélection Tables Signatures
    Lire
    Document général
    Layout
    Facture
    Réception
    Document d’identité
    Carte de visite
    Modèle personnalisé
    Modèle neuronal personnalisé
  • Version préliminaire de la bêta du SDK Intelligence documentaire inclut les mises à jour suivantes :


Étapes suivantes