Partager via


Nouveautés d’Azure AI Intelligence documentaire

Ce contenu s’applique à :cochev4.0 (GA)cochev3.1 (GA)cochev3.0 (GA)cochev2.1 (GA)

Le service Intelligence documentaire est mis à jour régulièrement. Ajoutez cette page aux favoris pour vous tenir informé des notes de publication, des améliorations apportées aux fonctionnalités et de la plus récente documentation.

Important

Les versions d’API en préversion sont mises hors service une fois l’API de disponibilité générale publiée. La version de l’API 2023-02-28-preview est mise hors service. Si vous utilisez encore l’API en préversion ou les versions de Kit de développement logiciel (SDK) associées, mettez à jour votre code pour cibler la dernière version de l’API, 2024-11-30 (GA).

Avril 2025

Le conteneur Document Intelligence v4.0 est désormais disponible ! Actuellement, le modèle de disposition est le seul modèle pris en charge pour la version v4.0.
Pour plus d’informations, consultez :

Décembre 2024

Kits de développement logiciel (SDK) de langage de programmation Intelligence documentaire v4.0 sont désormais en disponibilité générale (GA) !

Les dernières bibliothèques client sont par défaut associées à la version du service 2024-11-30 API REST (disponibilité générale).

Pour plus d’informations, consultez les bibliothèques clientes pour les langages de programmation pris en charge suivants :

Novembre 2024

L’API REST Intelligence documentaire v4.0 : 2024-11-30 API REST (disponibilité générale) est désormais en disponibilité ! L’API REST v4.0 inclut les modifications suivantes :

  • 🆕 API par lots

    • L'API Batch prend désormais en charge tous les modèles, y compris ceux de lecture, de structure, les modèles préconçus ainsi que les modèles personnalisés.
    • L’API Batch prend en charge la fonction LIST pour permettre aux utilisateurs de répertorier les travaux par lots au cours des sept derniers jours.
    • L'API Batch prend en charge la fonction DELETE pour supprimer explicitement le traitement par lots pour la conformité au RGPD et le respect de la confidentialité.
    • GetAnalyzeBatchResult prend en charge resultId en réponse à LIST (répertorier) tous les resultIds.
  • 🆕 PDF consultable. Le modèle prédéfini de lecture prend désormais en charge les formats d’images (JPEG/JPG, PNG, BMP, TIFF, HEIF) et l’extension de langue pour inclure le chinois, le japonais et le coréen pour la sortie PDF.

  • Modèle de classification personnalisé

    • Le modèle de classification personnalisé prend en charge l’entraînement incrémentiel. Vous pouvez ajouter de nouveaux échantillons aux classes existantes ou ajouter de nouvelles classes en référençant un classificateur existant.
    • Avec v4.0, le modèle de classification personnalisé ne fractionne pas les documents par défaut pendant l’analyse. Vous devez définir explicitement la propriété « splitMode » pour conserver automatiquement l’ancien comportement.
    • Le modèle de classification personnalisé prend désormais en charge 25 000 pages comme nouvelle limite de page d’entraînement.
  • Modèle neural personnalisé

    • Le modèle neural personnalisé prend désormais en charge la détection de signature.
    • Les modèles neuronaux personnalisés prennent en charge l’entraînement payant pendant une durée plus longue lorsque vous avez besoin d'entraîner un modèle avec un plus grand jeu de données étiqueté. Les 20 premières sessions d'entraînement par mois continuent d’être gratuites. Toutes les opérations d’entraînement au-delà de 20 se font sur le niveau payant. Découvrez plus d’informations sur la facturation.
  • Modèle de relevé bancaire US

    • Le modèle de relevé bancaire US prend désormais en charge l’extraction de tables de vérification.
  • Modèle de vérification

    • Prend en charge l’extraction de signature du payeur
  • Modèle de documents hypothécaires

    • Le modèle hypothécaire prend désormais en charge la détection des signatures des formulaires 1003, 1004, 1005 et la déclaration de clôture.
  • Modèle de reçu

    • Le modèle de reçu prend désormais en charge d’autres champs, notamment ReceiptType, Tax Rate, CountryRegion, montant net et description.
  • 🆕 Modèle fiscal américain

    • Nouveaux modèles fiscaux prédéfinis ajoutés pour 1095A, 1095C, 1099SSA et W4.
  • Supprimer la réponse d’analyse

    • La réponse d’analyse est stockée pendant 24 heures à partir de la fin de l’opération pour la récupération. Pour les scénarios où vous souhaitez supprimer la réponse plus tôt, utilisez l’API supprimer la réponse d’analyse pour supprimer la réponse.
  • L’API v4.0 inclut des mises à jour cumulatives des versions préliminaires, comme indiqué ci-dessous :

Août 2024

L'API REST de Document Intelligence 2024-07-31-preview est désormais disponible. L’API de préversion introduit de nouvelles fonctionnalités mises à jour :

  • La version préliminaire publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes. Le nouveau modèle d’extraction de champs de document dans le portail Azure AI Foundry est disponible uniquement dans la région USA Centre Nord :

  • USA Est

  • USA Ouest 2

  • Europe Ouest

  • USA Centre Nord 

  • 🆕 Composition de modèles avec des classificateurs personnalisés

    • Document Intelligence ajoute désormais la prise en charge de la création d'un modèle avec un modèle de classification personnalisé explicite. En savoir plus sur les avantages de l’utilisation de la nouvelle fonctionnalité de composition.
  • Modèle de classification personnalisé

    • Le modèle de classification personnalisé prend désormais également en charge la mise à jour du modèle sur place.
    • Le modèle de classification personnalisé ajoute la prise en charge de l'opération de copie de modèle pour permettre la sauvegarde et la reprise après sinistre.
    • Le modèle de classification personnalisé prend désormais en charge la spécification explicite des pages à classer à partir d'un document d'entrée.
  • 🆕 Modèle de documents hypothécaires

    • Extraire les informations de l’évaluation (formulaire 1004).
    • Extraire les informations de la validation de l'emploi (formulaire 1005).
  • 🆕 Vérifier le modèle

    • Extraire le bénéficiaire, le montant, la date et d'autres informations pertinentes des chèques.
  • 🆕 Modèle de bulletin de paie

    • Nouveau pré-configuré pour traiter les talons de paie afin d’extraire les salaires, les heures, les déductions, le salaire net et plus encore.
  • 🆕 Modèle de relevé bancaire

    • Nouveau outil préconfiguré pour extraire les informations de compte, y compris les soldes de début et de fin, ainsi que les détails des transactions, à partir des relevés bancaires.
  • 🆕 Modèle fiscal américain

    • Nouveau modèle fiscal américain unifié qui peut extraire des formulaires tels que W-2, 1098, 1099 et 1040.
  • 🆕 PDF consultable. Le modèle de lecture prédéfini prend désormais en charge la sortie PDF pour télécharger des PDF avec du texte intégré à partir des résultats d'extraction, ce qui permet d'utiliser le PDF dans des scénarios tels que la recherche de copie de contenu.

  • Le modèle de mise en page prend désormais en charge une détection des figures améliorée, où les figures des documents peuvent désormais être téléchargées sous forme de fichier image à utiliser pour une meilleure compréhension des figures. Le modèle de mise en page présente également des améliorations du modèle OCR pour le ciblage du texte numérisé pour les caractères uniques, le texte encadré et les documents texte denses.

  • 🆕 API par lots

    • Document Intelligence ajoute désormais la prise en charge de l'opération d'analyse par lots pour prendre en charge l'analyse d'un ensemble de documents afin de simplifier l'expérience du développeur et d'améliorer l'efficacité.
  • Fonctionnalités du module complémentaire

    • La qualité d'extraction des champs de requête de l'IA est améliorée avec le dernier modèle.

Mai 2024

Document Intelligence Studio ajoute la prise en charge de l’authentification Microsoft Entra (anciennement Azure Active Directory). Pour plus d’informations, consultezAuthentification dans Studio Intelligence documentaire.

Février 2024

L'API REST de Document Intelligence 2024-07-31-preview est désormais disponible. L’API de préversion introduit de nouvelles fonctionnalités mises à jour :

  • La version préliminaire publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes :

    • USA Est
    • USA Ouest 2
    • Europe Ouest
  • Le modèle de disposition prend désormais en charge la détection de figure et l’analyse hiérarchique de la structure des documents (sections et sous-sections). La qualité de l’ordre de lecture et de la détection des rôles logiques par l’IA est également améliorée.

  • Modèles d’extraction personnalisés

    • Les modèles d’extraction personnalisés prennent désormais en charge les scores de confiance de cellule, de ligne et de table. En savoir plus sur la confiance de table, de ligne et de cellule.
    • Les modèles d’extraction personnalisés ont des améliorations de la qualité de l’IA pour l’extraction de champs.
    • Le modèle d’extraction de modèle personnalisé prend désormais en charge l’extraction de champs qui se chevauchent. En savoir plus sur les champs qui se chevauchent et leur utilisation.
  • Modèle de classification personnalisé

    • Le modèle de classification personnalisé prend désormais en charge la formation incrémentielle pour les scénarios dans lesquels vous devez mettre à jour le modèle classifieur avec des échantillons ou des classes supplémentaires. En savoir plus sur la formation incrémentielle.
    • Le modèle de classification personnalisé ajoute la prise en charge des types de documents Office (.docx, .pptx et .xls). En savoir plus sur la prise en charge étendue des types de documents.
  • Modèle de facture

    • Support des nouvelles localités
    Paramètres régionaux Code
    Arabe (ar)
    Bulgare (bg)
    Grec (el)
    Hébreu (he)
    Macédonien (mk)
    Russe (ru) Serbe (cyrillique) (sr-cyrl)
    Ukrainien (uk)
    Thaï (th)
    Turc (tr)
    Vietnamien (vi)
    • Prise en charge des nouveaux codes monétaires :
    Devise Paramètres régionaux Code
    BAM Mark convertible de Bosnie (ba)
    BGN Lev bulgare (bg)
    ILS Nouveau shekel israélien (il)
    MKD Denar macédonien (mk)
    RUB Rouble russe (ru)
    THB Baht thaïlandais (th)
    TRY Lire turque (tr)
    UAH Hryvnia ukrainienne (ua)
    VND Dong vietnamien (vn)
    • Soutien des éléments fiscaux à l'expansion pour l’Allemagne (de), l’Espagne (es), le Portugal (pt) et le Canada anglais (en-CA).
  • Modèle d’ID

  • 🆕 Documents hypothécaires

    • Extraire des informations du formulaire 1003 – Uniform Residential Loan Application.
    • Extraire des informations du formulaire 1008 – Uniform Underwriting and Transmittal Summary.
    • Extraire des informations de la déclaration de clôture hypothécaire.
  • 🆕 Modèle de carte de crédit

    • Extraire des informations à partir de cartes bancaires.
  • 🆕 Certificat de mariage

    • Nouveau prédéfini pour extraire des informations à partir des certificats de mariage.

Décembre 2023

Les bibliothèques de clients Intelligence documentaire ciblant l’API REST 2023-10-31-preview sont désormais disponibles.

Novembre 2023

L’API REST 2023-10-31-preview d’Intelligence documentaire est désormais disponible. L’API de préversion introduit de nouvelles fonctionnalités mises à jour :

  • La version préliminaire publique 2023-10-31-préversion est actuellement disponible uniquement dans les régions Azure suivantes :

    • USA Est
    • USA Ouest 2
    • Europe Ouest
  • Modèle de lecture

    • Extension linguistique pour l’écriture manuscrite : russe (ru), arabe (ar), thaï (th).
    • Conformité au Cyber Executive Order (EO).
  • Modèle de disposition

    • Prise en charge des fichiers Office et HTML.
    • Prise en charge de la sortie markdown.
    • Améliorations de l’extraction de table, de l’ordre de lecture et de la détection des titres de section.
    • Dans Intelligence documentaire 2023-10-31-preview, le modèle de document général (prebuilt-document) est déconseillé. À l’avenir, pour extraire des paires clé-valeur à partir de documents, utilisez le modèle prebuilt-layout avec le paramètre de chaîne de requête features=keyValuePairs facultatif activé.
  • Modèle de reçu

    • Extrait maintenant la devise pour tous les champs liés aux prix.
  • Modèle de carte d’assurance maladie

    • Prise en charge de nouveaux champs pour les informations de Medicare et Medicaid.
  • Modèles de documents fiscaux américains

    • Nouveau modèle fiscal 1099. Prend en charge le formulaire de base 1099 et variantes suivantes : A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB​.
  • Modèle de facture

    • Support pour le champ KVK.
    • Support pour le champ BPAY.
    • Nombreuses améliorations relatives aux champs.
  • Classification personnalisée

    • Prise en charge de documents multilingues.
    • Nouvelles options de fractionnement de page : fractionnement automatique, toujours fractionner par page, aucun fractionnement.
  • Fonctionnalités du module complémentaire

    • Des champs de requête sont disponibles avec la version 2023-10-31-preview.
    • Les fonctionnalités de module complémentaire sont disponibles dans tous les modèles, à l’exception du modèle de lecture.

Remarque

Avec la version en disponibilité générale de l’API 2022-08-31 , les API en préversion associées sont déconseillées. Si vous utilisez la version 2021-09-30-preview, 2022-01-30-preview ou 2022-06-30-preview, mettez à jour vos applications pour cibler la version de l’API 2022-08-31 . Il y a quelques modifications mineures impliquées. Pour plus d'informations, consultez le guide de migration.