Partager via


DocumentAnalysisClient Classe

  • java.lang.Object
    • com.azure.ai.formrecognizer.documentanalysis.DocumentAnalysisClient

public final class DocumentAnalysisClient

Cette classe fournit un client synchrone pour se connecter au Form Recognizer Azure Cognitive Service.

Ce client fournit des méthodes synchrones à effectuer :

  1. Analyse de documents personnalisée : classification, extraction et analyse des données à partir de formulaires et de documents spécifiques à des données métier et des cas d’usage distincts. Utilisez le modèle entraîné personnalisé en passant son modelId dans la com.azure.ai.formrecognizer.documentanalysis.DocumentAnalysisClient#beginAnalyzeDocument(String, BinaryData) méthode .
  2. Analyse générale du document : extrayez du texte, des tableaux, de la structure et des paires clé-valeur. Utilisez le modèle de document général fourni par le service Form Recognizer en passant modelId="reconstruit-document » dans la com.azure.ai.formrecognizer.documentanalysis.DocumentAnalysisClient#beginAnalyzeDocument(String, BinaryData) méthode .
  3. Analyse de modèle prédéfinie : analyser les reçus, les cartes de visite, les factures, les id, les W2 et d’autres documents avec supported prebuilt models. Use the prebuilt receipt model provided by passing modelId="prebuilt-receipt" into the com.azure.ai.formrecognizer.documentanalysis.DocumentAnalysisClient#beginAnalyzeDocument(String, BinaryData) method.
  4. Analyse de la disposition : extrayez du texte, des marques de sélection et des structures de tableaux, ainsi que leurs coordonnées de cadre englobant, à partir de formulaires et de documents. Utilisez le modèle d’analyse de disposition fourni par le service en passant modelId="prebuilt-layout » dans la com.azure.ai.formrecognizer.documentanalysis.DocumentAnalysisClient#beginAnalyzeDocument(String, BinaryData) méthode.
  5. Interrogation et rappels : il inclut des mécanismes d’interrogation du service pour case activée la status d’une opération d’analyse ou l’inscription de rappels pour recevoir des notifications lorsque l’analyse est terminée.

Ce client fournit également différentes méthodes basées sur les entrées d’une URL et les entrées d’un flux.

Note: Ce client prend uniquement en charge V2022_08_31 et plus récent. Pour utiliser une version de service antérieure, FormRecognizerClient et FormTrainingClient.

Les clients de service sont le point d’interaction permettant aux développeurs d’utiliser Azure Form Recognizer. DocumentAnalysisClient est le client de service synchrone et DocumentAnalysisAsyncClient est le client de service asynchrone. Les exemples présentés dans ce document utilisent un objet d’informations d’identification nommé DefaultAzureCredential pour l’authentification, qui convient à la plupart des scénarios, notamment aux environnements de développement et de production locaux. En outre, nous vous recommandons d’utiliser une identité managée pour l’authentification dans les environnements de production. Vous trouverez plus d’informations sur les différentes méthodes d’authentification et leurs types d’informations d’identification correspondants dans la documentation Azure Identity.

Exemple : Construire un DocumentAnalysisAsyncClient avec DefaultAzureCredential

L’exemple de code suivant illustre la création d’un DocumentAnalysisClient, à l’aide de « DefaultAzureCredentialBuilder » pour le configurer.

DocumentAnalysisClient documentAnalysisClient = new DocumentAnalysisClientBuilder()
     .endpoint("{endpoint}")
     .credential(new DefaultAzureCredentialBuilder().build())
     .buildClient();

Pour plus d’informations, consultez l’exemple de code ci-dessous à utiliser pour la AzureKeyCredential création du client.

DocumentAnalysisClient documentAnalysisClient = new DocumentAnalysisClientBuilder()
     .credential(new AzureKeyCredential("{key}"))
     .endpoint("{endpoint}")
     .buildClient();

Résumé de la méthode

Modificateur et type Méthode et description
SyncPoller<OperationResult,AnalyzeResult> beginAnalyzeDocument(String modelId, BinaryData document)

Analyse les données de documents à l’aide de la reconnaissance optique de caractères (OCR) à l’aide de l’un des modèles prédéfinis ou d’un modèle d’analyse personnalisé.

SyncPoller<OperationResult,AnalyzeResult> beginAnalyzeDocument(String modelId, BinaryData document, AnalyzeDocumentOptions analyzeDocumentOptions, Context context)

Analyse les données de documents avec reconnaissance optique de caractères (OCR) et les valeurs sémantiques d’un document donné à l’aide de l’un des modèles prédéfinis ou d’un modèle d’analyse personnalisé.

SyncPoller<OperationResult,AnalyzeResult> beginAnalyzeDocumentFromUrl(String modelId, String documentUrl)

Analyse les données de documents avec reconnaissance optique de caractères (OCR) et les valeurs sémantiques d’un document donné à l’aide de l’un des modèles prédéfinis ou d’un modèle d’analyse personnalisé.

SyncPoller<OperationResult,AnalyzeResult> beginAnalyzeDocumentFromUrl(String modelId, String documentUrl, AnalyzeDocumentOptions analyzeDocumentOptions, Context context)

Analyse les données de documents avec reconnaissance optique de caractères (OCR) et les valeurs sémantiques d’un document donné à l’aide de l’un des modèles prédéfinis ou d’un modèle d’analyse personnalisé.

SyncPoller<OperationResult,AnalyzeResult> beginClassifyDocument(String classifierId, BinaryData document)

Classifier un document donné à l’aide d’un classifieur de documents.

SyncPoller<OperationResult,AnalyzeResult> beginClassifyDocument(String classifierId, BinaryData document, Context context)

Classifier un document donné à l’aide d’un classifieur de document.

SyncPoller<OperationResult,AnalyzeResult> beginClassifyDocumentFromUrl(String classifierId, String documentUrl)

Classifier un document donné à l’aide d’un classifieur de document.

SyncPoller<OperationResult,AnalyzeResult> beginClassifyDocumentFromUrl(String classifierId, String documentUrl, Context context)

Classifier un document donné à l’aide d’un classifieur de document.

Méthodes héritées de java.lang.Object

Détails de la méthode

beginAnalyzeDocument

public SyncPoller beginAnalyzeDocument(String modelId, BinaryData document)

Analyse les données de documents à l’aide de la reconnaissance optique de caractères (OCR) à l’aide de l’un des modèles prédéfinis ou d’un modèle d’analyse personnalisé.

Le service ne prend pas en charge l’annulation de l’opération de longue durée et retourne avec un message d’erreur indiquant l’absence de prise en charge de l’annulation.

Code sample

File document = new File("{local/file_path/fileName.jpg}");
     String modelId = "{custom_trained_model_id}";
     byte[] fileContent = Files.readAllBytes(document.toPath());

     documentAnalysisClient.beginAnalyzeDocument(modelId, BinaryData.fromBytes(fileContent))
         .getFinalResult()
         .getDocuments().stream()
         .map(AnalyzedDocument::getFields)
         .forEach(documentFieldMap -> documentFieldMap.forEach((key, documentField) -> {
             System.out.printf("Field text: %s%n", key);
             System.out.printf("Field value data content: %s%n", documentField.getContent());
             System.out.printf("Confidence score: %.2f%n", documentField.getConfidence());
         }));
 }

Parameters:

modelId - ID de modèle unique à utiliser. Utilisez cette option pour spécifier l’ID de modèle personnalisé ou l’ID de modèle prédéfini. Les ID de modèle prédéfinis pris en charge sont disponibles ici
document - Données du document à partir de laquelle analyser les informations.

Returns:

SyncPoller<T,U> qui interroge la progression de l’opération d’analyse du document jusqu’à ce qu’elle soit terminée, qu’elle ait échoué ou qu’elle ait été annulée. L’opération terminée retourne un AnalyzeResult.

beginAnalyzeDocument

public SyncPoller beginAnalyzeDocument(String modelId, BinaryData document, AnalyzeDocumentOptions analyzeDocumentOptions, Context context)

Analyse les données de documents avec reconnaissance optique de caractères (OCR) et les valeurs sémantiques d’un document donné à l’aide de l’un des modèles prédéfinis ou d’un modèle d’analyse personnalisé.

Le service ne prend pas en charge l’annulation de l’opération de longue durée et retourne avec un message d’erreur indiquant l’absence de prise en charge de l’annulation.

Code sample

Analyser un document avec des options configurables.

File document = new File("{local/file_path/fileName.jpg}");
 String modelId = "{custom_trained_model_id}";
 byte[] fileContent = Files.readAllBytes(document.toPath());

 documentAnalysisClient.beginAnalyzeDocument(modelId, BinaryData.fromBytes(fileContent),
         new AnalyzeDocumentOptions().setPages(Arrays.asList("1", "3")), Context.NONE)
     .getFinalResult()
     .getDocuments().stream()
     .map(AnalyzedDocument::getFields)
     .forEach(documentFieldMap -> documentFieldMap.forEach((key, documentField) -> {
         System.out.printf("Field text: %s%n", key);
         System.out.printf("Field value data content: %s%n", documentField.getContent());
         System.out.printf("Confidence score: %.2f%n", documentField.getConfidence());
     }));

Parameters:

modelId - ID de modèle unique à utiliser. Utilisez cette option pour spécifier l’ID de modèle personnalisé ou l’ID de modèle prédéfini. Les ID de modèle prédéfinis pris en charge sont disponibles ici
document - Données du document à partir de laquelle analyser les informations.
analyzeDocumentOptions - Configurable supplémentaire AnalyzeDocumentOptions qui peut être passé lors de l’analyse de documents.
context - Contexte supplémentaire transmis via le pipeline HTTP pendant l’appel de service.

Returns:

SyncPoller<T,U> qui interroge la progression de l’opération d’analyse du document jusqu’à ce qu’elle soit terminée, qu’elle ait échoué ou qu’elle ait été annulée. L’opération terminée retourne un AnalyzeResult.

beginAnalyzeDocumentFromUrl

public SyncPoller beginAnalyzeDocumentFromUrl(String modelId, String documentUrl)

Analyse les données de documents avec reconnaissance optique de caractères (OCR) et les valeurs sémantiques d’un document donné à l’aide de l’un des modèles prédéfinis ou d’un modèle d’analyse personnalisé.

Le service ne prend pas en charge l’annulation de l’opération de longue durée et retourne un message d’erreur indiquant l’absence de prise en charge de l’annulation

Code sample

Analyser un document à l’aide de l’URL du document.

String documentUrl = "{document_url}";
 String modelId = "{custom_trained_model_id}";

 documentAnalysisClient.beginAnalyzeDocumentFromUrl(modelId, documentUrl).getFinalResult()
     .getDocuments().stream()
     .map(AnalyzedDocument::getFields)
     .forEach(documentFieldMap -> documentFieldMap.forEach((key, documentField) -> {
         System.out.printf("Field text: %s%n", key);
         System.out.printf("Field value data content: %s%n", documentField.getContent());
         System.out.printf("Confidence score: %.2f%n", documentField.getConfidence());
     }));

Parameters:

modelId - ID de modèle unique à utiliser. Utilisez cette option pour spécifier l’ID de modèle personnalisé ou l’ID de modèle prédéfini. Les ID de modèle prédéfinis pris en charge sont disponibles ici
documentUrl - URL du document à analyser.

Returns:

SyncPoller<T,U> pour interroger la progression de l’opération d’analyse de document jusqu’à ce qu’elle soit terminée, qu’elle ait échoué ou qu’elle ait été annulée. L’opération terminée retourne un AnalyzeResult.

beginAnalyzeDocumentFromUrl

public SyncPoller beginAnalyzeDocumentFromUrl(String modelId, String documentUrl, AnalyzeDocumentOptions analyzeDocumentOptions, Context context)

Analyse les données de documents avec reconnaissance optique de caractères (OCR) et les valeurs sémantiques d’un document donné à l’aide de l’un des modèles prédéfinis ou d’un modèle d’analyse personnalisé.

Le service ne prend pas en charge l’annulation de l’opération de longue durée et retourne un message d’erreur indiquant l’absence de prise en charge de l’annulation

Code sample

Analysez un document à l’aide de l’URL du document avec des options configurables.

String documentUrl = "{document_url}";
 String modelId = "{custom_trained_model_id}";

 documentAnalysisClient.beginAnalyzeDocumentFromUrl(modelId, documentUrl).getFinalResult()
     .getDocuments().stream()
     .map(AnalyzedDocument::getFields)
     .forEach(documentFieldMap -> documentFieldMap.forEach((key, documentField) -> {
         System.out.printf("Field text: %s%n", key);
         System.out.printf("Field value data content: %s%n", documentField.getContent());
         System.out.printf("Confidence score: %.2f%n", documentField.getConfidence());
     }));

Parameters:

modelId - ID de modèle unique à utiliser. Utilisez cette option pour spécifier l’ID de modèle personnalisé ou l’ID de modèle prédéfini. Les ID de modèle prédéfinis pris en charge sont disponibles ici
documentUrl - URL source du document d’entrée.
analyzeDocumentOptions - Configurable supplémentaire AnalyzeDocumentOptions qui peut être passé lors de l’analyse de documents.
context - Contexte supplémentaire transmis via le pipeline HTTP pendant l’appel de service.

Returns:

SyncPoller<T,U> pour interroger la progression de l’opération d’analyse de document jusqu’à ce qu’elle soit terminée, qu’elle ait échoué ou qu’elle ait été annulée. L’opération terminée retourne un AnalyzeResult.

beginClassifyDocument

public SyncPoller beginClassifyDocument(String classifierId, BinaryData document)

Classifier un document donné à l’aide d’un classifieur de documents. Pour plus d’informations sur la création d’un modèle classifieur personnalisé, consultez

Le service ne prend pas en charge l’annulation de l’opération de longue durée et retourne avec un message d’erreur indiquant l’absence de prise en charge de l’annulation.

Code sample

File document = new File("{local/file_path/fileName.jpg}");
 String classifierId = "{custom_trained_classifier_id}";
 byte[] fileContent = Files.readAllBytes(document.toPath());

 documentAnalysisClient.beginClassifyDocument(classifierId, BinaryData.fromBytes(fileContent))
     .getFinalResult()
     .getDocuments()
     .forEach(analyzedDocument -> System.out.printf("Doc Type: %s%n", analyzedDocument.getDocType()));

Parameters:

classifierId - ID de classifieur unique à utiliser. Utilisez cette option pour spécifier l’ID de classifieur personnalisé.
document - Données du document à partir de laquelle analyser les informations.

Returns:

SyncPoller<T,U> qui interroge la progression de l’opération d’analyse du document jusqu’à ce qu’elle soit terminée, qu’elle ait échoué ou qu’elle ait été annulée. L’opération terminée retourne un AnalyzeResult.

beginClassifyDocument

public SyncPoller beginClassifyDocument(String classifierId, BinaryData document, Context context)

Classifier un document donné à l’aide d’un classifieur de documents. Pour plus d’informations sur la création d’un modèle classifieur personnalisé, consultez

Le service ne prend pas en charge l’annulation de l’opération de longue durée et retourne avec un message d’erreur indiquant l’absence de prise en charge de l’annulation.

Code sample

File document = new File("{local/file_path/fileName.jpg}");
 String classifierId = "{custom_trained_classifier_id}";
 byte[] fileContent = Files.readAllBytes(document.toPath());

 documentAnalysisClient.beginClassifyDocument(classifierId, BinaryData.fromBytes(fileContent), Context.NONE)
     .getFinalResult()
     .getDocuments()
     .forEach(analyzedDocument -> System.out.printf("Doc Type: %s%n", analyzedDocument.getDocType()));

Parameters:

classifierId - ID de classifieur unique à utiliser. Utilisez cette option pour spécifier l’ID de classifieur personnalisé.
document - Données du document à partir de laquelle analyser les informations.
context - Contexte supplémentaire transmis via le pipeline HTTP pendant l’appel de service.

Returns:

SyncPoller<T,U> qui interroge la progression de l’opération d’analyse du document jusqu’à ce qu’elle soit terminée, qu’elle ait échoué ou qu’elle ait été annulée. L’opération terminée retourne un AnalyzeResult.

beginClassifyDocumentFromUrl

public SyncPoller beginClassifyDocumentFromUrl(String classifierId, String documentUrl)

Classifier un document donné à l’aide d’un classifieur de document. Pour plus d’informations sur la création d’un modèle de classifieur personnalisé, consultez

Le service ne prend pas en charge l’annulation de l’opération de longue durée et retourne avec un message d’erreur indiquant l’absence de prise en charge de l’annulation

Code sample

Analysez un document à l’aide de l’URL du document avec des options configurables.

String documentUrl = "{file_source_url}";
 String classifierId = "{custom_trained_classifier_id}";

 documentAnalysisClient.beginClassifyDocumentFromUrl(classifierId, documentUrl)
     .getFinalResult()
     .getDocuments()
     .forEach(analyzedDocument -> System.out.printf("Doc Type: %s%n", analyzedDocument.getDocType()));

Parameters:

classifierId - ID de classifieur unique à utiliser. Utilisez cette option pour spécifier l’ID de classifieur personnalisé. Les ID de modèle prédéfinis pris en charge sont disponibles ici
documentUrl - URL source du document d’entrée.

Returns:

pour SyncPoller<T,U> interroger la progression de l’opération d’analyse du document jusqu’à ce qu’elle soit terminée, qu’elle ait échoué ou qu’elle ait été annulée. L’opération terminée retourne un AnalyzeResult.

beginClassifyDocumentFromUrl

public SyncPoller beginClassifyDocumentFromUrl(String classifierId, String documentUrl, Context context)

Classifier un document donné à l’aide d’un classifieur de document. Pour plus d’informations sur la création d’un modèle de classifieur personnalisé, consultez

Le service ne prend pas en charge l’annulation de l’opération de longue durée et retourne avec un message d’erreur indiquant l’absence de prise en charge de l’annulation

Code sample

Analysez un document à l’aide de l’URL du document avec des options configurables.

String documentUrl = "{file_source_url}";
 String classifierId = "{custom_trained_classifier_id}";

 documentAnalysisClient.beginClassifyDocumentFromUrl(classifierId, documentUrl, Context.NONE)
     .getFinalResult()
     .getDocuments()
     .forEach(analyzedDocument -> System.out.printf("Doc Type: %s%n", analyzedDocument.getDocType()));

Parameters:

classifierId - ID de classifieur unique à utiliser. Utilisez cette option pour spécifier l’ID de classifieur personnalisé. Les ID de modèle prédéfinis pris en charge sont disponibles ici
documentUrl - URL source du document d’entrée.
context - Contexte supplémentaire transmis via le pipeline HTTP pendant l’appel de service.

Returns:

pour SyncPoller<T,U> interroger la progression de l’opération d’analyse du document jusqu’à ce qu’elle soit terminée, qu’elle ait échoué ou qu’elle ait été annulée. L’opération terminée retourne un AnalyzeResult.

S’applique à