Biblioteca cliente de Azure Form Recognizer para .NET: versión 4.1.0
Nota: en julio de 2023, se cambió el nombre del servicio Form Recognizer azure Cognitive Services a Azure AI Document Intelligence. Cualquier mención a Form Recognizer o a Document Intelligence en la documentación, consulte el mismo servicio de Azure.
Azure AI Document Intelligence es un servicio en la nube que usa el aprendizaje automático para analizar texto y datos estructurados de los documentos. Incluye las siguientes características principales:
- Diseño: extraiga texto, marcas de selección, estructuras de tabla, estilos y párrafos, junto con sus coordenadas de región delimitador de documentos.
- Documento general: analice pares clave-valor además del diseño general de los documentos.
- Leer: leer información sobre elementos textuales, como palabras de página y líneas, además de la información del idioma de texto.
- Precompilado: analice los datos de determinados tipos de documentos comunes mediante modelos precompilados. Los documentos admitidos incluyen recibos, facturas, tarjetas de presentación, documentos de identidad, formularios fiscales W2 de EE. UU., etc.
- Análisis personalizado: cree modelos de documentos personalizados para analizar texto, valores de campo, marcas de selección, estructuras de tabla, estilos y párrafos de documentos. Los modelos personalizados se crean con sus propios datos, por lo que se adaptan a los documentos.
- Clasificación personalizada: cree modelos de clasificadores personalizados que combinen características de diseño y lenguaje para detectar e identificar con precisión los documentos que procesa dentro de la aplicación.
Código | fuentePaquete (NuGet) | Documentación | de referencia de APIDocumentación | del productoMuestras
Introducción
Instalar el paquete
Instale la biblioteca cliente de Azure Form Recognizer para .NET con NuGet:
dotnet add package Azure.AI.FormRecognizer
Nota: Esta versión de la biblioteca cliente tiene como valor predeterminado la
2023-07-31
versión del servicio.
En esta tabla se muestra la relación entre las versiones del SDK y las versiones de la API admitidas del servicio:
Versión del SDK | Versión de la API admitidas del servicio |
---|---|
4.1.0 | 2.0, 2.1, 2022-08-31, 2023-07-31 |
4.0.0 | 2.0, 2.1, 2022-08-31 |
3.1.X | 2.0, 2.1 |
3.0.X | 2,0 |
Nota: A partir de la versión
4.0.0
, se introdujo un nuevo conjunto de clientes para aprovechar las características más recientes del servicio De inteligencia de documentos. Consulte la Guía de migración para obtener instrucciones detalladas sobre cómo actualizar el código de aplicación de la versión3.1.X
de la biblioteca cliente o una versión inferior a la versión más reciente. Además, consulte el registro de cambios para obtener información más detallada. En la tabla siguiente se describe la relación de cada cliente y sus versiones de API admitidas:
Versión de API | Clientes compatibles |
---|---|
2023-07-31 | DocumentAnalysisClient y DocumentModelAdministrationClient |
2022-08-31 | DocumentAnalysisClient y DocumentModelAdministrationClient |
2.1 | FormRecognizerClient y FormTrainingClient |
2.0 | FormRecognizerClient y FormTrainingClient |
Prerrequisitos
- Una suscripción de Azure.
- Un recurso de Cognitive Services o Form Recognizer para usar este paquete.
Creación de un recurso de Cognitive Services o Form Recognizer
La inteligencia de documentos admite el acceso de varios servicios y de un solo servicio. Cree un recurso de Cognitive Services si tiene previsto acceder a varios servicios de Cognitive Services en un único punto de conexión o clave. Solo para el acceso a La inteligencia de documentos, cree un recurso de Form Recognizer. Tenga en cuenta que necesitará un recurso de servicio único si piensa usar la autenticación de Azure Active Directory.
Puede crear cualquiera de los recursos mediante:
- Opción 1: Azure Portal.
- Opción 2: CLI de Azure.
A continuación se muestra un ejemplo de cómo puede crear un recurso de Form Recognizer mediante la CLI:
# Create a new resource group to hold the Form Recognizer resource
# If using an existing resource group, skip this step
az group create --name <your-resource-name> --location <location>
# Create the Form Recognizer resource
az cognitiveservices account create \
--name <resource-name> \
--resource-group <resource-group-name> \
--kind FormRecognizer \
--sku <sku> \
--location <location> \
--yes
Para obtener más información sobre cómo crear el recurso o cómo obtener la información de ubicación y SKU, consulte aquí.
Autenticar el cliente
Para interactuar con el servicio Document Intelligence, deberá crear una instancia de la DocumentAnalysisClient
clase .
Se necesita un punto de conexión y una credencial para crear una instancia del objeto de cliente.
Obtención del punto de conexión
Puede encontrar el punto de conexión del recurso de Form Recognizer mediante Azure Portal o la CLI de Azure:
# Get the endpoint for the Form Recognizer resource
az cognitiveservices account show --name "<resource-name>" --resource-group "<resource-group-name>" --query "properties.endpoint"
Se puede usar un punto de conexión regional o un subdominio personalizado para la autenticación. Tienen el formato siguiente:
Regional endpoint: https://<region>.api.cognitive.microsoft.com/
Custom subdomain: https://<resource-name>.cognitiveservices.azure.com/
Un punto de conexión regional es el mismo para cada recurso de una región. Aquí se puede consultar una lista completa de los puntos de conexión regionales admitidos. Tenga en cuenta que los puntos de conexión regionales no admiten la autenticación de AAD.
Un subdominio personalizado, por otro lado, es un nombre que es único para el recurso de Form Recognizer. Los recursos de un solo servicio solo los pueden usar.
Obtención de la clave de API
La clave de API se puede encontrar en Azure Portal o mediante la ejecución del siguiente comando de la CLI de Azure:
az cognitiveservices account keys list --name "<resource-name>" --resource-group "<resource-group-name>"
Creación de DocumentAnalysisClient con AzureKeyCredential
Una vez que tenga el valor de la clave de API, cree un AzureKeyCredential
. Con el punto de conexión y la credencial de clave, puede crear :DocumentAnalysisClient
string endpoint = "<endpoint>";
string apiKey = "<apiKey>";
var credential = new AzureKeyCredential(apiKey);
var client = new DocumentAnalysisClient(new Uri(endpoint), credential);
Creación de DocumentAnalysisClient con credenciales de Azure Active Directory
AzureKeyCredential
La autenticación se usa en los ejemplos de esta guía de introducción, pero también puede autenticarse con Azure Active Directory mediante la biblioteca de identidades de Azure. Tenga en cuenta que los puntos de conexión regionales no admiten la autenticación de AAD. Cree un subdominio personalizado para el recurso con el fin de usar este tipo de autenticación.
Para usar el proveedor DefaultAzureCredential que se muestra a continuación u otros proveedores de credenciales proporcionados con el SDK de Azure, instale el paquete Azure.Identity
:
dotnet add package Azure.Identity
También tendrá que registrar una nueva aplicación de AAD y conceder acceso a Document Intelligence mediante la asignación del rol a la "Cognitive Services User"
entidad de servicio.
Establezca los valores del identificador de cliente, el identificador de inquilino y el secreto de cliente de la aplicación de AAD como variables de entorno: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.
string endpoint = "<endpoint>";
var client = new DocumentAnalysisClient(new Uri(endpoint), new DefaultAzureCredential());
Conceptos clave
DocumentAnalysisClient
DocumentAnalysisClient
proporciona operaciones para:
- Análisis de documentos de entrada mediante modelos precompilados y personalizados a través de las
AnalyzeDocument
API yAnalyzeDocumentFromUri
. - Detección e identificación de documentos de entrada personalizados con las
ClassifyDocument
API yClassifyDocumentFromUri
.
Aquí se proporcionan fragmentos de código de ejemplo para ilustrar el uso de DocumentAnalysisClient. Puede encontrar más información sobre el análisis de documentos, incluidas las características admitidas, las configuraciones regionales y los tipos de documento en la documentación del servicio.
DocumentModelAdministrationClient
DocumentModelAdministrationClient
proporciona operaciones para:
- Crear modelos personalizados para analizar campos específicos que especifique mediante el etiquetado de los documentos personalizados. Se devuelve una
DocumentModelDetails
instancia que indica los tipos de documento que el modelo puede analizar, los campos que puede analizar para cada tipo de documento, así como la confianza estimada para cada campo. Consulte la documentación del servicio para obtener una explicación más detallada. - Cree un modelo a partir de una colección de modelos existentes.
- La administración de los modelos creados en una cuenta.
- La copia de un modelo personalizado entre recursos de Form Recognizer.
- Enumerar las operaciones de compilación o obtener operaciones específicas creadas en las últimas 24 horas.
- Compilar y administrar modelos de clasificación de documentos para detectar e identificar con precisión los documentos que procesa dentro de la aplicación.
Vea ejemplos para crear un modelo personalizado, administrar modelos y crear un clasificador de documentos.
Tenga en cuenta que los modelos y clasificadores también se pueden crear mediante una interfaz gráfica de usuario como Document Intelligence Studio.
Operaciones de Long-Running
Dado que el análisis de documentos y la creación de modelos tardan tiempo, estas operaciones se implementan como operaciones de larga duración. Las operaciones de larga duración constan de una solicitud inicial enviada al servicio para iniciar una operación, seguida de sondear el servicio a intervalos para determinar si la operación se ha completado o no, y si se ha realizado correctamente, para obtener el resultado.
Para las operaciones de larga duración en el SDK de Azure, el cliente expone un método que devuelve un Operation<T>
objeto . Puede establecer su parámetro waitUntil
en WaitUntil.Completed
para que espere a que la operación se complete y obtenga su resultado; o establézcalo WaitUntil.Started
en si solo desea iniciar la operación y consumir el resultado más adelante. A continuación se proporciona un fragmento de código de ejemplo para ilustrar el uso de operaciones de larga duración.
Seguridad para subprocesos
Garantizamos que todos los métodos de instancia de cliente sean seguros para subprocesos e independientes entre sí (guía). Esto garantiza que la recomendación de reutilizar instancias de cliente siempre es segura, incluso entre subprocesos.
Conceptos adicionales
Opciones | de clienteAcceso a la respuesta | Control de errores | Diagnóstico | Burla | Duración del cliente
Ejemplos
En la sección siguiente se proporcionan varios fragmentos de código que ilustran patrones comunes que se usan en la API de .NET de Form Recognizer. La mayoría de los fragmentos de código siguientes usan llamadas de servicio asincrónicas, pero tenga en cuenta que el paquete Azure.AI.FormRecognizer admite API sincrónicas y asincrónicas.
Ejemplos asincrónicos
- Extraer diseño
- Usar el modelo de documento general precompilado
- Usar el modelo de lectura precompilado
- Uso de modelos precompilados
- Compilación de un modelo personalizado
- Analizar documentos personalizados
- Administrar modelos
- Compilación de un clasificador de documentos
- Clasificación de un documento
Ejemplos de sincronización
Tenga en cuenta que estos ejemplos usan la versión
4.1.0
del SDK . Para la versión 3.1.1 o inferior, consulte ejemplos de Form Recognizer para V3.1.X.
Extraer diseño
Extraiga texto, marcas de selección, estructuras de tabla, estilos y párrafos, junto con sus coordenadas de región delimitador de documentos.
Uri fileUri = new Uri("<fileUri>");
AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, "prebuilt-layout", fileUri);
AnalyzeResult result = operation.Value;
foreach (DocumentPage page in result.Pages)
{
Console.WriteLine($"Document Page {page.PageNumber} has {page.Lines.Count} line(s), {page.Words.Count} word(s),");
Console.WriteLine($"and {page.SelectionMarks.Count} selection mark(s).");
for (int i = 0; i < page.Lines.Count; i++)
{
DocumentLine line = page.Lines[i];
Console.WriteLine($" Line {i} has content: '{line.Content}'.");
Console.WriteLine($" Its bounding polygon (points ordered clockwise):");
for (int j = 0; j < line.BoundingPolygon.Count; j++)
{
Console.WriteLine($" Point {j} => X: {line.BoundingPolygon[j].X}, Y: {line.BoundingPolygon[j].Y}");
}
}
for (int i = 0; i < page.SelectionMarks.Count; i++)
{
DocumentSelectionMark selectionMark = page.SelectionMarks[i];
Console.WriteLine($" Selection Mark {i} is {selectionMark.State}.");
Console.WriteLine($" Its bounding polygon (points ordered clockwise):");
for (int j = 0; j < selectionMark.BoundingPolygon.Count; j++)
{
Console.WriteLine($" Point {j} => X: {selectionMark.BoundingPolygon[j].X}, Y: {selectionMark.BoundingPolygon[j].Y}");
}
}
}
Console.WriteLine("Paragraphs:");
foreach (DocumentParagraph paragraph in result.Paragraphs)
{
Console.WriteLine($" Paragraph content: {paragraph.Content}");
if (paragraph.Role != null)
{
Console.WriteLine($" Role: {paragraph.Role}");
}
}
foreach (DocumentStyle style in result.Styles)
{
// Check the style and style confidence to see if text is handwritten.
// Note that value '0.8' is used as an example.
bool isHandwritten = style.IsHandwritten.HasValue && style.IsHandwritten == true;
if (isHandwritten && style.Confidence > 0.8)
{
Console.WriteLine($"Handwritten content found:");
foreach (DocumentSpan span in style.Spans)
{
Console.WriteLine($" Content: {result.Content.Substring(span.Index, span.Length)}");
}
}
}
Console.WriteLine("The following tables were extracted:");
for (int i = 0; i < result.Tables.Count; i++)
{
DocumentTable table = result.Tables[i];
Console.WriteLine($" Table {i} has {table.RowCount} rows and {table.ColumnCount} columns.");
foreach (DocumentTableCell cell in table.Cells)
{
Console.WriteLine($" Cell ({cell.RowIndex}, {cell.ColumnIndex}) has kind '{cell.Kind}' and content: '{cell.Content}'.");
}
}
Para obtener más información y ejemplos, consulte aquí.
Usar el modelo de documento general precompilado
Analice el texto, las marcas de selección, las estructuras de tabla, los estilos, los párrafos y los pares clave-valor de los documentos mediante el modelo de documento general precompilado.
Uri fileUri = new Uri("<fileUri>");
AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, "prebuilt-document", fileUri);
AnalyzeResult result = operation.Value;
Console.WriteLine("Detected key-value pairs:");
foreach (DocumentKeyValuePair kvp in result.KeyValuePairs)
{
if (kvp.Value == null)
{
Console.WriteLine($" Found key with no value: '{kvp.Key.Content}'");
}
else
{
Console.WriteLine($" Found key-value pair: '{kvp.Key.Content}' and '{kvp.Value.Content}'");
}
}
foreach (DocumentPage page in result.Pages)
{
Console.WriteLine($"Document Page {page.PageNumber} has {page.Lines.Count} line(s), {page.Words.Count} word(s),");
Console.WriteLine($"and {page.SelectionMarks.Count} selection mark(s).");
for (int i = 0; i < page.Lines.Count; i++)
{
DocumentLine line = page.Lines[i];
Console.WriteLine($" Line {i} has content: '{line.Content}'.");
Console.WriteLine($" Its bounding polygon (points ordered clockwise):");
for (int j = 0; j < line.BoundingPolygon.Count; j++)
{
Console.WriteLine($" Point {j} => X: {line.BoundingPolygon[j].X}, Y: {line.BoundingPolygon[j].Y}");
}
}
for (int i = 0; i < page.SelectionMarks.Count; i++)
{
DocumentSelectionMark selectionMark = page.SelectionMarks[i];
Console.WriteLine($" Selection Mark {i} is {selectionMark.State}.");
Console.WriteLine($" Its bounding polygon (points ordered clockwise):");
for (int j = 0; j < selectionMark.BoundingPolygon.Count; j++)
{
Console.WriteLine($" Point {j} => X: {selectionMark.BoundingPolygon[j].X}, Y: {selectionMark.BoundingPolygon[j].Y}");
}
}
}
foreach (DocumentStyle style in result.Styles)
{
// Check the style and style confidence to see if text is handwritten.
// Note that value '0.8' is used as an example.
bool isHandwritten = style.IsHandwritten.HasValue && style.IsHandwritten == true;
if (isHandwritten && style.Confidence > 0.8)
{
Console.WriteLine($"Handwritten content found:");
foreach (DocumentSpan span in style.Spans)
{
Console.WriteLine($" Content: {result.Content.Substring(span.Index, span.Length)}");
}
}
}
Console.WriteLine("The following tables were extracted:");
for (int i = 0; i < result.Tables.Count; i++)
{
DocumentTable table = result.Tables[i];
Console.WriteLine($" Table {i} has {table.RowCount} rows and {table.ColumnCount} columns.");
foreach (DocumentTableCell cell in table.Cells)
{
Console.WriteLine($" Cell ({cell.RowIndex}, {cell.ColumnIndex}) has kind '{cell.Kind}' and content: '{cell.Content}'.");
}
}
Para obtener más información y ejemplos, consulte aquí.
Usar el modelo de lectura precompilado
Analice elementos textuales, como palabras y líneas de página, estilos, párrafos e información de lenguaje de texto de documentos mediante el modelo de lectura precompilado.
Uri fileUri = new Uri("<fileUri>");
AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, "prebuilt-read", fileUri);
AnalyzeResult result = operation.Value;
Console.WriteLine("Detected languages:");
foreach (DocumentLanguage language in result.Languages)
{
Console.WriteLine($" Found language with locale '{language.Locale}' and confidence {language.Confidence}.");
}
foreach (DocumentPage page in result.Pages)
{
Console.WriteLine($"Document Page {page.PageNumber} has {page.Lines.Count} line(s), {page.Words.Count} word(s),");
Console.WriteLine($"and {page.SelectionMarks.Count} selection mark(s).");
for (int i = 0; i < page.Lines.Count; i++)
{
DocumentLine line = page.Lines[i];
Console.WriteLine($" Line {i} has content: '{line.Content}'.");
Console.WriteLine($" Its bounding polygon (points ordered clockwise):");
for (int j = 0; j < line.BoundingPolygon.Count; j++)
{
Console.WriteLine($" Point {j} => X: {line.BoundingPolygon[j].X}, Y: {line.BoundingPolygon[j].Y}");
}
}
}
foreach (DocumentStyle style in result.Styles)
{
// Check the style and style confidence to see if text is handwritten.
// Note that value '0.8' is used as an example.
bool isHandwritten = style.IsHandwritten.HasValue && style.IsHandwritten == true;
if (isHandwritten && style.Confidence > 0.8)
{
Console.WriteLine($"Handwritten content found:");
foreach (DocumentSpan span in style.Spans)
{
Console.WriteLine($" Content: {result.Content.Substring(span.Index, span.Length)}");
}
}
}
Para obtener más información y ejemplos, consulte aquí.
Uso de modelos precompilados
Analice datos de determinados tipos de documentos comunes mediante modelos precompilados proporcionados por el servicio Document Intelligence.
Por ejemplo, para analizar campos de una factura, use el modelo de factura precompilado proporcionado pasando el identificador del prebuilt-invoice
AnalyzeDocumentAsync
modelo al método :
string filePath = "<filePath>";
using var stream = new FileStream(filePath, FileMode.Open);
AnalyzeDocumentOperation operation = await client.AnalyzeDocumentAsync(WaitUntil.Completed, "prebuilt-invoice", stream);
AnalyzeResult result = operation.Value;
// To see the list of all the supported fields returned by service and its corresponding types for the
// prebuilt-invoice model, consult:
// https://aka.ms/azsdk/formrecognizer/invoicefieldschema
for (int i = 0; i < result.Documents.Count; i++)
{
Console.WriteLine($"Document {i}:");
AnalyzedDocument document = result.Documents[i];
if (document.Fields.TryGetValue("VendorName", out DocumentField vendorNameField))
{
if (vendorNameField.FieldType == DocumentFieldType.String)
{
string vendorName = vendorNameField.Value.AsString();
Console.WriteLine($"Vendor Name: '{vendorName}', with confidence {vendorNameField.Confidence}");
}
}
if (document.Fields.TryGetValue("CustomerName", out DocumentField customerNameField))
{
if (customerNameField.FieldType == DocumentFieldType.String)
{
string customerName = customerNameField.Value.AsString();
Console.WriteLine($"Customer Name: '{customerName}', with confidence {customerNameField.Confidence}");
}
}
if (document.Fields.TryGetValue("Items", out DocumentField itemsField))
{
if (itemsField.FieldType == DocumentFieldType.List)
{
foreach (DocumentField itemField in itemsField.Value.AsList())
{
Console.WriteLine("Item:");
if (itemField.FieldType == DocumentFieldType.Dictionary)
{
IReadOnlyDictionary<string, DocumentField> itemFields = itemField.Value.AsDictionary();
if (itemFields.TryGetValue("Description", out DocumentField itemDescriptionField))
{
if (itemDescriptionField.FieldType == DocumentFieldType.String)
{
string itemDescription = itemDescriptionField.Value.AsString();
Console.WriteLine($" Description: '{itemDescription}', with confidence {itemDescriptionField.Confidence}");
}
}
if (itemFields.TryGetValue("Amount", out DocumentField itemAmountField))
{
if (itemAmountField.FieldType == DocumentFieldType.Currency)
{
CurrencyValue itemAmount = itemAmountField.Value.AsCurrency();
Console.WriteLine($" Amount: '{itemAmount.Symbol}{itemAmount.Amount}', with confidence {itemAmountField.Confidence}");
}
}
}
}
}
}
if (document.Fields.TryGetValue("SubTotal", out DocumentField subTotalField))
{
if (subTotalField.FieldType == DocumentFieldType.Currency)
{
CurrencyValue subTotal = subTotalField.Value.AsCurrency();
Console.WriteLine($"Sub Total: '{subTotal.Symbol}{subTotal.Amount}', with confidence {subTotalField.Confidence}");
}
}
if (document.Fields.TryGetValue("TotalTax", out DocumentField totalTaxField))
{
if (totalTaxField.FieldType == DocumentFieldType.Currency)
{
CurrencyValue totalTax = totalTaxField.Value.AsCurrency();
Console.WriteLine($"Total Tax: '{totalTax.Symbol}{totalTax.Amount}', with confidence {totalTaxField.Confidence}");
}
}
if (document.Fields.TryGetValue("InvoiceTotal", out DocumentField invoiceTotalField))
{
if (invoiceTotalField.FieldType == DocumentFieldType.Currency)
{
CurrencyValue invoiceTotal = invoiceTotalField.Value.AsCurrency();
Console.WriteLine($"Invoice Total: '{invoiceTotal.Symbol}{invoiceTotal.Amount}', with confidence {invoiceTotalField.Confidence}");
}
}
}
¡No se limita a las facturas! Hay un par de modelos precompilados entre los que elegir, cada uno de los cuales tiene su propio conjunto de campos admitidos. Puede encontrar más información sobre los tipos de documento admitidos en la documentación del servicio.
Para obtener más información y ejemplos, consulte aquí.
Compilación de un modelo personalizado
Cree un modelo personalizado en su propio tipo de documento. El modelo resultante se puede usar para analizar valores de los tipos de documentos en los que se creó.
// For this sample, you can use the training documents found in the `trainingFiles` folder.
// Upload the documents to your storage container and then generate a container SAS URL. Note
// that a container URI without SAS is accepted only when the container is public or has a
// managed identity configured.
//
// For instructions to set up documents for training in an Azure Blob Storage Container, please see:
// https://aka.ms/azsdk/formrecognizer/buildcustommodel
Uri blobContainerUri = new Uri("<blobContainerUri>");
var client = new DocumentModelAdministrationClient(new Uri(endpoint), new AzureKeyCredential(apiKey));
// We are selecting the Template build mode in this sample. For more information about the available
// build modes and their differences, please see:
// https://aka.ms/azsdk/formrecognizer/buildmode
BuildDocumentModelOperation operation = await client.BuildDocumentModelAsync(WaitUntil.Completed, blobContainerUri, DocumentBuildMode.Template);
DocumentModelDetails model = operation.Value;
Console.WriteLine($" Model Id: {model.ModelId}");
Console.WriteLine($" Created on: {model.CreatedOn}");
Console.WriteLine(" Document types the model can recognize:");
foreach (KeyValuePair<string, DocumentTypeDetails> documentType in model.DocumentTypes)
{
Console.WriteLine($" Document type: {documentType.Key} which has the following fields:");
foreach (KeyValuePair<string, DocumentFieldSchema> schema in documentType.Value.FieldSchema)
{
Console.WriteLine($" Field: {schema.Key} with confidence {documentType.Value.FieldConfidence[schema.Key]}");
}
}
Para obtener más información y ejemplos, consulte aquí.
Analizar documentos personalizados
Analice texto, valores de campo, marcas de selección y estructuras de tabla, estilos y párrafos de documentos personalizados mediante modelos creados con sus propios tipos de documento.
string modelId = "<modelId>";
Uri fileUri = new Uri("<fileUri>");
AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, modelId, fileUri);
AnalyzeResult result = operation.Value;
Console.WriteLine($"Document was analyzed with model with ID: {result.ModelId}");
foreach (AnalyzedDocument document in result.Documents)
{
Console.WriteLine($"Document of type: {document.DocumentType}");
foreach (KeyValuePair<string, DocumentField> fieldKvp in document.Fields)
{
string fieldName = fieldKvp.Key;
DocumentField field = fieldKvp.Value;
Console.WriteLine($"Field '{fieldName}': ");
Console.WriteLine($" Content: '{field.Content}'");
Console.WriteLine($" Confidence: '{field.Confidence}'");
}
}
Para obtener más información y ejemplos, consulte aquí.
Administrar modelos
Administre los modelos almacenados en su cuenta.
var client = new DocumentModelAdministrationClient(new Uri(endpoint), new AzureKeyCredential(apiKey));
// Check number of custom models in the Form Recognizer resource, and the maximum number of custom models that can be stored.
ResourceDetails resourceDetails = await client.GetResourceDetailsAsync();
Console.WriteLine($"Resource has {resourceDetails.CustomDocumentModelCount} custom models.");
Console.WriteLine($"It can have at most {resourceDetails.CustomDocumentModelLimit} custom models.");
// List the first ten or fewer models currently stored in the resource.
AsyncPageable<DocumentModelSummary> models = client.GetDocumentModelsAsync();
int count = 0;
await foreach (DocumentModelSummary modelSummary in models)
{
Console.WriteLine($"Custom Model Summary:");
Console.WriteLine($" Model Id: {modelSummary.ModelId}");
if (string.IsNullOrEmpty(modelSummary.Description))
Console.WriteLine($" Model description: {modelSummary.Description}");
Console.WriteLine($" Created on: {modelSummary.CreatedOn}");
if (++count == 10)
break;
}
// Create a new model to store in the resource.
Uri blobContainerUri = new Uri("<blobContainerUri>");
BuildDocumentModelOperation operation = await client.BuildDocumentModelAsync(WaitUntil.Completed, blobContainerUri, DocumentBuildMode.Template);
DocumentModelDetails model = operation.Value;
// Get the model that was just created.
DocumentModelDetails newCreatedModel = await client.GetDocumentModelAsync(model.ModelId);
Console.WriteLine($"Custom Model with Id {newCreatedModel.ModelId} has the following information:");
Console.WriteLine($" Model Id: {newCreatedModel.ModelId}");
if (string.IsNullOrEmpty(newCreatedModel.Description))
Console.WriteLine($" Model description: {newCreatedModel.Description}");
Console.WriteLine($" Created on: {newCreatedModel.CreatedOn}");
// Delete the model from the resource.
await client.DeleteDocumentModelAsync(newCreatedModel.ModelId);
Para obtener más información y ejemplos, consulte aquí.
Administrar modelos de forma sincrónica
Administre los modelos almacenados en su cuenta con una API sincrónica.
var client = new DocumentModelAdministrationClient(new Uri(endpoint), new AzureKeyCredential(apiKey));
// Check number of custom models in the Form Recognizer resource, and the maximum number of custom models that can be stored.
ResourceDetails resourceDetails = client.GetResourceDetails();
Console.WriteLine($"Resource has {resourceDetails.CustomDocumentModelCount} custom models.");
Console.WriteLine($"It can have at most {resourceDetails.CustomDocumentModelLimit} custom models.");
// List the first ten or fewer models currently stored in the resource.
Pageable<DocumentModelSummary> models = client.GetDocumentModels();
foreach (DocumentModelSummary modelSummary in models.Take(10))
{
Console.WriteLine($"Custom Model Summary:");
Console.WriteLine($" Model Id: {modelSummary.ModelId}");
if (string.IsNullOrEmpty(modelSummary.Description))
Console.WriteLine($" Model description: {modelSummary.Description}");
Console.WriteLine($" Created on: {modelSummary.CreatedOn}");
}
// Create a new model to store in the resource.
Uri blobContainerUri = new Uri("<blobContainerUri>");
BuildDocumentModelOperation operation = client.BuildDocumentModel(WaitUntil.Completed, blobContainerUri, DocumentBuildMode.Template);
DocumentModelDetails model = operation.Value;
// Get the model that was just created.
DocumentModelDetails newCreatedModel = client.GetDocumentModel(model.ModelId);
Console.WriteLine($"Custom Model with Id {newCreatedModel.ModelId} has the following information:");
Console.WriteLine($" Model Id: {newCreatedModel.ModelId}");
if (string.IsNullOrEmpty(newCreatedModel.Description))
Console.WriteLine($" Model description: {newCreatedModel.Description}");
Console.WriteLine($" Created on: {newCreatedModel.CreatedOn}");
// Delete the created model from the resource.
client.DeleteDocumentModel(newCreatedModel.ModelId);
Compilación de un clasificador de documentos
Compile un clasificador de documentos cargando documentos de entrenamiento personalizados.
// For this sample, you can use the training documents found in the `classifierTrainingFiles` folder.
// Upload the documents to your storage container and then generate a container SAS URL. Note
// that a container URI without SAS is accepted only when the container is public or has a
// managed identity configured.
//
// For instructions to set up documents for training in an Azure Blob Storage Container, please see:
// https://aka.ms/azsdk/formrecognizer/buildclassifiermodel
Uri trainingFilesUri = new Uri("<trainingFilesUri>");
var client = new DocumentModelAdministrationClient(new Uri(endpoint), new AzureKeyCredential(apiKey));
var sourceA = new BlobContentSource(trainingFilesUri) { Prefix = "IRS-1040-A/train" };
var sourceB = new BlobContentSource(trainingFilesUri) { Prefix = "IRS-1040-B/train" };
var documentTypes = new Dictionary<string, ClassifierDocumentTypeDetails>()
{
{ "IRS-1040-A", new ClassifierDocumentTypeDetails(sourceA) },
{ "IRS-1040-B", new ClassifierDocumentTypeDetails(sourceB) }
};
BuildDocumentClassifierOperation operation = await client.BuildDocumentClassifierAsync(WaitUntil.Completed, documentTypes);
DocumentClassifierDetails classifier = operation.Value;
Console.WriteLine($" Classifier Id: {classifier.ClassifierId}");
Console.WriteLine($" Created on: {classifier.CreatedOn}");
Console.WriteLine(" Document types the classifier can recognize:");
foreach (KeyValuePair<string, ClassifierDocumentTypeDetails> documentType in classifier.DocumentTypes)
{
Console.WriteLine($" {documentType.Key}");
}
Para obtener más información y ejemplos, consulte aquí.
Clasificación de un documento
Use clasificadores de documentos para detectar e identificar con precisión los documentos que procesa dentro de la aplicación.
string classifierId = "<classifierId>";
Uri fileUri = new Uri("<fileUri>");
ClassifyDocumentOperation operation = await client.ClassifyDocumentFromUriAsync(WaitUntil.Completed, classifierId, fileUri);
AnalyzeResult result = operation.Value;
Console.WriteLine($"Document was classified by classifier with ID: {result.ModelId}");
foreach (AnalyzedDocument document in result.Documents)
{
Console.WriteLine($"Document of type: {document.DocumentType}");
}
Para obtener más información y ejemplos, consulte aquí.
Solución de problemas
General
Cuando interactúe con la biblioteca cliente de Form Recognizer mediante el SDK de .NET, los errores devueltos por el servicio darán como resultado un RequestFailedException
con el mismo código de estado HTTP devuelto por la solicitud de LA API REST.
Por ejemplo, si envía una imagen de recibo con un error no válido Uri
, se devuelve un 400
error que indica "Solicitud incorrecta".
try
{
AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, "prebuilt-receipt", new Uri("http://invalid.uri"));
}
catch (RequestFailedException e)
{
Console.WriteLine(e.ToString());
}
Observará que se registra información adicional, como el identificador de solicitud de cliente de la operación.
Message:
Azure.RequestFailedException: Service request failed.
Status: 400 (Bad Request)
ErrorCode: InvalidRequest
Content:
{"error":{"code":"InvalidRequest","message":"Invalid request.","innererror":{"code":"InvalidContent","message":"The file is corrupted or format is unsupported. Refer to documentation for the list of supported formats."}}}
Headers:
Transfer-Encoding: chunked
x-envoy-upstream-service-time: REDACTED
apim-request-id: REDACTED
Strict-Transport-Security: REDACTED
X-Content-Type-Options: REDACTED
Date: Fri, 01 Oct 2021 02:55:44 GMT
Content-Type: application/json; charset=utf-8
Los códigos de error y los mensajes generados por el servicio Document Intelligence se pueden encontrar en la documentación del servicio.
Para más información sobre los problemas comunes, consulte nuestra guía de solución de problemas.
Configuración del registro de la consola
La manera más sencilla de ver los registros es habilitar el registro de la consola. Para crear un agente de escucha de registro del SDK de Azure que genere mensajes en la consola, use el método AzureEventSourceListener.CreateConsoleLogger.
// Setup a listener to monitor logged events.
using AzureEventSourceListener listener = AzureEventSourceListener.CreateConsoleLogger();
Para más información sobre otros mecanismos de registro, consulte Ejemplos de diagnóstico.
Pasos siguientes
Los ejemplos que muestran cómo usar la biblioteca de Form Recognizer están disponibles en este repositorio de GitHub. Se proporcionan muestras para cada área funcional principal:
- Extracción del diseño de un documento
- Análisis con el modelo de documento general precompilado
- Análisis con el modelo de lectura precompilado
- Análisis de un documento con un modelo personalizado
- Análisis de un documento con un modelo precompilado
- Compilación de un modelo personalizado
- Administración de modelos
- [Clasificar un documento] [classify_a_document]
- Compilación de un clasificador de documentos
- Obtención y enumeración de operaciones del modelo de documentos
- Redacción de un modelo
- Copie un modelo personalizado entre recursos de Form Recognizer
- Simulación de un cliente para realizar pruebas mediante la biblioteca Moq
Tenga en cuenta que estos ejemplos usan la versión
4.1.0
del SDK . Para la versión 3.1.1 o inferior, consulte ejemplos de Form Recognizer para V3.1.X.
Contribuciones
Este proyecto agradece las contribuciones y sugerencias. La mayoría de las contribuciones requieren que acepte un Contrato de licencia para el colaborador (CLA) que declara que tiene el derecho a concedernos y nos concede los derechos para usar su contribución. Para más información, visite cla.microsoft.com.
Cuando se envía una solicitud de incorporación de cambios, un bot de CLA determinará de forma automática si tiene que aportar un CLA y completar la PR adecuadamente (por ejemplo, la etiqueta, el comentario). Solo siga las instrucciones que le dará el bot. Solo será necesario que lo haga una vez en todos los repositorios con nuestro CLA.
Este proyecto ha adoptado el Código de conducta de Microsoft Open Source. Para más información, consulte las preguntas más frecuentes del código de conducta o póngase en contacto con opencode@microsoft.com si tiene cualquier otra pregunta o comentario.
Azure SDK for .NET