Compartir a través de

Leer una sola página en Azure Document Intelligence Studio

Marco Mancera 20 Puntos de reputación
2025-01-16T02:34:35.1333333+00:00

Tengo un modelo customizado en Azure Document Intelligence Studio para leer datos de documentos PDF que se envían.

Sin embargo mis documentos tienen alrededor de 10 u 11 páginas, de las cuales yo solo necesito leer la primer página, el resto son leyendas generales que no me interesa procesar.

¿Hay alguna manera de indicarle a mi modelo que solo lea la primer página? esto con el fin de que no se procesen el resto de páginas y no signifique un cargo en costos para mi recurso.

Gracias de antemano.

Azure
Azure

Plataforma e infraestructura de informática en la nube para crear, implementar y administrar aplicaciones y servicios a través de una red mundial de centros de datos administrados por Microsoft.

0 comentarios No hay comentarios

Respuesta aceptada por el autor de la pregunta

Gao Chen 10,780 Puntos de reputación Personal externo de Microsoft Moderador
2025-01-16T17:44:53.5+00:00

Hola Marco Mancera,

¡Bienvenido(a) a Microsoft Q&A!

En este caso, si puedes configurar tu modelo en Azure Document Intelligence Studio para que solo procese la primera página de tus documentos PDF. Aquí te dejo una guía general sobre cómo hacerlo:

Usar el SDK de Azure AI Document Intelligence: Puedes especificar las páginas que deseas procesar utilizando el SDK. Aquí tienes un ejemplo en Python:

from azure.core.credentials import AzureKeyCredential
from azure.ai.documentintelligence import DocumentIntelligenceClient

endpoint = "TU_ENDPOINT"
key = "TU_CLAVE"

document_intelligence_client = DocumentIntelligenceClient(endpoint, AzureKeyCredential(key))

with open("ruta/a/tu/documento.pdf", "rb") as f:
    poller = document_intelligence_client.begin_analyze_document(
        "prebuilt-layout",
        document=f,
        pages="1"  # Especifica que solo quieres procesar la primera página
    )
    result = poller.result()

for page in result.pages:
    print(f"Página {page.page_number} contiene el siguiente contenido:")
    for line in page.lines:
        print(line.content)

Configuración en el portal de Azure: Si prefieres usar el portal de Azure, puedes configurar tu modelo para que solo procese la primera página al subir el documento y seleccionar las opciones avanzadas para especificar las páginas a procesar.

En caso de que necesites la información usada como referencia: Modelo de lectura de Documento de inteligencia.

Atentamente,

Gao


Si esta respuesta resolvió tu consulta, por favor haz clic en 'Aceptar respuesta'. Esto nos ayuda a mejorar continuamente la calidad y relevancia de nuestras soluciones.

¿Le ha resultado útil esta respuesta?

1 persona ha encontrado útil esta respuesta.

0 respuestas adicionales

Ordenar por: Muy útil

Su respuesta

Las respuestas pueden ser marcadas como "Aceptadas" por el autor de la pregunta y "Recomendadas" por los moderadores, lo que ayuda a los usuarios a saber que la respuesta ha resuelto el problema del autor.