Leer una sola página en Azure Document Intelligence Studio

Marco Mancera 20 Puntos de reputación
2025-01-16T02:34:35.1333333+00:00

Tengo un modelo customizado en Azure Document Intelligence Studio para leer datos de documentos PDF que se envían.

Sin embargo mis documentos tienen alrededor de 10 u 11 páginas, de las cuales yo solo necesito leer la primer página, el resto son leyendas generales que no me interesa procesar.

¿Hay alguna manera de indicarle a mi modelo que solo lea la primer página? esto con el fin de que no se procesen el resto de páginas y no signifique un cargo en costos para mi recurso.

Gracias de antemano.

Azure
Azure
Plataforma e infraestructura de informática en la nube para crear, implementar y administrar aplicaciones y servicios a través de una red mundial de centros de datos administrados por Microsoft.
548 preguntas
0 comentarios No hay comentarios
{count} votos

Respuesta aceptada
  1. Gao Chen 6,385 Puntos de reputación Proveedor de Microsoft
    2025-01-16T17:44:53.5+00:00

    Hola Marco Mancera,

    ¡Bienvenido(a) a Microsoft Q&A!

    En este caso, si puedes configurar tu modelo en Azure Document Intelligence Studio para que solo procese la primera página de tus documentos PDF. Aquí te dejo una guía general sobre cómo hacerlo:

    Usar el SDK de Azure AI Document Intelligence: Puedes especificar las páginas que deseas procesar utilizando el SDK. Aquí tienes un ejemplo en Python:

    from azure.core.credentials import AzureKeyCredential
    from azure.ai.documentintelligence import DocumentIntelligenceClient
    
    endpoint = "TU_ENDPOINT"
    key = "TU_CLAVE"
    
    document_intelligence_client = DocumentIntelligenceClient(endpoint, AzureKeyCredential(key))
    
    with open("ruta/a/tu/documento.pdf", "rb") as f:
        poller = document_intelligence_client.begin_analyze_document(
            "prebuilt-layout",
            document=f,
            pages="1"  # Especifica que solo quieres procesar la primera página
        )
        result = poller.result()
    
    for page in result.pages:
        print(f"Página {page.page_number} contiene el siguiente contenido:")
        for line in page.lines:
            print(line.content)
    

    Configuración en el portal de Azure: Si prefieres usar el portal de Azure, puedes configurar tu modelo para que solo procese la primera página al subir el documento y seleccionar las opciones avanzadas para especificar las páginas a procesar.

    En caso de que necesites la información usada como referencia: Modelo de lectura de Documento de inteligencia.

    Atentamente,

    Gao


    Si esta respuesta resolvió tu consulta, por favor haz clic en 'Aceptar respuesta'. Esto nos ayuda a mejorar continuamente la calidad y relevancia de nuestras soluciones.

    1 persona ha encontrado útil esta respuesta.

0 respuestas adicionales

Ordenar por: Muy útil

Su respuesta

Las respuestas se pueden marcar como respuestas aceptadas por el autor de la pregunta, lo que ayuda a los usuarios a conocer la respuesta que resolvió el problema del autor.