Edita

Comparteix a través de


Preguntas más frecuentes

Este contenido se aplica a: marca de verificación v4.0 (versión preliminar) marca de verificación v3.1 (GA) marca de verificación v3.0 (GA) marca de verificación v2.1 (GA)

El Documento de inteligencia de Azure AI es un servicio basado en la nube que usa modelos de aprendizaje automático para extraer pares clave-valor, texto y tablas de sus documentos. El resultado devuelto es una salida JSON estructurada. Los casos de uso de Documento de inteligencia incluyen la automatización del procesamiento de datos en aplicaciones, estrategias basadas en datos mejoradas y funcionalidades de búsqueda de documentos enriquecidas.

Información general

¿Azure AI Document Intelligence y Azure AI Form Recognizer son el mismo servicio?

Sí.

Azure AI Document Intelligence y Azure AI Form Recognizer son el mismo servicio. El nombre del servicio se cambió de Azure AI Form Recognizer a Azure AI Document Intelligence en julio de 2023. El servicio proporciona las mismas funcionalidades y características que antes del cambio de nombre.

  • Cambio de precio: no hay cambios en los precios. Los nombres Cognitive Services y Applied AI Services siguen usándose en la facturación de Azure, el análisis de costos, las listas de precios y las API de precios.

  • Cambios importantes: no hay cambios importantes en las API ni en las bibliotecas de cliente. Las API REST y las versiones SDK 2024-02-29-preview, 2023-10-31-preview y posteriores cambian de nombre a document intelligence.

¿Documento de inteligencia se integra con otros servicios de Microsoft?

Sí.

Document Intelligence se integra con los siguientes servicios:

Funcionalidades de IA

¿Se puedo usar Document Intelligence con IA generativa para el procesamiento de documentos?

Sí.

Document Intelligence ahora incluye una generación personalizada de un nuevo tipo de modelo de extracción que usa la IA generativa y los modelos de lenguaje grandes (LLM) para extraer campos de los documentos. En el pasado, usó un patrón RAG (generación aumentada de recuperación) para extraer campos. El nuevo modelo proporciona resultados de alta calidad con una sola llamada API. También puede usar una solución de IA generativa de documentos para conversar con sus documentos (RAG), generar contenidos atractivos a partir de ellos y acceder a los modelos del servicio Azure OpenAI en sus datos.

  • La combinación de Azure AI Document Intelligence y Azure OpenAI permite crear aplicaciones empresariales para interactuar sin problemas con los documentos mediante lenguaje natural. Puede encontrar fácilmente respuestas a sus dudas, obtener información útil y generar contenido nuevo y atractivo a partir de los documentos existentes.

  • Puede encontrar más detalles sobre el patrón de generación aumentada de recuperación aquí.

¿Document Intelligence puede ayudar con la fragmentación semántica dentro de los documentos para la generación aumentada de recuperación?

Sí.

Document Intelligence puede proporcionar los bloques de creación para habilitar la fragmentación semántica. La fragmentación semántica es un paso clave en la generación aumentada de recuperación (RAG) para garantizar la mejora de la relevancia y los fragmentos densos del contexto.

  • Document Intelligence proporciona un modelo de diseño que proporciona una descomposición visual del documento en líneas, párrafos, secciones, encabezados y pies de página.

  • A continuación, puede optar por recuperar los resultados en formato Markdown para fragmentar aún más el documento en los límites de sección o párrafo.

Para más información, consulte Introducción a RAG en Document Intelligence

Estudio del documento de inteligencia

¿Se necesitan permisos concretos para acceder a Document Intelligence Studio?

Sí.

Necesita una cuenta de Azure activa y una suscripción con al menos un rol de lector para acceder a Documento de inteligencia Studio.

Para el análisis de documentos y los modelos precompilados, estos son los requisitos de rol para escenarios de usuario:

En el caso de los proyectos de modelo personalizados, estos son los requisitos de rol para escenarios de usuario:

  • Basic

    • Usuario de Cognitive Services: necesita este rol para que documento de inteligencia o un recurso de Cognitive Services multiservicio entrene modelos personalizados o analice con modelos entrenados.

    • Colaborador de datos de Storage Blob: necesita este rol en la cuenta de almacenamiento para crear y etiquetar datos de proyecto.

  • Avanzado

    • colaborador de la cuenta de almacenamiento: necesita este rol para que la cuenta de almacenamiento configure la configuración de uso compartido de recursos entre orígenes (CORS). Es un esfuerzo único si reutiliza la misma cuenta de almacenamiento.

    • colaborador: Necesita este rol para crear un grupo de recursos y recursos. El rol Colaborador o Colaborador de la cuenta de almacenamiento no le proporciona acceso para usar el recurso de Documento de inteligencia o la cuenta de almacenamiento si la autenticación local (basada en claves) está deshabilitada. Todavía necesita los roles básicos (Colaborador de blobs de datos de almacenamiento y Usuario de Cognitive Services) para usar las funciones de Document Intelligence Studio.

Para más información, consulte Roles integrados de Microsoft Entra y las secciones sobre las asignaciones de roles de Azure en el inicio rápido de Documento de inteligencia Studio.

¿Se pueden procesar documentos con más de dos páginas en Document Intelligence Studio?

, para los recursos de nivel de servicio de pago.

No, para los recursos del nivel de servicio gratuito.

  • En el caso de los recursos de nivel de servicio gratuito (F0), solo se analizan las dos primeras páginas si usa Document Intelligence Studio, la API de REST o las bibliotecas cliente.

  • Si desea analizar todas las páginas de un documento, cambie a un recurso de pago (S0). En Document Intelligence Studio, seleccione el botón Configuración (engranaje), seleccione la pestaña Recursos y compruebe la franja de precios que se usa para analizar los documentos.

¿Cómo puedo cambiar de directorio o suscripción en Document Intelligence Studio?

Sí.

  • Para cambiar un directorio en Documento de inteligencia Studio, seleccione el botón de Configuración (engranaje). En Directorio, seleccione el directorio de la lista y, a continuación, seleccione Cambiar directorio. Vuelva a iniciar sesión después de cambiar de directorio.

  • Para cambiar una suscripción o un recurso, vaya a la pestaña recurso en Configuración.

¿Se puede usar Document Intelligence Studio con un recurso configurado con un firewall o una red virtual?

Sí.

Si el recurso de Document Intelligence está configurado con un firewall o una red virtual, debe agregar la dirección IP dedicada 20.3.165.95 a la lista de permitidos del firewall para el recurso de Document Intelligence. Algunas funciones de proyectos personalizados (por ejemplo, etiquetado automático, administración de proyectos y humanos en el bucle) no funcionan si el acceso a la red pública está deshabilitado.

Cuando cargo un archivo en Document Intelligence Studio mediante la función "Capturar desde URL", ¿puedo usar una dirección URL de mi almacenamiento de blobs?

Sí.

Si la dirección URL de Azure Blob Storage incluye un token de SAS y es accesible desde redes públicas. No puede usar la función Capturar para las cuentas de almacenamiento en las que el acceso a la clave está deshabilitado o detrás de un firewall o una red virtual.

¿Puedo reutilizar o personalizar la experiencia de etiquetado de Documento de inteligencia Studio y compilarla en mi propia aplicación?

Sí.

La experiencia de etiquetado de Documento de inteligencia Studio es de código abierto en el repositorio del kit de herramientas.

¿Existen puntos de conexión de URL independientes para las regiones de las nubes soberanas de Documento de inteligencia?

Sí.

Document Intelligence Studio tiene puntos de conexión de dirección URL independientes para las regiones de nube soberana:

Desarrollo de aplicaciones

¿Se pueden desarrollar aplicaciones con Azure AI Document Intelligence mediante las opciones de desarrollo más recientes?

Sí.

Documento de inteligencia ofrece las opciones de desarrollo más recientes dentro de las siguientes plataformas:

¿Puedo migrar mi aplicación a la versión más reciente de Document Intelligence?

Sí.

En la siguiente tabla se proporcionan vínculos a instrucciones detalladas para migrar a la versión más reciente de Document Intelligence:

Idioma/API Guía de migración
API DE REST v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

¿Puedo especificar un intervalo de páginas que se van a analizar en un documento?

Sí.

Use el parámetro pages (admitido con v2.1, v3.0 y versiones posteriores de la API de REST) y especifique páginas para documentos PDF y TIFF de varias páginas. La entrada aceptada incluye los siguientes intervalos:

  • Páginas únicas. Por ejemplo, si especifica 1, 2, se procesan las páginas 1 y 2.
  • Intervalos finitos. Por ejemplo, si especifica 2-5, se procesan las páginas 2 a 5.
  • Intervalos abiertos. Por ejemplo, si especifica 5-, se procesan todas las páginas de la página 5. Si especifica -10, se procesan las páginas 1 a 10.

Puede combinar estos parámetros y los intervalos se pueden superponer. Por ejemplo, si especifica -5, 1, 3, 5-10, se procesan las páginas 1 a 10.

El servicio aceptará la solicitud si puede procesar al menos una página del documento. Por ejemplo, el uso de 5-100 en un documento de cinco páginas es una entrada válida que significa que se procesa la página 5.

Si no proporciona un intervalo de páginas, se procesa todo el documento.

¿Es aconsejable usar Document Intelligence Studio, en lugar de la herramienta de etiquetado de ejemplo FOTT, en mi proyecto?

Sí.

La mayoría de las veces se recomienda usar Document Intelligence Studio, ya que puede reducir el tiempo que se tarda en configurar los recursos y servicios de almacenamiento de Document Intelligence.

Considere solo la posibilidad de usar Form Testing Tool (FOTT) en los siguientes escenarios:

¿Hay procedimientos recomendados para reducir la limitación?

Sí.

Documento de inteligencia usa el escalado automático para proporcionar los recursos computacionales necesarios a petición, a la vez que se mantienen bajos los costos de los clientes. Para mitigar la limitación durante el escalado automático, se recomienda el enfoque siguiente:

  • Implemente lógica de reintento en la aplicación.

  • Si encuentra que se está limitando en el número de POST solicitudes, considere la posibilidad de agregar un retraso entre las solicitudes.

  • Aumente la carga de trabajo gradualmente. Evite los cambios bruscos.

  • Cree una solicitud de soporte técnico para aumentar el límite de transacciones por segundo (TPS).

Más información sobre las cuotas y límites del servicio del Documento de inteligencia.

Modelos personalizados

¿Puedo mejorar una puntuación de precisión estimada de un modelo personalizado?

Sí.

La precisión de un modelo se ve afectada por las varianzas en la estructura visual de los documentos. Aquí encontrará algunas sugerencias:

  • Incluya todas las variaciones de un documento en el conjunto de datos de entrenamiento. Las variaciones incluyen formatos diferentes, por ejemplo, archivos PDF digitales frente a digitalizados.

  • Separe los tipos de documento visualmente distintos y entrena distintos modelos.

  • Asegúrese de que no tiene etiquetas extrañas.

  • Para el etiquetado de firma y región, no incluya el texto circundante.

Para obtener más información, consulte Puntuaciones de precisión y confianza.

¿Puedo volver a entrenar un modelo personalizado?

No.

  • Documento de inteligencia no tiene una operación explícita de reentrenamiento. Cada operación de entrenamiento genera un nuevo modelo.

  • Si se da cuenta de que el modelo debe volver a entrenarse, puede agregar más ejemplos al conjunto de datos de entrenamiento y entrenar un nuevo modelo.

  • También puede crear un modelo para redactar con el modelo original de la siguiente manera:

    1. Cree un conjunto de datos para la nueva plantilla.

    2. Etiquete y entrena un nuevo modelo.

    3. Compruebe que el nuevo modelo funciona bien para los tipos de documento específicos.

    4. Cree el nuevo modelo con el modelo existente en un único punto de conexión. Documento de inteligencia puede determinar el mejor modelo para cada documento que se va a analizar.

    Para más información, consulte el artículo sobre modelos compuestos.

¿Cómo puedo mover mis modelos entrenados de un entorno (como beta) a otro (como producción)?

Sí.

Puede usar la API de copia para copiar modelos personalizados de una cuenta de Document Intelligence a otras que existan en cualquier región geográfica admitida. Para obtener instrucciones detalladas, consulte recuperación ante desastres.

La operación de copia se limita a copiar modelos dentro del entorno de nube específico en el que ha entrenado el modelo. Por ejemplo, no se admite la copia de modelos desde la nube pública a la nube de Azure Government.

¿Se me cobra al entrenar modelos personalizados?

Sí.

El entrenamiento es gratuito para todos los modelos de plantilla personalizados y generativos. Sin embargo, la creación del conjunto de datos de entrenamiento para todos los modelos requiere ejecutar el modelo de diseño en los documentos de entrenamiento. Este coste corre a cargo del cliente.

Los modelos generativos personalizados también se basan en la característica de etiqueta automática para acelerar la generación del conjunto de datos etiquetado. Hay un coste asociado a esta acción. Aunque la operación de compilación de modelos generativos y de plantilla es gratuita, la creación del conjunto de datos etiquetado puede dar lugar a algunos costes mínimos.

Para v4.0 2024-07-31-preview, los modelos neuronales personalizados se pueden entrenar de forma gratuita durante un máximo de 10 horas. Tanto si está entrenando un solo modelo durante las 10 horas como si entrena varios modelos durante el total de 10 horas, no se le cobrará por las primeras 10 horas. Después de usar las 10 horas gratuitas, se le cobrará automáticamente por la hora de entrenamiento adicional. Para más información sobre los precios, consulte la página de precios. Esta nueva característica de entrenamiento de pago permite a los modelos de entrenamiento durante una duración prolongada procesar documentos más grandes. Para obtener más información sobre esta característica de entrenamiento de pago, consulte sección de facturación del modelo neuronal personalizado.

Para v3.0 2022-08-31 o v3.1 2023-07-31, los modelos neuronales personalizados se pueden entrenar de forma gratuita durante un máximo de 20 sesiones de entrenamiento, con cada sesión limitada a 30 minutos de duración de entrenamiento. Una vez que use todas las 20 sesiones de entrenamiento, puede enviar una incidencia de soporte técnico de Azure para aumentar el límite de sesiones de entrenamiento. Para aumentar el límite, dos sesiones de entrenamiento se consideran una hora de entrenamiento y se le cobra por dos sesiones o una hora de entrenamiento. Para más información sobre los precios, consulte la [página de precios]. Para obtener más información sobre las formas de aumentar el límite, consulte sección de facturación del modelo neuronal personalizado. Para v3.0 y v3.1, la característica de entrenamiento de pago no está disponible. La característica de entrenamiento de pago para el modelo neuronal personalizado solo está disponible en v4.0.

Cuenta de almacenamiento

¿Hay un tiempo de expiración para el token de firma de acceso compartido (SAS) para la autenticación de mi cuenta de almacenamiento?

Sí.

Cuando se crea una firma de acceso compartido (SAS), la duración predeterminada es de 48 horas. Después de 48 horas, debe crear un nuevo token.

Considere la posibilidad de establecer un período de duración más largo durante el tiempo que usa la cuenta de almacenamiento con Documento de inteligencia.

¿Puede Document Intelligence acceder a los datos de mi cuenta de almacenamiento si está detrás de una red virtual o un firewall?

No, no directamente.

Document Intelligence no puede acceder a su cuenta de almacenamiento si está protegida por una red virtual o un firewall.

Las identidades administradas para recursos de Azure admiten identidades administradas para recursos de Azure. Cuando se usa una identidad administrada, el servicio Documento de inteligencia puede acceder a la cuenta de almacenamiento mediante una credencial asignada.

Si piensa analizar los datos de la cuenta de almacenamiento privada mediante FOTT, debe implementar la herramienta detrás de la red virtual o el firewall.

Más información sobre cómo crear y usar identidades administradas para el recurso de Documento de inteligencia.

Contenedores

¿En qué se diferencian los contenedores desconectados y los conectados?

Sí.

Aunque las funcionalidades del modelo son las mismas para los contenedores conectados y desconectados, los métodos de facturación y conectividad difieren:

  • Los contenedores conectados envían información de facturación a Azure mediante un recurso de Documento de inteligencia en su cuenta de Azure. Con los contenedores conectados, se requiere conectividad a Internet para enviar información de facturación a Azure. Los contenedores conectados de Documento de inteligencia envían información de facturación a Azure mediante un recurso de Documento de inteligencia en su cuenta de Azure. Los contenedores conectados no envían datos de los clientes (por ejemplo, la imagen o el texto que se está analizando) a Microsoft. Para obtener un ejemplo de la información que los contenedores conectados envían a Microsoft para la facturación, consulte preguntas más frecuentes sobre el contenedor de Azure AI.

  • Los contenedores desconectados permiten usar las API que están desconectadas de Internet. la información de facturación no se envía a través de Internet. En su lugar, los costos dependerán de un nivel de compromiso adquirido. Actualmente, el uso de contenedores desconectados está disponible para modelos personalizados y de factura de Documento de inteligencia.

¿Puedo usar el almacenamiento local para el contenedor de Herramienta de etiquetado de ejemplo de Documento de inteligencia (FOTT)?

Sí.

FOTT tiene una versión que usa almacenamiento local. La versión debe instalarse en un equipo Windows. Se puede instalar desde aquí.

En la página del proyecto, especifique el URI de la carpeta de etiqueta como /shared o /shared/sub-dir si los archivos de etiquetado están en un subdirectorio. El resto del comportamiento de la herramienta de etiquetado de ejemplo de Documento de inteligencia es el mismo que el del servicio hospedado.

¿Cuál es el procedimiento recomendado para escalar verticalmente?

Sí.

En el caso de las llamadas asincrónicas, puede ejecutar varios contenedores con almacenamientos compartidos. El contenedor que procesa la POST llamada de análisis almacena la salida en el almacenamiento. A continuación, cualquier otro contenedor puede obtener los resultados del almacenamiento y atender las llamadas GET. El identificador de solicitud no está vinculado a un contenedor.

En el caso de las llamadas sincrónicas, puede ejecutar varios contenedores, pero solo un contenedor atiende una solicitud. Dado que es una llamada de bloqueo, cualquier contenedor del grupo puede atender la solicitud y enviar la respuesta. En este caso, solo un contenedor está vinculado a una solicitud a la vez y no se requiere ningún sondeo.

¿Puedo configurar contenedores con almacenamiento compartido?

Sí.

Los contenedores usan la propiedad Mounts: Shared al iniciarse para especificar el almacenamiento compartido para almacenar los archivos de procesamiento. Para ver el uso de esta propiedad, consulte la documentación de contenedores .

Seguridad y privacidad

¿Documento de inteligencia almacena mis datos?

Sí, brevemente.

Para todas las características, Documento de inteligencia almacena temporalmente los datos y da como resultado Azure Storage en la misma región que la solicitud. Los datos se eliminan en un plazo de 24 horas a partir del momento en que envía una solicitud de análisis.

Obtenga más información sobre los datos, la privacidad y la seguridad de Documento de inteligencia.

En el caso de los modelos personalizados entrenados, las salidas provisionales después del análisis y el etiquetado se almacenan en la misma ubicación de Azure Storage en que se almacenan los datos de entrenamiento. Los modelos personalizados entrenados se almacenan en Azure Storage en la misma región y están aislados lógicamente con las credenciales de API y su suscripción de Azure.

Más ayuda y soporte técnico

¿Hay otros recursos disponibles que ofrezcan soluciones a las preguntas sobre Documento de inteligencia de Azure AI?

Sí.

Microsoft Q & A es el centro de preguntas y respuestas técnicas de Microsoft. Puede filtrar las consultas específicas de Documento de inteligencia.

¿Puedo hacer comentarios directamente si el servicio no reconoce texto específico o lo reconoce incorrectamente cuando estoy etiquetando documentos?

Sí.

Los modelos de Document Intelligence se actualizan y mejoran continuamente. Puede enviar un correo electrónico al equipo de Documento de inteligencia. Si es posible, comparta un documento de ejemplo con el problema resaltado.