Comparteix a través de


Novedades de Documento de inteligencia de Azure AI

Este contenido se aplica a: marca de verificación v4.0 (versión preliminar) marca de verificación v3.1 (GA) marca de verificación v3.0 (GA) marca de verificación v2.1 (GA)

El servicio Documento de inteligencia se actualiza de forma continua. Marque esta página para mantenerse al día con las notas de la versión, las mejoras de características y la documentación más reciente.

Importante

Las versiones preliminares de la API se retiran una vez publicada la API de disponibilidad general. La versión 2023-02-28-preview de la API se va a retirar. Si sigue usando la API de la versión preliminar o las versiones del SDK asociadas, actualice el código de forma que indique la última versión de la API, 2023-07-31 (GA).

Agosto de 2024

La API de REST de Documento de inteligencia 2024-07-31-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:

  • La versión preliminar pública 2024-07-31-preview solo está disponible actualmente en las siguientes regiones de Azure. El nuevo modelo de extracción de campos de documentos en AI Studio solo está disponible en la región Centro-norte de EE. UU.:

  • Este de EE. UU.

  • Oeste de EE. UU. 2

  • Oeste de Europa

  • Centro-Norte de EE. UU

  • 🆕 Modelo de extracción de campos de documentos (generativo personalizado)

    • Use IA generativa para extraer campos de documentos y formularios. Documento de inteligencia ofrece ahora un nuevo modelo de extracción de campos de documentos que utiliza modelos de lenguaje de gran tamaño (LLM) para extraer campos de documentos no estructurados o formularios estructurados con una amplia variedad de plantillas visuales. Con valores fundamentados y puntuaciones de confianza, la nueva extracción basada en IA generativa se adapta a sus procesos actuales.
  • 🆕 Composición de modelos con clasificadores personalizados

    • Inteligencia de documentos ahora agrega compatibilidad con la redacción del modelo con un modelo de clasificación personalizado explícito. Obtenga más información sobre las ventajas de usar la nueva capacidad de redacción.
  • Modelos de clasificación personalizados

    • El modelo de clasificación personalizada ahora también admite la actualización del modelo en contexto.
    • El modelo de clasificación personalizada agrega compatibilidad con la operación de copia de modelos para habilitar la copia de seguridad y la recuperación ante desastres.
    • El modelo de clasificación personalizada ahora admite la especificación explícita de páginas que se van a clasificar desde un documento de entrada.
  • 🆕 Modelo de documentos de hipotecas

    • Extraer información de la evaluación (formulario 1004).
    • Extraer información de validación de empleo (formulario 1005).
  • 🆕 Modelo de cheques

    • Extraiga la información pertinente de los cheques del receptor, la cantidad, la fecha y otros datos pertinentes.
  • 🆕 Modelo de recibo de pago

    • Nueva versión para procesar recibos de pago para extraer salarios, horas, deducciones, pago neto y mucho más.
  • 🆕 Modelo de extracto bancario

    • Nueva versión para extraer información de la cuenta, incluidos los saldos iniciales y finales, los detalles de la transacción de los extractos bancarios.
  • 🆕 Modelo fiscal de EE. UU.

    • Nuevo modelo fiscal unificado de Estados Unidos que puede extraer de formularios como W-2, 1098, 1099 y 1040.
  • 🆕 PDF que se puede buscar. El modelo de lectura precompilado es ahora compatible con salida de PDF para descargar PDF con texto insertado a partir de los resultados de la extracción, lo que permite usar PDF en escenarios como la copia de búsqueda de contenidos.

  • El modelo de diseño ahora admite una detección de ilustración mejorada en la que ahora se pueden descargar ilustraciones de documentos como un archivo de imagen que se va a usar para comprender aún más la ilustración. El modelo de diseño también presenta mejoras en el modelo de OCR para texto digitalizado cuyo objetivo son las mejoras para caracteres únicos, texto en recuadros y documentos de texto denso.

  • 🆕 Batch API

    • Documento de inteligencia ahora agrega soporte para la operación de análisis por lotes para permitir el análisis de un conjunto de documentos para simplificar la experiencia del desarrollador y mejorar la eficiencia.
  • Funcionalidades de complementos

    • La calidad de extracción de la inteligencia artificial de los campos de consulta se ha mejorado con el modelo más reciente.

Mayo de 2024

Document Intelligence Studio agrega compatibilidad con la autenticación de Microsoft Entra (anteriormente Azure Active Directory). Para obtener más información, consulte Información general de Document Intelligence Studio.

Febrero de 2024

La API de REST de Documento de inteligencia 2024-07-31-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:

  • La versión preliminar pública 2024-07-31-preview solo está disponible actualmente en las siguientes regiones de Azure:

    • Este de EE. UU.
    • Oeste de EE. UU. 2
    • Oeste de Europa
  • El modelo de diseño ahora admite la detección de imágenes y el análisis jerárquico de la estructura de documentos (secciones y subsecciones). También se ha mejorado la calidad de inteligencia artificial del orden de lectura y la detección de roles lógicos.

  • Modelos de extracción personalizados

    • Los modelos de extracción personalizados ahora admiten puntuaciones de confianza de celda, fila y nivel de tabla. Obtenga más información sobre la confianza de tabla, fila y celda.
    • Los modelos de extracción personalizados cuentan con mejoras de calidad de la IA para la extracción de campos.
    • El modelo de extracción de plantillas personalizado admite ahora la extracción de campos superpuestos. Obtenga más información sobre los campos superpuestos y cómo se usan.
  • Modelos de clasificación personalizados

    • El modelo de clasificación personalizada ahora admite el entrenamiento incremental para escenarios en los que necesita actualizar el modelo clasificador con ejemplos o clases agregados. Obtenga más información sobre el entrenamiento incremental.
    • El modelo de clasificación personalizado agrega compatibilidad con ciertos tipos de documentos de Office (.docx, .pptx y .xls). Obtenga más información sobre la compatibilidad ampliada con tipos de documento.
  • Modelo de factura

    • Compatibilidad con nuevas configuraciones regionales:
    Configuración regional Código
    Árabe (ar)
    Búlgaro (bg)
    Griego (el)
    Hebreo (he)
    Macedonio (mk)
    Ruso (ru) Serbio cirílico (sr-cyrl)
    Ucraniano (uk)
    Tailandés (th)
    Turco (tr)
    Vietnamita (vi)
    • Compatibilidad con nuevos códigos de moneda:
    Moneda Configuración regional Código
    BAM Marco convertible de Bosnia (ba)
    BGN Lev búlgaro (bg)
    ILS Nuevo séquel israelí (il)
    MKD Denar de Macedonia (mk)
    RUB Rublo ruso (ru)
    THB Baht tailandés (th)
    TRY Lira turca (tr)
    UAH Grivna de Ucrania (ua)
    VND Dong vietnamita (vn)
    • Los elementos fiscales admiten la expansión de Alemania (de), España (es), Portugal (pt), Inglés Canadá en-CA.
  • Modelo de identificador

  • 🆕 Documentos de hipotecas

    • Extraiga información de solicitud uniforme de préstamo residencial (formulario 1003).
    • Extraiga información de la suscripción uniforme y el resumen de transmisión o el formulario 1008.
    • Extraiga información de la divulgación de cierre de hipoteca.
  • 🆕 Modelo de tarjeta de crédito o débito

    • Extraiga información de las tarjetas bancarias.
  • 🆕 Certificado de matrimonio

    • Nuevo elemento precompilado para extraer información de los certificados de matrimonio.

Diciembre de 2023

Las bibliotecas cliente de Document Intelligence que tienen como destino la API REST 2023-10-31-preview ya están disponibles para su uso.

Noviembre de 2023

La API REST de Documento de inteligencia 2023-10-31-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:

  • Actualmente, la versión preliminar pública 2023-10-31-preview solo está disponible en las siguientes regiones de Azure:

    • Este de EE. UU.
    • Oeste de EE. UU. 2
    • Oeste de Europa
  • Modelo de lectura

    • Ampliación de idiomas para la escritura a mano: ruso (ru), árabe (ar), tailandés (th).
    • Cumplimiento de la Orden Ejecutiva Cibernética (EO).
  • Modelo de diseño

    • Compatibilidad con archivos de Office y HTML.
    • Compatibilidad con la salida de Markdown.
    • Mejoras en la extracción de tablas, el orden de lectura y la detección de encabezados de sección.
    • A partir de Documento de inteligencia 2023-10-31-preview, el modelo de documento general (prebuilt-document) queda en desuso. En el futuro, para extraer pares clave-valor de los documentos, use el modelo prebuilt-layout con el parámetro opcional de cadena de consulta features=keyValuePairs habilitado.
  • Modelo de recibo

    • Ahora se extrae la moneda de todos los campos relacionados con el precio.
  • Modelo de tarjeta de seguro médico

    • Compatibilidad de nuevos campos para la información de Medicare y Medicaid.
  • Modelos de documentos fiscales de EE. UU.

    • Nuevo modelo fiscal 1099. Admite el formulario 1099 y las variaciones siguientes: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Modelo de factura

    • Compatibilidad con el campo KVK.
    • Compatibilidad con el campo BPAY.
    • Numerosos refinamientos de campo.
  • Clasificación personalizada

    • Compatibilidad con documentos de varios idiomas.
    • Nuevas opciones de división de páginas: división automática, división siempre por página, sin división.
  • Funcionalidades de complementos

    • Los campos de consulta están disponibles con la versión 2023-10-31-preview.
    • Las funcionalidades de complementos están disponibles en todos los modelos, excepto el modelo de lectura.

Nota:

Con la versión de disponibilidad general (GA) de la API 2022-08-31, las API de versión preliminar asociadas están en desuso. Si usa las versiones preliminares de la API 2021-09-30, 2022-01-30 o 2022-06-30, actualice las aplicaciones para que tengan como destino la versión de la API 2022-08-31. Para obtener más información sobre algunos cambios menores relacionados, consulte la guía de migración.

Julio de 2023

Nota:

Form Recognizer ahora es Documento de inteligencia de Azure AI.

  • Los servicios de Azure AI de documentación engloban todo lo que antes se conocía como Cognitive Services y Azure Applied AI Services.
  • No hay ningún cambio en los precios.
  • Los nombres Cognitive Services y Azure Applied AI siguen utilizándose en las API de facturación, análisis de costes, listas de precios y precios de Azure.
  • No hay cambios importantes en las interfaces de programación de aplicaciones (API) ni en las bibliotecas de cliente.
  • Algunas plataformas siguen esperando la actualización de cambio de nombre. Todas las menciones de Form Recognizer o Documento de inteligencia en nuestra documentación se refieren al mismo servicio de Azure.

Documento de inteligencia v3.1 (GA)

La API de Documento de inteligencia versión 3.1 ya está disponible con carácter general (GA). La versión de la API se corresponde con 2023-07-31. La API v3.1 presenta funcionalidades nuevas y actualizadas:

Actualizaciones de la experiencia del usuario de Document Intelligence Studio

✔️ Opciones de análisis

  • Document Intelligence ahora admite funcionalidades de análisis más sofisticadas y Studio permite un punto de entrada (botón Opciones de análisis) para configurar las funcionalidades del complemento con facilidad.

  • Según el escenario de extracción de documentos, configure el intervalo de análisis, el intervalo de páginas del documento, la detección opcional y las características de detección premium.

    Captura de pantalla animada que muestra el uso del botón opciones de análisis para configurar las opciones en Studio

    Nota:

    La extracción de fuentes no se visualiza en Document Intelligence Studio. Sin embargo, puede comprobar la sección de estilos de la salida JSON para los resultados de detección de fuentes.

✔️ Etiquetado automático de documentos con modelos precompilados o uno de sus propios modelos

  • En la página de etiquetado de modelos de extracción personalizados, ahora puede etiquetar automáticamente los documentos con uno de los modelos precompilados del servicio Documento de inteligencia o con modelos que haya entrenado antes.

    Captura de pantalla animada que muestra el etiquetado automático en Studio.

  • Para algunos documentos, puede haber etiquetas duplicadas después de ejecutar la etiqueta automática. Asegúrese de modificar las etiquetas para que no haya etiquetas duplicadas en la página de etiquetado después.

    Captura de pantalla que muestra la advertencia de etiquetas duplicadas tras el etiquetado automático.

✔️ Tablas de etiquetado automático

  • En la página de etiquetado del modelo de extracción personalizada, ahora puede etiquetar automáticamente las tablas del documento sin tener que etiquetar las tablas manualmente.

    Captura de pantalla animada que muestra el etiquetado automático de tablas en Studio.

✔️ Agregar archivos de prueba directamente al conjunto de datos de entrenamiento

  • Una vez que haya entrenado un modelo de extracción personalizado, use la página de prueba para mejorar la calidad del modelo cargando documentos de prueba en el conjunto de datos de entrenamiento si es necesario.

  • Si se devuelve una puntuación de confianza baja para algunas etiquetas, asegúrese de que las etiquetas son correctas. Si no es así, agréguelos al conjunto de datos de entrenamiento y vuelva a etiquetarlos para mejorar la calidad del modelo.

Captura de pantalla animada que muestra cómo agregar archivos de prueba al conjunto de datos de entrenamiento.

✔️ Usar las opciones y filtros de la lista de documentos en proyectos personalizados

  • Use la página de etiquetado del modelo de extracción personalizado. Ahora puede navegar por los documentos de entrenamiento con facilidad mediante la búsqueda, el filtro y la ordenación por característica.

  • Utilice la vista de cuadrícula para obtener una vista previa de los documentos o use la vista de lista para desplazarse por los documentos más fácilmente.

    Captura de pantalla que muestra las opciones y filtros de la vista de lista de documentos

✔️ Uso compartido de proyectos

Mayo de 2023

Introducción a la documentación actualizada para Build 2023

abril de 2023

Anuncio de la versión preliminar pública de la biblioteca cliente de Documento de inteligencia más reciente

Marzo de 2023

Importante

Actualmente, 2023-02-28-preview capacidades solo están disponibles en las siguientes regiones:

  • Oeste de Europa
  • Oeste de EE. UU. 2
  • Este de EE. UU.

Febrero de 2023


Enero de 2023

  • Modelo de recibo precompilado: se admiten idiomas agregados. El modelo de recibo ahora admite estos idiomas y configuraciones regionales agregados:

    • Japonés, Japón (ja-JP)
    • Francés, Canadá (fr-CA)
    • Holandés, Países Bajos (nl-NL)
    • Inglés, Emiratos Árabes Unidos (en-AE)
    • Portugués, Brasil (pt-br)
  • Modelo de factura precompilado: se admiten idiomas agregados. El modelo de factura ahora admite estos idiomas y configuraciones regionales agregados:

    • Inglés: Estados Unidos (en-US), Australia (en-AU), Canadá (en-CA), Reino Unido (en-UK), India (en-IN)
    • Español: España (es-ES)
    • Francés: Francia (fr-FR)
    • Italiano: Italia (it-IT)
    • Portugués: Portugal (pt-PT)
    • Holandés, Países Bajos (nl-NL)
  • Modelo de factura precompilado: se reconocen campos agregados. El modelo de factura ahora reconoce estos campos agregados:

    • Código de moneda
    • Opciones de pago
    • Descuento total
    • Elementos fiscales (solo en-IN)
  • Modelo de identificación precompilado: se admiten tipos de documento agregados. El modelo de identificación ahora admite estos tipos de documento agregados:

    • Identificación militar de EE. UU.

Sugerencia

Todas las actualizaciones de enero de 2023 están disponibles con la versión API de REST 2022-08-31 (disponibilidad general).

  • Modelo precompilado de recibos (compatibilidad con idiomas adicionales):

    El modelo de recibo precompilado agrega compatibilidad con los siguientes idiomas:

    • Inglés, Emiratos Árabes Unidos (en-AE)
    • Holandés, Países Bajos (nl-NL)
    • Francés, Canadá (fr-CA)
    • Alemán: (de-DE)
    • Italiano: (it-IT)
    • Japonés, Japón (ja-JP)
    • Portugués, Brasil (pt-br)
  • Modelo precompilado de factura (compatibilidad con idiomas adicional y extracciones de campo)

    El modelo de factura precompilado agrega compatibilidad con los siguientes idiomas:

    • Inglés: Australia (en-AU), Canadá (en-CA), Reino Unido (en-UK), India (en-IN)
    • Portugués, Brasil (pt-br)

    El modelo de factura precompilado ahora admite las siguientes extracciones de campos:

    • Código de moneda
    • Opciones de pago
    • Descuento total
    • Elementos fiscales (solo en-IN)
  • Modelo precompilado de documento de id. (compatibilidad con tipos de documentos adicional)

    El modelo de documento de identificación precompilado ahora agrega compatibilidad con los siguientes tipos de documentos:

    • Expansión de licencias de conducir que respalda la India, Canadá, Reino Unido y Australia
    • Documentos y tarjetas de identificación militares estadounidenses
    • Documentos y tarjetas de identificación de la India (PAN y Aadhaar)
    • Tarjetas de identificación y documentos de Australia (tarjeta de foto, id. Key-pass)
    • Tarjetas de identificación y documentos de Canadá (tarjeta de identificación, tarjeta Maple)
    • Tarjetas de identificación y documentos del Reino Unido (tarjeta de identidad nacional/regional)

Diciembre de 2022

  • Actualizaciones de Document Intelligence Studio

    En la versión de diciembre de Document Intelligence Studio se incluyen las actualizaciones más recientes de Document Intelligence Studio. Hay importantes mejoras en la experiencia del usuario, principalmente con compatibilidad con el etiquetado de modelos personalizado.

    • Intervalo de páginas Ahora Studio admite el análisis de páginas especificadas desde un documento.

    • Etiquetado de modelos personalizados:

      • Ejecución de la API de diseño automáticamente. Puede optar por ejecutar la API de diseño para todos los documentos automáticamente en el almacenamiento de blobs durante el proceso de configuración del modelo personalizado.

      • Búsqueda. Studio ahora incluye la funcionalidad de búsqueda para buscar palabras dentro de un documento. Esta mejora permite una navegación más sencilla mientras se etiqueta.

      • Navegación Puede seleccionar etiquetas para dirigirse a palabras etiquetadas dentro de un documento.

      • Etiquetado automático de tablas Después de seleccionar el icono de tabla dentro de un documento, puedes optar por etiquetar automáticamente la tabla extraída en la vista de etiquetado.

      • Subtipos de etiqueta y subtipos de segundo nivel Studio admite ahora subtipos para columnas de tabla, filas de tabla y subtipos de segundo nivel para tipos como fechas y números.

  • La creación de modelos neuronales personalizados ahora se admite en la región US Gov Virginia.

  • Las versiones preliminares de la API 2022-01-30-preview y 2021-09-30-preview se retirarán el 31 de enero de 2023. Actualice a la versión de la API 2022-08-31 para evitar cualquier interrupción del servicio.


Noviembre de 2022

  • Anuncio de la versión estable más reciente de las bibliotecas de Documento de inteligencia de Azure AI
    • Esta versión incluye cambios y actualizaciones importantes para las bibliotecas cliente de .NET, Java, JavaScript y Python. Para obtener más información, consulte DevBlog del SDK de Azure.
    • Las mejoras más significativas consisten en la introducción de dos nuevos clientes, DocumentAnalysisClient y DocumentModelAdministrationClient.

Octubre de 2022

  • Contenido con versiones de Documento de inteligencia

    • La documentación de Documento de inteligencia se ha actualizado para presentar una experiencia con versiones. Ahora, puede elegir ver el contenido orientado a la experiencia de v3.0 GA o a la experiencia de v2.1 GA. La experiencia v3.0 es la predeterminada.

      Captura de pantalla de la página de aterrizaje de Document Intelligence que indica el menú desplegable de la versión

  • Código de ejemplo de Document Intelligence Studio

    • El código de ejemplo para la experiencia de etiquetado de Document Intelligence Studio ya está disponible en GitHub. Los clientes pueden desarrollar e integrar Documento de inteligencia en su propia experiencia del usuario, o bien crearla mediante el código de ejemplo de Document Intelligence Studio.
  • Expansión de idioma

    • Con la versión preliminar más reciente, los modelos de plantillas de lectura (OCR), diseño y personalización de Documento de inteligencia admiten 134 nuevos idiomas. Estas adiciones lingüísticas incluyen griego, letón, serbio, tailandés, ucraniano y vietnamita, junto con varios idiomas latinos y cirílicos. Ahora Documento de inteligencia admite un total de 299 idiomas en las versiones de disponibilidad general más recientes y nuevas versiones preliminares. Consulte la página de idiomas admitidos para ver todos los idiomas admitidos.
    • Use el parámetro api-version=2022-06-30-preview de la API de REST al usar la API o el SDK correspondiente para admitir los nuevos lenguajes de las aplicaciones.
  • Nuevo modelo de contrato precompilado

    • Nuevo modelo precompilado que extrae información de contratos, como entidades, título, id. de contrato, fecha de ejecución y mucho más. el modelo de contratos está actualmente en versión preliminar y solicita acceso aquí.
  • Expansión de regiones para entrenar modelos neuronales personalizados

    • Ahora el entrenamiento de modelos neuronales personalizados es compatible con regiones agregadas.
      • Este de EE. UU.
      • Este de EE. UU. 2
      • US Gov: Arizona

Septiembre de 2022

Nota:

A partir de la versión 4.0.0, se ha introducido un nuevo conjunto de clientes para aprovechar las características más recientes del servicio Documento de inteligencia.

La versión de disponibilidad general de la versión 4.0.0 del SDK incluye las siguientes actualizaciones:

  • Versión 4.0.0 GA (2022-09-08)
  • Compatibilidad con clientes de REST API v3.0 y v2.0

Paquete (NuGet)

Registro de cambios/Historial de versiones

Guía de migración

Léame

Muestras

  • La expansión de regiones para entrenar modelos neuronales personalizados ahora se admite en seis nuevas regiones

    • Este de Australia
    • Centro de EE. UU.
    • Este de Asia
    • Centro de Francia
    • Sur de Reino Unido 2
    • Oeste de EE. UU. 2
    • Para ver una lista completa de las regiones en que se admite el entrenamiento, consulte modelos neuronales personalizados.

    • Versión 4.0.0 GA del SDK de Documento de inteligencia:

      • Bibliotecas de cliente de Document Intelligence versión 4.0.0 (.NET/C#, Java, JavaScript) y la versión 3.2.0 (Python) están disponibles con carácter general y listos para su uso en aplicaciones de producción.
      • Para obtener más información sobre las bibliotecas cliente de Document Intelligence, consulte la introducción a SDK.
      • Actualice las aplicaciones mediante la guía de migración del lenguaje de programación.

Agosto de 2022

La versión preliminar beta del SDK de Documento de inteligencia de agosto de 2022 incluye las siguientes actualizaciones:

  • Documento de inteligencia v3.0 está disponible con carácter general

    • La API REST de Documento de inteligencia v3.0 ya está disponible con carácter general y lista para su uso en aplicaciones de producción. Actualice las aplicaciones con la API REST versión 2022-08-31.
  • Actualizaciones de Document Intelligence Studio

    • Pasos siguientes. En cada página de modelo, Studio ahora tiene una sección de pasos siguientes. Los usuarios pueden hacer referencia rápidamente al código de ejemplo, a las directrices de solución de problemas y a la información de precios.
    • Modelos personalizados. Studio ahora incluye la capacidad de reordenar etiquetas en proyectos de modelos personalizados para mejorar la eficacia del etiquetado.
    • Copia de modelos Los modelos personalizados se pueden copiar entre los servicios de Documento de inteligencia desde Studio. Esta operación permite la promoción de un modelo entrenado a otros entornos y regiones.
    • Eliminar documentos. Studio ahora admite la eliminación de documentos del conjunto de datos etiquetado dentro de proyectos personalizados.
  • Actualizaciones del servicio Documento de inteligencia

    • prebuilt-read. El modelo de lectura OCR ahora también está disponible en Documento de inteligencia con detección de idioma y párrafos como dos nuevas características. La lectura de Documento de inteligencia está orientada a escenarios de documentos avanzados que se alinean con las funcionalidades de inteligencia documental más amplias de Documento de inteligencia.
    • prebuilt-layout. El modelo de diseño extrae párrafos e identifica si el texto extraído es un párrafo, título, encabezado de sección, nota al pie de página, encabezad de página o número de página.
    • prebuilt-invoice. Los campos TotalVAT y Line/VAT se resolverán ahora en los campos existentes TotalTax y Line/Tax respectivamente.
    • prebuilt-idDocument. Compatibilidad con la extracción de datos para el identificador de estado de EE. UU., la seguridad social y las tarjetas verdes. Soporte para la información de visado de pasaporte.
    • prebuilt-receipt. Compatibilidad ampliada con configuración regional para francés (fr-FR), español (es-ES), portugués (pt-PT), italiano (it-IT) y alemán (de-DE).
    • prebuilt-businessCard. Soporte de análisis de direcciones para extraer subcampos para componentes de direcciones, como la dirección, ciudad, estado, país/región y el código postal.
  • Mejoras de calidad de la IA

    • prebuilt-read. Compatibilidad mejorada con caracteres individuales, fechas manuscritas, cantidades, nombres y otros datos clave que se encuentran habitualmente en recibos y facturas y un procesamiento mejorado de documentos PDF digitales.
    • prebuilt-layout. Compatibilidad con una mejor detección de tablas recortadas, tablas sin bordes y reconocimiento mejorado de celdas de expansión larga.
    • prebuilt-document. Valor mejorado y detección de casillas.
    • custom-neural. Precisión mejorada para la detección y extracción de tablas.

Junio de 2022

  • La versión preliminar beta del SDK de Documento de inteligencia de junio de 2022 incluye las siguientes actualizaciones:

Febrero de 2022

  • La versión preliminar de Document Intelligence v3.0 presenta varias características, funcionalidades y mejoras nuevas:

    • El modelo neuronal personalizado o el modelo de documento personalizado es un nuevo modelo personalizado para extraer texto y marcas de selección de formularios estructurados, documentos semiestructurados y no estructurados.
    • El modelo precompilado W-2 es un nuevo modelo precompilado para extraer campos de formularios W-2 para escenarios de informes fiscales y comprobación de ingresos.
    • Lectura La API extrae líneas de texto impresas, palabras, ubicaciones de texto, idiomas detectados y texto manuscrito, si se detecta.
    • El modelo entrenado previamente para documentos generales ahora se actualiza para admitir marcas de selección, además de texto de API, tablas, estructura, y pares clave-valor de formularios y documentos.
    • API de factura El modelo precompilado de factura amplía la compatibilidad con las facturas en español.
    • Document Intelligence Studio agrega nuevas demostraciones para lectura, W2, ejemplos de recibos de hotel y compatibilidad con el entrenamiento de los nuevos modelos neuronales personalizados.
    • Expansión de lenguaje Los formularios de lectura, diseño y personalización de Documento de inteligencia agregan compatibilidad con 42 nuevos idiomas, incluidos el árabe, el hindi y otros idiomas que usan scripts de árabe y devanagari para expandir la cobertura a 164 idiomas. La compatibilidad con idiomas manuscritos se expande a japonés y coreano.
  • Introducción a la nueva API de versión preliminar v3.0.

  • Extracción de datos del modelo de Inteligencia de documentos:

    Modelo Extracción de texto Pares clave-valor Marcas de selección Tablas Firmas
    Lectura
    Documento general
    Layout
    Factura
    Recibo
    Documento de identificación
    Tarjeta de presentación
    Plantilla personalizada
    Neuronal personalizado
  • La versión preliminar beta del SDK de Documento de inteligencia incluye las siguientes actualizaciones:


Pasos siguientes