Novedades de Documento de inteligencia de Azure AI
Este contenido se aplica a: v4.0 (versión preliminar) v3.1 (GA) v3.0 (GA) v2.1 (GA)
El servicio Documento de inteligencia se actualiza de forma continua. Marque esta página para mantenerse al día con las notas de la versión, las mejoras de características y la documentación más reciente.
Importante
Las versiones preliminares de la API se retiran una vez publicada la API de disponibilidad general. La versión 2023-02-28-preview de la API se va a retirar. Si sigue usando la API de la versión preliminar o las versiones del SDK asociadas, actualice el código de forma que indique la última versión de la API, 2023-07-31 (GA).
Agosto de 2024
La API de REST de Documento de inteligencia 2024-07-31-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:
La versión preliminar pública 2024-07-31-preview solo está disponible actualmente en las siguientes regiones de Azure. El nuevo modelo de extracción de campos de documentos en AI Studio solo está disponible en la región Centro-norte de EE. UU.:
Este de EE. UU.
Oeste de EE. UU. 2
Oeste de Europa
Centro-Norte de EE. UU
🆕 Modelo de extracción de campos de documentos (generativo personalizado)
- Use IA generativa para extraer campos de documentos y formularios. Documento de inteligencia ofrece ahora un nuevo modelo de extracción de campos de documentos que utiliza modelos de lenguaje de gran tamaño (LLM) para extraer campos de documentos no estructurados o formularios estructurados con una amplia variedad de plantillas visuales. Con valores fundamentados y puntuaciones de confianza, la nueva extracción basada en IA generativa se adapta a sus procesos actuales.
🆕 Composición de modelos con clasificadores personalizados
- Inteligencia de documentos ahora agrega compatibilidad con la redacción del modelo con un modelo de clasificación personalizado explícito. Obtenga más información sobre las ventajas de usar la nueva capacidad de redacción.
Modelos de clasificación personalizados
- El modelo de clasificación personalizada ahora también admite la actualización del modelo en contexto.
- El modelo de clasificación personalizada agrega compatibilidad con la operación de copia de modelos para habilitar la copia de seguridad y la recuperación ante desastres.
- El modelo de clasificación personalizada ahora admite la especificación explícita de páginas que se van a clasificar desde un documento de entrada.
🆕 Modelo de documentos de hipotecas
- Extraer información de la evaluación (formulario 1004).
- Extraer información de validación de empleo (formulario 1005).
-
- Extraiga la información pertinente de los cheques del receptor, la cantidad, la fecha y otros datos pertinentes.
-
- Nueva versión para procesar recibos de pago para extraer salarios, horas, deducciones, pago neto y mucho más.
-
- Nueva versión para extraer información de la cuenta, incluidos los saldos iniciales y finales, los detalles de la transacción de los extractos bancarios.
-
- Nuevo modelo fiscal unificado de Estados Unidos que puede extraer de formularios como W-2, 1098, 1099 y 1040.
🆕 PDF que se puede buscar. El modelo de lectura precompilado es ahora compatible con salida de PDF para descargar PDF con texto insertado a partir de los resultados de la extracción, lo que permite usar PDF en escenarios como la copia de búsqueda de contenidos.
El modelo de diseño ahora admite una detección de ilustración mejorada en la que ahora se pueden descargar ilustraciones de documentos como un archivo de imagen que se va a usar para comprender aún más la ilustración. El modelo de diseño también presenta mejoras en el modelo de OCR para texto digitalizado cuyo objetivo son las mejoras para caracteres únicos, texto en recuadros y documentos de texto denso.
-
- Documento de inteligencia ahora agrega soporte para la operación de análisis por lotes para permitir el análisis de un conjunto de documentos para simplificar la experiencia del desarrollador y mejorar la eficiencia.
Funcionalidades de complementos
- La calidad de extracción de la inteligencia artificial de los campos de consulta se ha mejorado con el modelo más reciente.
Mayo de 2024
Document Intelligence Studio agrega compatibilidad con la autenticación de Microsoft Entra (anteriormente Azure Active Directory). Para obtener más información, consulte Información general de Document Intelligence Studio.
Febrero de 2024
La API de REST de Documento de inteligencia 2024-07-31-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:
La versión preliminar pública 2024-07-31-preview solo está disponible actualmente en las siguientes regiones de Azure:
- Este de EE. UU.
- Oeste de EE. UU. 2
- Oeste de Europa
El modelo de diseño ahora admite la detección de imágenes y el análisis jerárquico de la estructura de documentos (secciones y subsecciones). También se ha mejorado la calidad de inteligencia artificial del orden de lectura y la detección de roles lógicos.
Modelos de extracción personalizados
- Los modelos de extracción personalizados ahora admiten puntuaciones de confianza de celda, fila y nivel de tabla. Obtenga más información sobre la confianza de tabla, fila y celda.
- Los modelos de extracción personalizados cuentan con mejoras de calidad de la IA para la extracción de campos.
- El modelo de extracción de plantillas personalizado admite ahora la extracción de campos superpuestos. Obtenga más información sobre los campos superpuestos y cómo se usan.
Modelos de clasificación personalizados
- El modelo de clasificación personalizada ahora admite el entrenamiento incremental para escenarios en los que necesita actualizar el modelo clasificador con ejemplos o clases agregados. Obtenga más información sobre el entrenamiento incremental.
- El modelo de clasificación personalizado agrega compatibilidad con ciertos tipos de documentos de Office (.docx, .pptx y .xls). Obtenga más información sobre la compatibilidad ampliada con tipos de documento.
-
- Compatibilidad con nuevas configuraciones regionales:
Configuración regional Código Árabe ( ar
)Búlgaro ( bg
)Griego ( el
)Hebreo ( he
)Macedonio ( mk
)Ruso ( ru
)Serbio cirílico ( sr-cyrl
)Ucraniano ( uk
)Tailandés ( th
)Turco ( tr
)Vietnamita ( vi
)- Compatibilidad con nuevos códigos de moneda:
Moneda Configuración regional Código BAM
Marco convertible de Bosnia ( ba
)BGN
Lev búlgaro ( bg
)ILS
Nuevo séquel israelí ( il
)MKD
Denar de Macedonia ( mk
)RUB
Rublo ruso ( ru
)THB
Baht tailandés ( th
)TRY
Lira turca ( tr
)UAH
Grivna de Ucrania ( ua
)VND
Dong vietnamita ( vn
)- Los elementos fiscales admiten la expansión de Alemania (
de
), España (es
), Portugal (pt
), Inglés Canadáen-CA
.
-
- Compatibilidad de campo ampliada para los documentos de identificación y el permiso de conducir de la Unión Europea.
-
- Extraiga información de solicitud uniforme de préstamo residencial (formulario 1003).
- Extraiga información de la suscripción uniforme y el resumen de transmisión o el formulario 1008.
- Extraiga información de la divulgación de cierre de hipoteca.
🆕 Modelo de tarjeta de crédito o débito
- Extraiga información de las tarjetas bancarias.
-
- Nuevo elemento precompilado para extraer información de los certificados de matrimonio.
Diciembre de 2023
Las bibliotecas cliente de Document Intelligence que tienen como destino la API REST 2023-10-31-preview ya están disponibles para su uso.
Noviembre de 2023
La API REST de Documento de inteligencia 2023-10-31-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:
Actualmente, la versión preliminar pública 2023-10-31-preview solo está disponible en las siguientes regiones de Azure:
- Este de EE. UU.
- Oeste de EE. UU. 2
- Oeste de Europa
-
- Ampliación de idiomas para la escritura a mano: ruso (
ru
), árabe (ar
), tailandés (th
). - Cumplimiento de la Orden Ejecutiva Cibernética (EO).
- Ampliación de idiomas para la escritura a mano: ruso (
-
- Compatibilidad con archivos de Office y HTML.
- Compatibilidad con la salida de Markdown.
- Mejoras en la extracción de tablas, el orden de lectura y la detección de encabezados de sección.
- A partir de Documento de inteligencia 2023-10-31-preview, el modelo de documento general (prebuilt-document) queda en desuso. En el futuro, para extraer pares clave-valor de los documentos, use el modelo
prebuilt-layout
con el parámetro opcional de cadena de consultafeatures=keyValuePairs
habilitado.
-
- Ahora se extrae la moneda de todos los campos relacionados con el precio.
Modelo de tarjeta de seguro médico
- Compatibilidad de nuevos campos para la información de Medicare y Medicaid.
Modelos de documentos fiscales de EE. UU.
- Nuevo modelo fiscal 1099. Admite el formulario 1099 y las variaciones siguientes: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
- Compatibilidad con el campo
KVK
. - Compatibilidad con el campo
BPAY
. - Numerosos refinamientos de campo.
- Compatibilidad con el campo
-
- Compatibilidad con documentos de varios idiomas.
- Nuevas opciones de división de páginas: división automática, división siempre por página, sin división.
Funcionalidades de complementos
- Los campos de consulta están disponibles con la versión
2023-10-31-preview
. - Las funcionalidades de complementos están disponibles en todos los modelos, excepto el modelo de lectura.
- Los campos de consulta están disponibles con la versión
Nota:
Con la versión de disponibilidad general (GA) de la API 2022-08-31, las API de versión preliminar asociadas están en desuso. Si usa las versiones preliminares de la API 2021-09-30, 2022-01-30 o 2022-06-30, actualice las aplicaciones para que tengan como destino la versión de la API 2022-08-31. Para obtener más información sobre algunos cambios menores relacionados, consulte la guía de migración.
Julio de 2023
Nota:
Form Recognizer ahora es Documento de inteligencia de Azure AI.
- Los servicios de Azure AI de documentación engloban todo lo que antes se conocía como Cognitive Services y Azure Applied AI Services.
- No hay ningún cambio en los precios.
- Los nombres Cognitive Services y Azure Applied AI siguen utilizándose en las API de facturación, análisis de costes, listas de precios y precios de Azure.
- No hay cambios importantes en las interfaces de programación de aplicaciones (API) ni en las bibliotecas de cliente.
- Algunas plataformas siguen esperando la actualización de cambio de nombre. Todas las menciones de Form Recognizer o Documento de inteligencia en nuestra documentación se refieren al mismo servicio de Azure.
Documento de inteligencia v3.1 (GA)
La API de Documento de inteligencia versión 3.1 ya está disponible con carácter general (GA). La versión de la API se corresponde con 2023-07-31
.
La API v3.1 presenta funcionalidades nuevas y actualizadas:
- Las API de Inteligencia de documentos ahora son más modulares y admiten características opcionales. Ahora puede personalizar la salida para incluir específicamente las características que necesita. Más información sobre los parámetros opcionales.
- API de clasificación de documentos para dividir un único archivo en documentos individuales. Más información sobre la clasificación de documentos.
- Modelo de contrato precompilado.
- Modelo precompilado del formulario de impuestos estadounidenses 1098.
- Compatibilidad con tipos de archivo de Office con Read API.
- Reconocimiento de códigos de barras en documentos.
- Funcionalidad del complemento de reconocimiento de fórmulas.
- Funcionalidad del complemento de reconocimiento de fuentes.
- Compatibilidad con documentos de alta resolución.
- Ahora los modelos neuronales personalizados necesiten un único ejemplo etiquetado para el entrenamiento.
- Expansión del lenguaje de modelos neuronales personalizados. Entrenamiento de un modelo neuronal para documentos en 30 idiomas. Consulte la compatibilidad con idiomas para obtener la lista completa de los idiomas admitidos.
- 🆕 Modelo precompilado de tarjeta de seguro médico.
- Expansión precompilada de la configuración regional del modelo de factura.
- Expansión precompilada de la configuración regional y lenguaje de modelo de recibo con más de 100 idiomas admitidos.
- El modelo de identificador precompilado ahora admite identificadores europeos.
Actualizaciones de la experiencia del usuario de Document Intelligence Studio
✔️ Opciones de análisis
Document Intelligence ahora admite funcionalidades de análisis más sofisticadas y Studio permite un punto de entrada (botón Opciones de análisis) para configurar las funcionalidades del complemento con facilidad.
Según el escenario de extracción de documentos, configure el intervalo de análisis, el intervalo de páginas del documento, la detección opcional y las características de detección premium.
Nota:
La extracción de fuentes no se visualiza en Document Intelligence Studio. Sin embargo, puede comprobar la sección de estilos de la salida JSON para los resultados de detección de fuentes.
✔️ Etiquetado automático de documentos con modelos precompilados o uno de sus propios modelos
En la página de etiquetado de modelos de extracción personalizados, ahora puede etiquetar automáticamente los documentos con uno de los modelos precompilados del servicio Documento de inteligencia o con modelos que haya entrenado antes.
Para algunos documentos, puede haber etiquetas duplicadas después de ejecutar la etiqueta automática. Asegúrese de modificar las etiquetas para que no haya etiquetas duplicadas en la página de etiquetado después.
✔️ Tablas de etiquetado automático
En la página de etiquetado del modelo de extracción personalizada, ahora puede etiquetar automáticamente las tablas del documento sin tener que etiquetar las tablas manualmente.
✔️ Agregar archivos de prueba directamente al conjunto de datos de entrenamiento
Una vez que haya entrenado un modelo de extracción personalizado, use la página de prueba para mejorar la calidad del modelo cargando documentos de prueba en el conjunto de datos de entrenamiento si es necesario.
Si se devuelve una puntuación de confianza baja para algunas etiquetas, asegúrese de que las etiquetas son correctas. Si no es así, agréguelos al conjunto de datos de entrenamiento y vuelva a etiquetarlos para mejorar la calidad del modelo.
✔️ Usar las opciones y filtros de la lista de documentos en proyectos personalizados
Use la página de etiquetado del modelo de extracción personalizado. Ahora puede navegar por los documentos de entrenamiento con facilidad mediante la búsqueda, el filtro y la ordenación por característica.
Utilice la vista de cuadrícula para obtener una vista previa de los documentos o use la vista de lista para desplazarse por los documentos más fácilmente.
✔️ Uso compartido de proyectos
- Comparta proyectos de extracción personalizados con facilidad. Para obtener más información, vea Uso compartido de proyectos con modelos personalizados.
Mayo de 2023
Introducción a la documentación actualizada para Build 2023
🆕 La información general de Documento de inteligencia tiene navegación mejorada, puntos de acceso estructurados e imágenes enriquecidas.
🆕 Elegir un modelo de Documento de inteligencia proporciona instrucciones para elegir la mejor solución de Documento de inteligencia para los proyectos y flujos de trabajo.
abril de 2023
Anuncio de la versión preliminar pública de la biblioteca cliente de Documento de inteligencia más reciente
La versión 2023-02-28-preview de la API de REST de Document Intelligence admite las bibliotecas cliente de la versión preliminar pública. Esta versión incluye las siguientes características y funcionalidades nuevas disponibles para .NET/C# (4.1.0-beta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1) y Bibliotecas cliente de Python (3.3.0b.1):
Para obtener más información, consulte SDK de Document Intelligence (versión preliminar pública) y de marzo de 2023 notas
Marzo de 2023
Importante
Actualmente, 2023-02-28-preview
capacidades solo están disponibles en las siguientes regiones:
- Oeste de Europa
- Oeste de EE. UU. 2
- Este de EE. UU.
- El modelo de clasificación personalizado es una nueva funcionalidad dentro de Documento de inteligencia que comienza con la API
2023-02-28-preview
. - Las funcionalidades de los campos de consulta, agregadas al modelo de documento general, usan modelos de Azure OpenAI para extraer campos específicos de los documentos. Pruebe la característica Documentos generales con campos de consulta mediante Document Intelligence Studio. Actualmente, los campos de consulta solo están activos para los recursos de la región
East US
. - Funcionalidades de complementos:
- Extracción de fuentes ahora se reconoce con la API
2023-02-28-preview
. - Extracción de fórmulas ahora se reconoce con la API
2023-02-28-preview
. - Extracción de alta resolución ahora se reconoce con la API
2023-02-28-preview
.
- Extracción de fuentes ahora se reconoce con la API
- Actualizaciones de los modelos de extracción personalizados:
- Los modelos neuronales personalizados ahora admiten idiomas agregados para el entrenamiento y el análisis. Entrene modelos neuronales para neerlandés, francés, alemán, italiano y español.
- El modelo de plantilla personalizado ahora tiene una capacidad de detección de firmas mejorada.
- Actualizaciones de Document Intelligence Studio:
- Además de la compatibilidad con todas las características nuevas, como la clasificación y los campos de consulta, Studio ahora habilita el uso compartido de proyectos de modelos personalizados.
- Adiciones de nuevos modelos en versión preliminar cerrada: tarjetas de vacunación, contratos, impuesto 1098 de EE. UU., impuesto 1098-E de EE. UU. e impuesto 1098-T de EE. UU. Para solicitar acceso a modelos de versión preliminar validados, complete y envíe el formulario de solicitud de versión preliminar privada de Documento de inteligencia.
- Actualizaciones del modelo de recibo:
- El modelo de recibo agrega compatibilidad con los recibos térmicos.
- El modelo de recibo ahora es compatible con 18 idiomas y tres idiomas regionales (inglés, francés y portugués).
- El modelo de recibo ahora admite la extracción de
TaxDetails
.
- El modelo de diseño ahora mejora el reconocimiento de tablas.
- El modelo de lectura ahora incluye mejoras para el reconocimiento de caracteres de un solo dígito.
Febrero de 2023
Hay determinados contenedores de Documento de inteligencia para v3.0 que ya están disponibles para su uso.
Actualmente, los contenedores de Read v3.0 y Layout v3.0 están disponibles.
Para obtener más información, consulte Instalación y ejecución de contenedores de Document Intelligence.
Enero de 2023
Modelo de recibo precompilado: se admiten idiomas agregados. El modelo de recibo ahora admite estos idiomas y configuraciones regionales agregados:
- Japonés, Japón (ja-JP)
- Francés, Canadá (fr-CA)
- Holandés, Países Bajos (nl-NL)
- Inglés, Emiratos Árabes Unidos (en-AE)
- Portugués, Brasil (pt-br)
Modelo de factura precompilado: se admiten idiomas agregados. El modelo de factura ahora admite estos idiomas y configuraciones regionales agregados:
- Inglés: Estados Unidos (en-US), Australia (en-AU), Canadá (en-CA), Reino Unido (en-UK), India (en-IN)
- Español: España (es-ES)
- Francés: Francia (fr-FR)
- Italiano: Italia (it-IT)
- Portugués: Portugal (pt-PT)
- Holandés, Países Bajos (nl-NL)
Modelo de factura precompilado: se reconocen campos agregados. El modelo de factura ahora reconoce estos campos agregados:
- Código de moneda
- Opciones de pago
- Descuento total
- Elementos fiscales (solo en-IN)
Modelo de identificación precompilado: se admiten tipos de documento agregados. El modelo de identificación ahora admite estos tipos de documento agregados:
- Identificación militar de EE. UU.
Sugerencia
Todas las actualizaciones de enero de 2023 están disponibles con la versión API de REST 2022-08-31 (disponibilidad general).
Modelo precompilado de recibos (compatibilidad con idiomas adicionales):
El modelo de recibo precompilado agrega compatibilidad con los siguientes idiomas:
- Inglés, Emiratos Árabes Unidos (en-AE)
- Holandés, Países Bajos (nl-NL)
- Francés, Canadá (fr-CA)
- Alemán: (de-DE)
- Italiano: (it-IT)
- Japonés, Japón (ja-JP)
- Portugués, Brasil (pt-br)
Modelo precompilado de factura (compatibilidad con idiomas adicional y extracciones de campo)
El modelo de factura precompilado agrega compatibilidad con los siguientes idiomas:
- Inglés: Australia (en-AU), Canadá (en-CA), Reino Unido (en-UK), India (en-IN)
- Portugués, Brasil (pt-br)
El modelo de factura precompilado ahora admite las siguientes extracciones de campos:
- Código de moneda
- Opciones de pago
- Descuento total
- Elementos fiscales (solo en-IN)
Modelo precompilado de documento de id. (compatibilidad con tipos de documentos adicional)
El modelo de documento de identificación precompilado ahora agrega compatibilidad con los siguientes tipos de documentos:
- Expansión de licencias de conducir que respalda la India, Canadá, Reino Unido y Australia
- Documentos y tarjetas de identificación militares estadounidenses
- Documentos y tarjetas de identificación de la India (PAN y Aadhaar)
- Tarjetas de identificación y documentos de Australia (tarjeta de foto, id. Key-pass)
- Tarjetas de identificación y documentos de Canadá (tarjeta de identificación, tarjeta Maple)
- Tarjetas de identificación y documentos del Reino Unido (tarjeta de identidad nacional/regional)
Diciembre de 2022
Actualizaciones de Document Intelligence Studio
En la versión de diciembre de Document Intelligence Studio se incluyen las actualizaciones más recientes de Document Intelligence Studio. Hay importantes mejoras en la experiencia del usuario, principalmente con compatibilidad con el etiquetado de modelos personalizado.
Intervalo de páginas Ahora Studio admite el análisis de páginas especificadas desde un documento.
Etiquetado de modelos personalizados:
Ejecución de la API de diseño automáticamente. Puede optar por ejecutar la API de diseño para todos los documentos automáticamente en el almacenamiento de blobs durante el proceso de configuración del modelo personalizado.
Búsqueda. Studio ahora incluye la funcionalidad de búsqueda para buscar palabras dentro de un documento. Esta mejora permite una navegación más sencilla mientras se etiqueta.
Navegación Puede seleccionar etiquetas para dirigirse a palabras etiquetadas dentro de un documento.
Etiquetado automático de tablas Después de seleccionar el icono de tabla dentro de un documento, puedes optar por etiquetar automáticamente la tabla extraída en la vista de etiquetado.
Subtipos de etiqueta y subtipos de segundo nivel Studio admite ahora subtipos para columnas de tabla, filas de tabla y subtipos de segundo nivel para tipos como fechas y números.
La creación de modelos neuronales personalizados ahora se admite en la región US Gov Virginia.
Las versiones preliminares de la API
2022-01-30-preview
y2021-09-30-preview
se retirarán el 31 de enero de 2023. Actualice a la versión de la API2022-08-31
para evitar cualquier interrupción del servicio.
Noviembre de 2022
- Anuncio de la versión estable más reciente de las bibliotecas de Documento de inteligencia de Azure AI
- Esta versión incluye cambios y actualizaciones importantes para las bibliotecas cliente de .NET, Java, JavaScript y Python. Para obtener más información, consulte DevBlog del SDK de Azure.
- Las mejoras más significativas consisten en la introducción de dos nuevos clientes,
DocumentAnalysisClient
yDocumentModelAdministrationClient
.
Octubre de 2022
Contenido con versiones de Documento de inteligencia
La documentación de Documento de inteligencia se ha actualizado para presentar una experiencia con versiones. Ahora, puede elegir ver el contenido orientado a la experiencia de
v3.0 GA
o a la experiencia dev2.1 GA
. La experiencia v3.0 es la predeterminada.
Código de ejemplo de Document Intelligence Studio
- El código de ejemplo para la experiencia de etiquetado de Document Intelligence Studio ya está disponible en GitHub. Los clientes pueden desarrollar e integrar Documento de inteligencia en su propia experiencia del usuario, o bien crearla mediante el código de ejemplo de Document Intelligence Studio.
Expansión de idioma
- Con la versión preliminar más reciente, los modelos de plantillas de lectura (OCR), diseño y personalización de Documento de inteligencia admiten 134 nuevos idiomas. Estas adiciones lingüísticas incluyen griego, letón, serbio, tailandés, ucraniano y vietnamita, junto con varios idiomas latinos y cirílicos. Ahora Documento de inteligencia admite un total de 299 idiomas en las versiones de disponibilidad general más recientes y nuevas versiones preliminares. Consulte la página de idiomas admitidos para ver todos los idiomas admitidos.
- Use el parámetro
api-version=2022-06-30-preview
de la API de REST al usar la API o el SDK correspondiente para admitir los nuevos lenguajes de las aplicaciones.
Nuevo modelo de contrato precompilado
- Nuevo modelo precompilado que extrae información de contratos, como entidades, título, id. de contrato, fecha de ejecución y mucho más. el modelo de contratos está actualmente en versión preliminar y solicita acceso aquí.
Expansión de regiones para entrenar modelos neuronales personalizados
- Ahora el entrenamiento de modelos neuronales personalizados es compatible con regiones agregadas.
- Este de EE. UU.
- Este de EE. UU. 2
- US Gov: Arizona
- Ahora el entrenamiento de modelos neuronales personalizados es compatible con regiones agregadas.
Septiembre de 2022
Nota:
A partir de la versión 4.0.0, se ha introducido un nuevo conjunto de clientes para aprovechar las características más recientes del servicio Documento de inteligencia.
La versión de disponibilidad general de la versión 4.0.0 del SDK incluye las siguientes actualizaciones:
- Versión 4.0.0 GA (2022-09-08)
- Compatibilidad con clientes de REST API v3.0 y v2.0
La expansión de regiones para entrenar modelos neuronales personalizados ahora se admite en seis nuevas regiones
- Este de Australia
- Centro de EE. UU.
- Este de Asia
- Centro de Francia
- Sur de Reino Unido 2
- Oeste de EE. UU. 2
Para ver una lista completa de las regiones en que se admite el entrenamiento, consulte modelos neuronales personalizados.
Versión
4.0.0 GA
del SDK de Documento de inteligencia:- Bibliotecas de cliente de Document Intelligence versión 4.0.0 (.NET/C#, Java, JavaScript) y la versión 3.2.0 (Python) están disponibles con carácter general y listos para su uso en aplicaciones de producción.
- Para obtener más información sobre las bibliotecas cliente de Document Intelligence, consulte la introducción a SDK.
- Actualice las aplicaciones mediante la guía de migración del lenguaje de programación.
Agosto de 2022
La versión preliminar beta del SDK de Documento de inteligencia de agosto de 2022 incluye las siguientes actualizaciones:
Versión 4.0.0-beta.5 (2022-08-09)
Documento de inteligencia v3.0 está disponible con carácter general
- La API REST de Documento de inteligencia v3.0 ya está disponible con carácter general y lista para su uso en aplicaciones de producción. Actualice las aplicaciones con la API REST versión 2022-08-31.
Actualizaciones de Document Intelligence Studio
- Pasos siguientes. En cada página de modelo, Studio ahora tiene una sección de pasos siguientes. Los usuarios pueden hacer referencia rápidamente al código de ejemplo, a las directrices de solución de problemas y a la información de precios.
- Modelos personalizados. Studio ahora incluye la capacidad de reordenar etiquetas en proyectos de modelos personalizados para mejorar la eficacia del etiquetado.
- Copia de modelos Los modelos personalizados se pueden copiar entre los servicios de Documento de inteligencia desde Studio. Esta operación permite la promoción de un modelo entrenado a otros entornos y regiones.
- Eliminar documentos. Studio ahora admite la eliminación de documentos del conjunto de datos etiquetado dentro de proyectos personalizados.
Actualizaciones del servicio Documento de inteligencia
- prebuilt-read. El modelo de lectura OCR ahora también está disponible en Documento de inteligencia con detección de idioma y párrafos como dos nuevas características. La lectura de Documento de inteligencia está orientada a escenarios de documentos avanzados que se alinean con las funcionalidades de inteligencia documental más amplias de Documento de inteligencia.
- prebuilt-layout. El modelo de diseño extrae párrafos e identifica si el texto extraído es un párrafo, título, encabezado de sección, nota al pie de página, encabezad de página o número de página.
- prebuilt-invoice. Los campos TotalVAT y Line/VAT se resolverán ahora en los campos existentes TotalTax y Line/Tax respectivamente.
- prebuilt-idDocument. Compatibilidad con la extracción de datos para el identificador de estado de EE. UU., la seguridad social y las tarjetas verdes. Soporte para la información de visado de pasaporte.
- prebuilt-receipt. Compatibilidad ampliada con configuración regional para francés (fr-FR), español (es-ES), portugués (pt-PT), italiano (it-IT) y alemán (de-DE).
- prebuilt-businessCard. Soporte de análisis de direcciones para extraer subcampos para componentes de direcciones, como la dirección, ciudad, estado, país/región y el código postal.
Mejoras de calidad de la IA
- prebuilt-read. Compatibilidad mejorada con caracteres individuales, fechas manuscritas, cantidades, nombres y otros datos clave que se encuentran habitualmente en recibos y facturas y un procesamiento mejorado de documentos PDF digitales.
- prebuilt-layout. Compatibilidad con una mejor detección de tablas recortadas, tablas sin bordes y reconocimiento mejorado de celdas de expansión larga.
- prebuilt-document. Valor mejorado y detección de casillas.
- custom-neural. Precisión mejorada para la detección y extracción de tablas.
Junio de 2022
- La versión preliminar beta del SDK de Documento de inteligencia de junio de 2022 incluye las siguientes actualizaciones:
Versión 4.0.0-beta.4 (2022-06-08)
Document Intelligence Studio La versión de junio es la actualización más reciente de Document Intelligence Studio. Hay considerables mejoras de experiencia de usuario y accesibilidad abordadas en esta actualización:
- Ejemplo de código para Javascript y C# La pestaña Código de Studio ahora agrega ejemplos de código de JavaScript y C# además del existente de Python.
- Nueva interfaz de usuario de carga de documentos. Studio ahora admite la carga de un documento con el método de arrastrar y colocar en la nueva interfaz de usuario de carga.
- Nueva característica para proyectos personalizados. Los proyectos personalizados ahora admiten la creación de cuentas de almacenamiento y blobs al configurar el proyecto. Además, el proyecto personalizado ahora admite la carga de archivos de entrenamiento directamente en Studio y la copia del modelo personalizado existente.
La versión 2022-06-30-preview de Documento de inteligencia v3.0 presenta amplias actualizaciones en las API de características:
- Diseño amplía la extracción de estructuras. Ahora Diseño incluye elementos de estructura agregados, como secciones, encabezados de sección y párrafos. Esta actualización permite escenarios de segmentación de documentos más precisos. Para obtener una lista completa de los elementos de estructura identificados, consulte estructura mejorada.
- Compatibilidad con campos tabulares del modelo neuronal personalizado. Ahora los modelos de documentos personalizados admiten campos tabulares. De forma predeterminada, los campos tabulares también son de varias páginas. Para obtener más información acerca de los campos tabulares en modelos neuronales personalizados, consulte campos tabulares.
- Los campos tabulares del modelo de plantilla personalizados admiten tablas entre páginas. Ahora los modelos de formulario personalizados admiten campos tabulares entre páginas. Para obtener más información acerca de los campos tabulares en modelos de plantilla personalizados, consulte campos tabulares.
- La salida del modelo de factura ahora incluye pares clave-valor de documento generales. Cuando las facturas contienen campos obligatorios más allá de los incluidos en el modelo precompilado, el modelo de documento general complementa la salida con pares clave-valor. Consulte pares de valores de clave.
- Expansión del idioma de las facturas. El modelo de factura incluye compatibilidad con idiomas expandidos. Consulte idiomas admitidos.
- La tarjeta de presentación precompilada ahora incluye compatibilidad con el idioma japonés. Consulte idiomas admitidos.
- Modelo de documento de identificador precompilado. Ahora el modelo de documento de identificador extrae valores DateOfIssue, Height, Weight, EyeColor, HairColor y DocumentDiscriminator de los permisos de conducir de EE. UU. Consulte extracción de campos.
- El modelo de lectura ahora admite tipos de documentos comunes de Microsoft Office. Ahora se admiten tipos de documento como Word (docx), Excel (xlsx) y PowerPoint (pptx) con Read API. Consulte Extraer datos de lectura.
Febrero de 2022
Version 4.0.0-beta.3 (2022-02-10)
La versión preliminar de Document Intelligence v3.0 presenta varias características, funcionalidades y mejoras nuevas:
- El modelo neuronal personalizado o el modelo de documento personalizado es un nuevo modelo personalizado para extraer texto y marcas de selección de formularios estructurados, documentos semiestructurados y no estructurados.
- El modelo precompilado W-2 es un nuevo modelo precompilado para extraer campos de formularios W-2 para escenarios de informes fiscales y comprobación de ingresos.
- Lectura La API extrae líneas de texto impresas, palabras, ubicaciones de texto, idiomas detectados y texto manuscrito, si se detecta.
- El modelo entrenado previamente para documentos generales ahora se actualiza para admitir marcas de selección, además de texto de API, tablas, estructura, y pares clave-valor de formularios y documentos.
- API de factura El modelo precompilado de factura amplía la compatibilidad con las facturas en español.
- Document Intelligence Studio agrega nuevas demostraciones para lectura, W2, ejemplos de recibos de hotel y compatibilidad con el entrenamiento de los nuevos modelos neuronales personalizados.
- Expansión de lenguaje Los formularios de lectura, diseño y personalización de Documento de inteligencia agregan compatibilidad con 42 nuevos idiomas, incluidos el árabe, el hindi y otros idiomas que usan scripts de árabe y devanagari para expandir la cobertura a 164 idiomas. La compatibilidad con idiomas manuscritos se expande a japonés y coreano.
Introducción a la nueva API de versión preliminar v3.0.
Extracción de datos del modelo de Inteligencia de documentos:
Modelo Extracción de texto Pares clave-valor Marcas de selección Tablas Firmas Lectura ✓ Documento general ✓ ✓ ✓ ✓ Layout ✓ ✓ ✓ Factura ✓ ✓ ✓ ✓ Recibo ✓ ✓ ✓ Documento de identificación ✓ ✓ Tarjeta de presentación ✓ ✓ Plantilla personalizada ✓ ✓ ✓ ✓ ✓ Neuronal personalizado ✓ ✓ ✓ ✓ La versión preliminar beta del SDK de Documento de inteligencia incluye las siguientes actualizaciones:
Modelos y modos de documentos personalizados:
- Plantilla personalizada (anteriormente formulario personalizado).
- Neuronal personalizado.
- Modelo personalizado: modo de compilación.
Modelo precompilado W-2 (prebuilt-tax.us.w2).
Modelo precompilado de lectura (prebuilt-read).
Modelo precompilado de factura (español) (prebuilt-invoice).
Pasos siguientes
Pruebe a procesar sus propios formularios y documentos con Document Intelligence Studio.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.
Pruebe a procesar sus propios formularios y documentos con la Herramienta de etiquetado de muestras de Documento de inteligencia.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.