Modelo de tarjeta de presentación de Documento de inteligencia

Artikulua
10/18/2024

Importante

A partir de Documento de inteligencia v4.0 (versión preliminar) y en adelante, el modelo de tarjeta de presentación (prebuilt-businessCard) queda en desuso. Para extraer datos de formatos de tarjeta de presentación, use lo siguiente:

Característica	version	Id. de modelo
Modelo de tarjeta de presentación	• v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA)	`prebuilt-businessCard`

Este contenido se aplica a: v3.1 (GA) | Versiones anteriores: v3.0 v2.1

Este contenido se aplica a: v3.0 (GA) | Últimas versiones: v4.0 (versión preliminar) v3.1 | Versión anterior: v2.1

[!INCLUDE [se aplica a v2.1]../(includes/applies-to-v21.md)]

El modelo de tarjeta de presentación de Documento de inteligencia combina funcionalidades de reconocimiento óptico de caracteres (OCR) eficaces con modelos de aprendizaje profundo para analizar y extraer datos de imágenes de tarjetas de presentación. La API analiza tarjetas de presentación impresas; extrae información clave, como el nombre, el apellido, el nombre de la empresa, la dirección de correo electrónico y el número de teléfono; y devuelve una representación de datos JSON estructurada.

Extracción de datos de tarjetas de visita

Las tarjetas de presentación son una excelente manera de representar un negocio o profesional. El logotipo de la empresa, las fuentes y las imágenes de fondo que hay en las tarjetas de presentación ayudan a la personalización de la marca de la empresa y permiten diferenciarla de las demás. La aplicación de técnicas basadas en OCR y aprendizaje automático para automatizar el examen de tarjetas de visita es un caso común de procesamiento de imágenes. Los sistemas empresariales que usan los equipos de ventas y marketing suelen tener la capacidad de extracción de datos de tarjetas de presentación integrada en ellos en beneficio de sus usuarios.

Tarjeta de presentación de ejemplo procesada con Studio de Documento de inteligencia

Ejemplo de negocio procesado con la herramienta de etiquetado de muestra de Documento de inteligencia

Captura de pantalla de una tarjeta de presentación de ejemplo analizada con la herramienta de etiquetado de ejemplo de Documento de inteligencia.

Opciones de desarrollo

Documento de inteligencia v3.1:2023-07-31 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de tarjeta de presentación	• Estudio de Documento de inteligencia • API REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript	prebuilt-businessCard

Documento de inteligencia v3.0:2022-08-31 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de tarjeta de presentación	• Estudio de Documento de inteligencia • API REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript	prebuilt-businessCard

Documento de inteligencia v2.1 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos
Modelo de tarjeta de presentación	• Herramienta de etiquetado de Documento de inteligencia • API REST • SDK de biblioteca cliente • Contenedor Docker de Documento de inteligencia

Prueba de la extracción de datos de tarjetas de visita

Vea cómo se extraen los datos de las tarjetas de presentación, incluidos el nombre, el puesto de trabajo, la dirección, el correo electrónico y el nombre de la empresa. Tendrá que supervisar los recursos siguientes:

Una suscripción a Azure: puede crear una cuenta gratuita
Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de ubicación de las claves y el punto de conexión en Azure Portal.

Estudio del documento de inteligencia

Nota:

Studio de Documento de inteligencia está disponible con las API v3.1 y v3.0.

En la página principal de Studio de Documento de inteligencia, seleccione Tarjetas de presentación.
Puede analizar la tarjeta de presentación de muestra o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :

Probar Studio de Documento de inteligencia

Herramienta de etiquetado de ejemplo de Documento de inteligencia

Vaya a Herramienta de ejemplo de Documento de inteligencia.
En la página principal de la herramienta de ejemplo, seleccione el icono Use prebuilt model to get data (Usar un modelo precompilado para obtener datos).
Seleccione el Tipo de formulario que quiere analizar en el menú desplegable.
Elija una dirección URL para el archivo que quiere analizar entre las opciones siguientes:
En el campo Origen, seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar.
En el campo Punto de conexión de Documento de inteligencia, pegue el punto de conexión que obtuvo con la suscripción de Documento de inteligencia.
En el campo Clave, pegue la clave que obtuvo del recurso de Documento de inteligencia.
Seleccione Run analysis (Ejecutar análisis). La herramienta de etiquetado de ejemplo de Documento de inteligencia llama a la API Analyze Prebuilt y analiza el documento.
Vea los resultados: consulte los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.

Nota

La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio de Documento de inteligencia.

Requisitos de entrada

Formatos de archivos admitidos:

Modelo	PDF	Imagen: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Leer	✔	✔	✔
Layout	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
Documento general	✔	✔
Creada previamente	✔	✔
Extracción personalizada	✔	✔
Clasificación personalizada	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview)

Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.
Para PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratis, solo se procesan las dos primeras páginas).
El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de 4 MB para el nivel gratuito (F0).
Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.
La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a 8 puntos de texto a 150 puntos por pulgada (PPP).
Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.
- Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 GB para el modelo neuronal.
- Para el entrenamiento del modelo de clasificación personalizada, el tamaño total de los datos de entrenamiento es de 1 GB con un máximo de 10 000 páginas. Para 2024-07-31-preview y versiones posteriores, el tamaño total de los datos de entrenamiento se 2 GB con un máximo de 10 000 páginas.

Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
En el caso de PDF y TIFF, se procesan 2000 páginas como máximo. En el caso de los suscriptores del nivel Gratis, solo se procesan las dos primeras páginas.
El tamaño de archivo debe ser inferior a 50 MB; y sus dimensiones, de al menos 50x50 píxeles y, como máximo, de 10 000x10 000 píxeles.

Idiomas y configuraciones regionales compatibles

Para obtener una lista completa de los idiomas admitidos, consulte nuestra página compatibilidad con lenguajes de modelos precompilados.

Extracciones de campos

Para ver los campos de extracción de documentos admitidos, consulte la página Esquema del modelo de tarjeta de presentación en nuestro repositorio de ejemplo de GitHub.

Campos extraídos

Nombre	Escribir	Descripción	Texto
ContactNames	matriz de objetos	Nombre de contacto extraído de la tarjeta de presentación	[{ "FirstName": "John"`,` "LastName": "Doe" }]
FirstName	string	Nombre (de nacimiento) del contacto	"John"
LastName	string	Apellidos del contacto	"Doe"
CompanyNames	Matriz de cadenas	Nombre de la empresa extraído de la tarjeta de presentación	["Contoso"]
Departments	Matriz de cadenas	Departamento u organización del contacto	["R&D"]
JobTitles	Matriz de cadenas	Puesto mostrado del contacto	["Software Engineer"]
Correos electrónicos	Matriz de cadenas	Dirección de correo electrónico de contacto extraída de la tarjeta de presentación	["johndoe@contoso.com"]
Websites	Matriz de cadenas	Sitio web extraído de la tarjeta de presentación	["https://www.contoso.com"]
Direcciones	Matriz de cadenas	Dirección extraída de la tarjeta de presentación	["123 Main Street, Redmond, Washington 98052"]
MobilePhones	matriz de números de teléfono	Número de teléfono móvil extraído de la tarjeta de presentación	["+19876543210"]
Faxes	matriz de números de teléfono	Número de fax extraído de la tarjeta de presentación	["+19876543211"]
WorkPhones	matriz de números de teléfono	Número de teléfono en el trabajo extraído de la tarjeta de presentación	["+19876543231"]
OtherPhones	matriz de números de teléfono	Otros números de teléfono extraídos de la tarjeta de presentación	["+19876543233"]

Configuraciones regionales admitidas

Las tarjetas de visita creadas previamente v2.1 admiten las siguientes configuraciones regionales:

es-es
en-au
en-ca
en-gb
en-in

Guía de migración y API de REST v3.1

Siga la Guía de migración de Document Intelligence v3.1 para obtener información sobre cómo usar la versión v3.0 en las aplicaciones y flujos de trabajo.

Pasos siguientes

Pruebe procesar sus propios formularios y documentos con Studio de Documento de inteligencia
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.

Pruebe procesar sus propios formularios y documentos con la herramienta de etiquetado de ejemplo de Documento de inteligencia
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.

Partekatu honen bidez: