Inteligencia artificial de documentos (versión preliminar)
Extraiga datos estructurados, incluidos campos con nombre, tablas, códigos de barras, clasificaciones y resúmenes de formatos de documento comunes, documentos escaneados y fotos de documentos mediante ia. También admite la escritura a mano y las fotos y exámenes de baja calidad, así como la entrada de documentos digitales. Admite una amplia gama de lenguajes y es capaz de analizar e inferir la estructura semántica desde el diseño visual de los documentos.
Este conector está disponible en los siguientes productos y regiones:
| Service | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Aplicaciones lógicas | Estándar | Todas las regiones de Logic Apps excepto las siguientes: - Regiones de Azure Government - Regiones de Azure China - Departamento de Defensa de EE. UU. (DoD) |
| Power Apps | Premium | Todas las regiones de Power Apps excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Power Automate | Premium | Todas las regiones de Power Automate excepto las siguientes: - Gobierno de EE. UU. (GCC) - Gobierno de EE. UU. (GCC High) - China Cloud operado por 21Vianet - Departamento de Defensa de EE. UU. (DoD) |
| Contacto | |
|---|---|
| Nombre | Cloudmersive |
| URL | https://www.cloudmersive.com |
| Correo Electrónico | support@cloudmersive.com |
| Metadatos del conector | |
|---|---|
| Publicador | Cloudmersive, LLC |
| Sitio web | https://www.cloudmersive.com |
| Directiva de privacidad | https://www.cloudmersive.com/privacy-policy |
| Categorías | IA; Contenido y archivos |
Conector de IA de documento de cloudmersive
Cloudmersive Document AI API permite usar inteligencia artificial de última generación para extraer datos, campos, información y texto de documentos.
Prerrequisitos
Necesitará lo siguiente para continuar:
- Una instancia de Microsoft Power Apps, Power Automate o Azure Logic Apps con compatibilidad con conector premium
- Una clave de API de Cloudmersive
Obtención de credenciales
Para usar este conector, necesita una cuenta de Cloudmersive. Puede registrarse con una cuenta Microsoft o crear una cuenta de Cloudmersive. Siga los pasos que se indican a continuación para obtener la clave de API.
Obtención de la clave de API y el secreto
- Registro para una cuenta de Cloudmersive
- Haga clic en Claves de API.
Aquí puede crear y ver las claves de API que aparecen en la página Claves de API. Solo tiene que copiar y pegar esta clave de API en cloudmersive Document AI Connector.
Ahora está listo para empezar a usar cloudmersive CDR Connector.
Operaciones admitidas
El conector admite las siguientes operaciones:
-
Enforce Policies to a Document to allow or block it using Advanced AI: aplique directivas a un documento para permitirlo o bloquearlo mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Consume 100 llamadas API por página. -
Answer Questions about a Document in a structured way using Advanced AI: responda a preguntas booleanas (sí/no), preguntas de múltiples opciones y respuesta libre sobre el contenido de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Consume 100 llamadas API por página. -
Extract Text from a Document using AI: extraiga texto sin formato de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Admite una amplia gama de idiomas. Consume 100 llamadas API por página. -
Extract Field Values from a Document using AI: extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. -
Extract Field Values from a Document using Advanced AI: extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. -
Extract Tables of Data from a Document using AI: extraiga tablas, formadas por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. -
Extract Barcodes of from a Document using AI: extraiga todos los códigos de barras de un documento mediante IA. Entre los formatos de documento de entrada admitidos se incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC y WEBP. Consume 100 llamadas API por página. -
Extract All Fields and Tables of Data from a Document using AI: extraiga todos los campos y tablas, formados por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. -
Extract Classification or Category from a Document using AI: extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. -
Extract Classification or Category from a Document using Advanced AI: extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. -
Extract Summary from a Document using AI: crea un resumen de 1 párrafo del documento de entrada mediante inteligencia artificial. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. -
Extract Text from a Document using AI as a Batch Job: crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Admite una amplia gama de idiomas. Requiere una instancia administrada o una implementación de nube privada. -
Extract Field Values from a Document using Advanced AI as a Batch Job: crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada. -
Extract All Fields and Tables of Data from a Document using AI as a Batch Job: crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga todos los campos y tablas, formados por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada. -
Extract Classification or Category from a Document using AI as a Batch Job: crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada. -
Get the status and result of an Extract Document Batch Job: devuelve el resultado del trabajo asincrónico: los estados posibles pueden ser STARTED o COMPLETED. Esta API solo está disponible para las implementaciones de instancia administrada de cloudmersive y de nube privada.
Creación de una conexión
El conector admite los siguientes tipos de autenticación:
| Predeterminado | Parámetros para crear una conexión. | Todas las regiones | No se puede compartir |
Predeterminado
Aplicable: Todas las regiones
Parámetros para crear una conexión.
Esta conexión no se puede compartir. Si la aplicación de energía se comparte con otro usuario, se pedirá a otro usuario que cree explícitamente una nueva conexión.
| Nombre | Tipo | Description | Obligatorio |
|---|---|---|---|
| Apikey | securestring | Apikey para esta API | Cierto |
Limitaciones
| Nombre | Llamadas | Período de renovación |
|---|---|---|
| Llamadas API por conexión | 100 | 60 segundos |
Acciones
| Aplicar directivas a un documento para permitirlo o bloquearlo mediante inteligencia artificial avanzada |
Aplicar directivas a un documento para permitirlo o bloquearlo mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Consume 100 llamadas API por página. |
| Extracción de clasificación o categoría de un documento mediante AI como trabajo por lotes |
Crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada. |
| Extracción de clasificación o categoría de un documento mediante IA |
Extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. |
| Extracción de clasificación o categoría de un documento mediante inteligencia artificial avanzada |
Extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. |
| Extracción de códigos de barras de un documento mediante IA |
Extraiga todos los códigos de barras de un documento mediante IA. Entre los formatos de documento de entrada admitidos se incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC y WEBP. Consume 100 llamadas API por página. |
| Extracción de resumen de un documento mediante IA |
Crea un resumen de 1 párrafo del documento de entrada mediante inteligencia artificial. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. |
| Extracción de tablas de datos de un documento mediante IA |
Extraiga tablas, formadas por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. |
| Extracción de texto de un documento mediante AI como trabajo por lotes |
Crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Admite una amplia gama de idiomas. Requiere una instancia administrada o una implementación de nube privada. |
| Extracción de texto de un documento mediante IA |
Extraiga texto sin procesar de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Admite una amplia gama de idiomas. Consume 100 llamadas API por página. |
| Extracción de todos los campos y tablas de datos de un documento mediante IA |
Extraiga todos los campos y tablas, formados por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. |
| Extracción de todos los campos y tablas de datos de un documento mediante IA como trabajo por lotes |
Crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga todos los campos y tablas, formados por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada. |
| Extracción de valores de campo de un documento mediante AI |
Extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. |
| Extracción de valores de campo de un documento mediante inteligencia artificial avanzada |
Extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página. |
| Extracción de valores de campo de un documento mediante inteligencia artificial avanzada como trabajo por lotes |
Crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada. |
| Obtener el estado y el resultado de un trabajo de extracción de lotes de documentos |
Devuelve el resultado del trabajo asincrónico: los estados posibles pueden ser STARTED o COMPLETED. Esta API solo está disponible para las implementaciones de instancia administrada de cloudmersive y de nube privada. |
| Responder a preguntas sobre un documento de forma estructurada mediante inteligencia artificial avanzada |
Responda a preguntas booleanas (sí/no), varias opciones y preguntas de respuesta libre sobre el contenido de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Consume 100 llamadas API por página. |
Aplicar directivas a un documento para permitirlo o bloquearlo mediante inteligencia artificial avanzada
Aplicar directivas a un documento para permitirlo o bloquearlo mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
InputFile
|
InputFile | byte |
Archivo de entrada como una matriz de bytes |
|
|
RuleId
|
RuleId | string | ||
|
TipoDeRegla
|
RuleType | string |
Los valores posibles son ALLOW y DENY |
|
|
RuleDescription
|
RuleDescription | string |
Descripción de la regla en lenguaje natural, por ejemplo, No permitir documentos que contengan lenguaje ofensivo |
|
|
RecognitionMode
|
RecognitionMode | string |
Opcional; Modo de reconocimiento: normal (valor predeterminado) proporciona la mayor precisión pero velocidad más lenta, mientras que Normal proporciona una respuesta más rápida, pero una menor precisión para imágenes de baja calidad |
Devoluciones
Resultado de realizar una operación de aplicación de directivas de documento
- Body
- DocumentPolicyResult
Extracción de clasificación o categoría de un documento mediante AI como trabajo por lotes
Crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Clasificación deseada para extraer
|
Categories | string |
Clasificación deseada para extraer |
|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de realizar un trabajo por lotes de documentos divididos
Extracción de clasificación o categoría de un documento mediante IA
Extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Clasificación deseada para extraer
|
Categories | string |
Clasificación deseada para extraer |
|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de la clasificación de un documento mediante ia
Extracción de clasificación o categoría de un documento mediante inteligencia artificial avanzada
Extraiga clasificación o categoría (por ejemplo, factura, recibo, formulario fiscal o formulario 1040, formulario 1040 EZ, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
InputFile
|
InputFile | byte |
Archivo de documento de entrada para realizar la operación en como una matriz de bytes |
|
|
nombreDeCategoría
|
CategoryName | string |
Nombre de la clasificación |
|
|
CategoryDescription
|
CategoryDescription | string |
Opcional, pero recomendado: descripción de la clasificación en langugage natural |
|
|
Preprocessing
|
Preprocessing | string |
Opcional: establezca el nivel de preprocesamiento de imagen para mejorar la precisión. Los valores posibles son "Auto", "SmoothEdges", "SmoothEdgesPlus", "Compatability" y "None". El valor predeterminado es Automático. Establézcalo en SmoothEdges para suavizar los bordes ásperos de la imagen de entrada para mejorar la precisión del reconocimiento. Establézcalo en SmoothEdgesPlus para suavizar los bordes ásperos en un grado superior. Establézcalo en Compatibilidad para la compatibilidad máxima de características de PDF. |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
Opcional: establezca el nivel de comprobación cruzada de precisión de salida que se va a realizar en la entrada. Los valores posibles son "None", "Advanced", "Ultra" y "Hyper". El valor predeterminado es Ninguno. Ultra e Hyper producirán la mayor precisión, pero a costa de tiempos de procesamiento más largos. |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
Opcional: Limitar el número de páginas procesadas |
|
|
RotateImageDegrees
|
RotateImageDegrees | double |
Opcional: Gire la imagen de entrada antes del reconocimiento por el número de grados especificado; los valores válidos van de -360 a +360. |
Devoluciones
Resultado de la clasificación de un documento mediante ia
Extracción de códigos de barras de un documento mediante IA
Extraiga todos los códigos de barras de un documento mediante IA. Entre los formatos de documento de entrada admitidos se incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC y WEBP. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de extraer códigos de barras de un documento
Extracción de resumen de un documento mediante IA
Crea un resumen de 1 párrafo del documento de entrada mediante inteligencia artificial. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de resumir un documento
Extracción de tablas de datos de un documento mediante IA
Extraiga tablas, formadas por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de la extracción de tablas de un documento
Extracción de texto de un documento mediante AI como trabajo por lotes
Crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Admite una amplia gama de idiomas. Requiere una instancia administrada o una implementación de nube privada.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de realizar un trabajo por lotes de documentos divididos
Extracción de texto de un documento mediante IA
Extraiga texto sin procesar de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Admite una amplia gama de idiomas. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de extraer texto de un documento
- Body
- ExtractTextResponse
Extracción de todos los campos y tablas de datos de un documento mediante IA
Extraiga todos los campos y tablas, formados por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Opcional: establezca el nivel de preprocesamiento de imagen para mejorar la precisión. ...
|
preprocessing | string |
Opcional: establezca el nivel de preprocesamiento de imagen para mejorar la precisión. ... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de la extracción de campos de un documento
Extracción de todos los campos y tablas de datos de un documento mediante IA como trabajo por lotes
Crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga todos los campos y tablas, formados por filas y columnas de datos, de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de realizar un trabajo por lotes de documentos divididos
Extracción de valores de campo de un documento mediante AI
Extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante IA. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Campos deseados para extraer, separados por comas
|
FieldNames | string |
Campos deseados para extraer, separados por comas |
|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
Documento de entrada, o fotos de un documento, para extraer datos de
|
InputFile | file |
Documento de entrada, o fotos de un documento, para extraer datos de |
Devoluciones
Resultado de la extracción de campos de un documento
Extracción de valores de campo de un documento mediante inteligencia artificial avanzada
Extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG y WEBP. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
InputFile
|
InputFile | byte |
Archivo de documento de entrada para realizar la operación en como una matriz de bytes |
|
|
Nombre del Campo
|
FieldName | string |
Nombre del campo que se va a extraer |
|
|
FieldOptional
|
FieldOptional | boolean |
Opcional: True si el campo es opcional, false si es necesario (valor predeterminado) |
|
|
FieldDescription
|
FieldDescription | string |
Opcional, pero recomendado: Descripción del campo : úselo para describir cuál es el campo, cómo tiene formato, qué es único sobre él, etc. |
|
|
FieldExample
|
FieldExample | string |
Opcional: Etiqueta o valor de ejemplo del campo |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
Opcional: Limitar el número de páginas procesadas |
|
|
Preprocessing
|
Preprocessing | string |
Opcional: establezca el nivel de preprocesamiento de imagen para mejorar la precisión. Los valores posibles son "Auto", "SmoothEdges", "SmoothEdgesPlus", "ContrastEdges", "ContrastEdgesPlus", "Invert", "Binarize", "Compatability" y "None". El valor predeterminado es Automático. Establézcalo en SmoothEdges para suavizar los bordes ásperos de la imagen de entrada para mejorar la precisión del reconocimiento. Establézcalo en SmoothEdgesPlus para suavizar los bordes ásperos en un grado superior. Establézcalo en ContrastEdges y ContrastEdgesPlus para mejorar el contraste y la legibilidad de las imágenes en blanco y negro o en gris de baja calidad. Establezca en Invertir para invertir la imagen de entrada. Establezca en Binarize para binarize la imagen de entrada. Establézcalo en Compatibilidad para la compatibilidad máxima de características de PDF. |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
Opcional: establezca el nivel de comprobación cruzada de precisión de salida que se va a realizar en la entrada. Los valores posibles son "None", "Advanced" y "Ultra". El valor predeterminado es Ninguno. Ultra producirá la mayor precisión, pero a costa de tiempos de procesamiento más largos. |
|
|
RotateImageDegrees
|
RotateImageDegrees | double |
Opcional: Gire la imagen de entrada antes del reconocimiento por el número de grados especificado; los valores válidos van de -360 a +360. |
Devoluciones
Resultado de la extracción de campos de un documento
Extracción de valores de campo de un documento mediante inteligencia artificial avanzada como trabajo por lotes
Crea un trabajo por lotes asincrónico para procesar un documento grande como un trabajo por lotes de IA. Extraiga valores de campo (por ejemplo, número de factura, fecha de factura, número de teléfono de tarjeta de presentación, etc.) de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Requiere una instancia administrada o una implementación de nube privada.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a...
|
recognitionMode | string |
Opcional; Modo de reconocimiento: avanzado (valor predeterminado) proporciona el más alto a... |
|
|
InputFile
|
InputFile | byte |
Archivo de documento de entrada para realizar la operación en como una matriz de bytes |
|
|
Nombre del Campo
|
FieldName | string |
Nombre del campo que se va a extraer |
|
|
FieldOptional
|
FieldOptional | boolean |
Opcional: True si el campo es opcional, false si es necesario (valor predeterminado) |
|
|
FieldDescription
|
FieldDescription | string |
Opcional, pero recomendado: Descripción del campo : úselo para describir cuál es el campo, cómo tiene formato, qué es único sobre él, etc. |
|
|
FieldExample
|
FieldExample | string |
Opcional: Etiqueta o valor de ejemplo del campo |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
Opcional: Limitar el número de páginas procesadas |
|
|
Preprocessing
|
Preprocessing | string |
Opcional: establezca el nivel de preprocesamiento de imagen para mejorar la precisión. Los valores posibles son "Auto", "SmoothEdges", "SmoothEdgesPlus", "ContrastEdges", "ContrastEdgesPlus", "Invert", "Binarize", "Compatability" y "None". El valor predeterminado es Automático. Establézcalo en SmoothEdges para suavizar los bordes ásperos de la imagen de entrada para mejorar la precisión del reconocimiento. Establézcalo en SmoothEdgesPlus para suavizar los bordes ásperos en un grado superior. Establézcalo en ContrastEdges y ContrastEdgesPlus para mejorar el contraste y la legibilidad de las imágenes en blanco y negro o en gris de baja calidad. Establezca en Invertir para invertir la imagen de entrada. Establezca en Binarize para binarize la imagen de entrada. Establézcalo en Compatibilidad para la compatibilidad máxima de características de PDF. |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
Opcional: establezca el nivel de comprobación cruzada de precisión de salida que se va a realizar en la entrada. Los valores posibles son "None", "Advanced" y "Ultra". El valor predeterminado es Ninguno. Ultra producirá la mayor precisión, pero a costa de tiempos de procesamiento más largos. |
|
|
RotateImageDegrees
|
RotateImageDegrees | double |
Opcional: Gire la imagen de entrada antes del reconocimiento por el número de grados especificado; los valores válidos van de -360 a +360. |
Devoluciones
Resultado de realizar un trabajo por lotes de documentos divididos
Obtener el estado y el resultado de un trabajo de extracción de lotes de documentos
Devuelve el resultado del trabajo asincrónico: los estados posibles pueden ser STARTED o COMPLETED. Esta API solo está disponible para las implementaciones de instancia administrada de cloudmersive y de nube privada.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
Identificador de trabajo del trabajo por lotes para obtener el estado de
|
AsyncJobID | string |
Identificador de trabajo del trabajo por lotes para obtener el estado de |
Devoluciones
Resultado de realizar una operación de trabajo por lotes
Responder a preguntas sobre un documento de forma estructurada mediante inteligencia artificial avanzada
Responda a preguntas booleanas (sí/no), varias opciones y preguntas de respuesta libre sobre el contenido de un documento mediante inteligencia artificial avanzada. Los formatos de documento de entrada admitidos incluyen DOCX, PDF, PNG y JPG. Consume 100 llamadas API por página.
Parámetros
| Nombre | Clave | Requerido | Tipo | Description |
|---|---|---|---|---|
|
InputFile
|
InputFile | byte |
Archivo de entrada como una matriz de bytes |
|
|
QuestionId
|
QuestionId | string |
Identificador único de la pregunta, por ejemplo, 1 o 2A |
|
|
QuestionText
|
QuestionText | string |
Pregunta en lenguaje natural para preguntar al documento dónde se resuelve la respuesta a SÍ o NO, por ejemplo, "¿Este documento está firmado y contrafirmado por ambas partes?". |
|
|
QuestionId
|
QuestionId | string |
Identificador único de la pregunta, por ejemplo, 1 o 2A |
|
|
QuestionText
|
QuestionText | string |
Pregunta en lenguaje natural para formular el documento dónde se resuelve la respuesta a una de las opciones de un número fijo de opciones proporcionadas, por ejemplo, "¿Cuál es la legislación aplicable de este acuerdo?". |
|
|
ChoiceId
|
ChoiceId | string |
Identificador único de la opción de respuesta, por ejemplo, 3C |
|
|
ChoiceText
|
ChoiceText | string |
Texto de descripción de esta elección, por ejemplo, "Delaware" |
|
|
QuestionId
|
QuestionId | string |
Identificador único de la pregunta, por ejemplo, 7 o 5A |
|
|
QuestionText
|
QuestionText | string |
Pregunta en lenguaje natural para preguntar al documento dónde se resuelve la respuesta a una respuesta libre, por ejemplo, "¿Quién es el homólogo de este acuerdo?". |
|
|
RecognitionMode
|
RecognitionMode | string |
Opcional; Modo de reconocimiento: normal (valor predeterminado) proporciona la mayor precisión pero velocidad más lenta, mientras que Normal proporciona una respuesta más rápida, pero una menor precisión para imágenes de baja calidad |
Devoluciones
Resultado de realizar una operación de respuesta a preguntas de documento
Definiciones
DocumentAdvancedClassificationResult
Resultado de la clasificación de un documento mediante ia
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
DocumentCategoryResult
|
DocumentCategoryResult | string |
Categoría aplicada al documento; si no se pudo identificar una categoría, se usará "other". Los espacios se reemplazan por caracteres de subrayado. |
|
Puntuación de Confianza
|
ConfidenceScore | double |
Puntuación de confianza entre 0,0 y 1,0, donde los valores > 0,8 indican una confianza alta |
DocumentClassificationResult
Resultado de la clasificación de un documento mediante ia
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
DocumentCategoryResult
|
DocumentCategoryResult | string |
Categoría aplicada al documento; si no se pudo identificar una categoría, se usará "other". Los espacios se reemplazan por caracteres de subrayado. |
DocumentPolicyResult
Resultado de realizar una operación de aplicación de directivas de documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
CleanResult
|
CleanResult | boolean |
True si el documento cumple todas las directivas y false si no lo hace |
|
RiskScore
|
RiskScore | double |
Puntuación de riesgo entre 0,0 y 1,0 donde los valores superiores a 0,5 están aumentando los niveles de riesgo |
|
RuleViolations
|
RuleViolations | array of PolicyRuleViolation |
Infracciones de directivas |
DocumentQuestionAnswerItem
Respuesta a una pregunta de entrada
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
QuestionId
|
QuestionId | string |
Identificador de la pregunta de entrada |
|
AnswerValue
|
AnswerValue | string |
Valor de respuesta de respuesta, con formato de cadena, para esta pregunta. Las preguntas booleanas devolverán SÍ o NO. |
|
AnswerRationale
|
AnswerRationale | string |
Justificación de por qué se dio esta respuesta |
|
Puntuación de Confianza
|
ConfidenceScore | double |
Puntuación de confianza entre 0,0 y 1,0, donde los valores superiores a 0,8 indican una confianza alta |
DocumentQuestionAnswersResult
Resultado de realizar una operación de respuesta a preguntas de documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si la operación se completó correctamente o false en caso contrario. |
|
Puntuación de Confianza
|
ConfidenceScore | double |
Puntuación de confianza entre 0,0 y 1,0, donde los valores superiores a 0,8 indican una confianza alta |
|
AnswerResults
|
AnswerResults | array of DocumentQuestionAnswerItem |
ExtractBarcodesAiResponse
Resultado de extraer códigos de barras de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
BarcodeResults
|
BarcodeResults | array of ExtractedBarcodeItem |
Resultados del valor de tabla de la operación de extracción |
ExtractDocumentBatchJobResult
Resultado de realizar un trabajo por lotes de documentos divididos
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
AsyncJobID
|
AsyncJobID | string |
Al crear un trabajo, se devuelve un identificador de trabajo asincrónico. Use la API GetAsyncJobStatus para comprobar el estado de este trabajo mediante AsyncJobID y obtener el resultado cuando termine. |
ExtractDocumentJobStatusResult
Resultado de realizar una operación de trabajo por lotes
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si la operación para comprobar el estado del trabajo se realizó correctamente; de lo contrario, false |
|
AsyncJobStatus
|
AsyncJobStatus | string |
Devuelve el estado del trabajo asincrónico, si procede. Los estados posibles son STARTED y COMPLETED |
|
AsyncJobID
|
AsyncJobID | string |
Id. del trabajo |
|
ExtractTextResult
|
ExtractTextResult | ExtractTextResponse |
Resultado de extraer texto de un documento |
|
ExtractFieldsAndTablesResult
|
ExtractFieldsAndTablesResult | ExtractFieldsAndTablesResponse |
Resultado de la extracción de campos de un documento |
|
ExtractFieldsResult
|
ExtractFieldsResult | ExtractFieldsResponse |
Resultado de la extracción de campos de un documento |
|
ExtractClassificationResult
|
ExtractClassificationResult | DocumentClassificationResult |
Resultado de la clasificación de un documento mediante ia |
|
Mensaje de error
|
ErrorMessage | string |
Mensaje de error (si existe) |
ExtractFieldsAdvancedResponse
Resultado de la extracción de campos de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
Results
|
Results | array of FieldAdvancedValue |
Resultados del valor de campo de la operación de extracción |
|
Puntuación de Confianza
|
ConfidenceScore | double |
Puntuación de confianza entre 0,0 y 1,0, donde los valores > 0,8 indican una confianza alta |
ExtractFieldsAndTablesResponse
Resultado de la extracción de campos de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
FieldResults
|
FieldResults | array of FieldValue |
Resultados del valor de campo de la operación de extracción |
|
TableResults
|
TableResults | array of TableResult |
Resultados del valor de tabla de la operación de extracción |
ExtractFieldsResponse
Resultado de la extracción de campos de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
Results
|
Results | array of FieldValue |
Resultados del valor de campo de la operación de extracción |
ExtractTablesResponse
Resultado de la extracción de tablas de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
TableResults
|
TableResults | array of TableResult |
Resultados del valor de tabla de la operación de extracción |
ExtractTextResponse
Resultado de extraer texto de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
PageResults
|
PageResults | array of ExtractedTextPage |
Resultados de la página de la operación de extracción |
ExtractedBarcodeItem
Resultado de código de barras extraído
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
BarcodeType
|
BarcodeType | string |
El tipo de código de barras identificado, los valores posibles son: UNKNOWN, CODABAR, CODE_39, CODE_93, CODE_128, DATA_MATRIX, EAN_8, EAN_13, ITF, MAXICODE, PDF_417, QR_CODE, RSS_14, RSS_EXPANDED, UPC_A, UPC_E, All_1D, UPC_EAN_EXTENSION, MSI, PLESSEY, IMB, UNKNOWN |
|
BarcodeValue
|
BarcodeValue | string |
Valor del código de barras como una cadena |
ExtractedTextPage
Página extraída de un documento de entrada
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
PageNumber
|
PageNumber | integer |
Índice de número de página, basado en 1 |
|
TextResult
|
TextResult | string |
Contenido de texto de la página |
FieldAdvancedValue
Resultado del valor de campo de extracción de campos de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Nombre del Campo
|
FieldName | string |
Nombre del campo (tenga en cuenta que los espacios se reemplazarán por carácter de subrayado) |
|
FieldStringValue
|
FieldStringValue | string |
Valor de cadena del campo que se extrajo del documento |
FieldValue
Resultado del valor de campo de extracción de campos de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Nombre del Campo
|
FieldName | string |
Nombre del campo (tenga en cuenta que los espacios se reemplazarán por carácter de subrayado) |
|
FieldStringValue
|
FieldStringValue | string |
Valor principal o de primera cadena del campo que se extrajo del documento |
|
AdditionalFieldStringValues
|
AdditionalFieldStringValues | array of string |
Valores adicionales para este campo cuando el mismo campo está presente con varios valores, por ejemplo, si dos instancias del mismo formulario se producen en el mismo documento |
PolicyRuleViolation
Instancias de una infracción de regla de directiva
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
RuleId
|
RuleId | string |
Id. de la regla; si no se proporcionó ningún identificador, el identificador es el índice basado en 1 de la regla. |
|
RuleViolationRiskScore
|
RuleViolationRiskScore | double |
Puntuación de riesgo entre 0,0 y 1,0 donde los valores superiores a 0,5 están aumentando los niveles de riesgo |
|
RuleViolationRationale
|
RuleViolationRationale | string |
Justificación del lenguaje natural de ia por qué se infringió esta directiva |
SummarizeDocumentResponse
Resultado de resumir un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Correcto
|
Successful | boolean |
True si se ejecuta correctamente; en caso contrario, false |
|
DocumentSummaryText
|
DocumentSummaryText | string |
Resumen del documento |
TableResult
Tabla extraída de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Title
|
Title | string |
Título de la tabla (opcional) |
|
Rows
|
Rows | array of TableResultRow |
Filas de la tabla |
TableResultCell
Celda de una fila de una tabla extraída de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
CellHeader
|
CellHeader | string |
Encabezado de columna de celda |
|
CellValue
|
CellValue | string |
Valor de celda como una cadena |
TableResultRow
Fila de una tabla extraída de un documento
| Nombre | Ruta de acceso | Tipo | Description |
|---|---|---|---|
|
Células
|
Cells | array of TableResultCell |
Celdas de la fila |