Partilhar via


IA de Documentos (Pré-visualização)

Extraia dados estruturados, incluindo campos nomeados, tabelas, códigos de barras, classificações e resumos de formatos comuns de documentos, documentos digitalizados e fotografias de documentos usando IA. Também suporta escrita à mão e fotografias e digitalizações de baixa qualidade, bem como introdução digital de documentos. Suporta uma vasta gama de linguagens e é capaz de analisar e inferir a estrutura semântica a partir do layout visual dos documentos.

Este conector está disponível nos seguintes produtos e regiões:

Serviço Class Regiões
Estúdio Copiloto Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Aplicações Lógicas Standard Todas as regiões do Logic Apps , exceto as seguintes:
     - Regiões do Azure Government
     - Regiões do Azure China
     - Departamento de Defesa dos EUA (DoD)
Power Apps Premium Todas as regiões do Power Apps , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Power Automate Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Contato
Nome Cloudmersive
URL https://www.cloudmersive.com
Email support@cloudmersive.com
Metadados do conector
Editora Cloudmersive, LLC
Sítio Web https://www.cloudmersive.com
Política de privacidade https://www.cloudmersive.com/privacy-policy
Categorias IA; Conteúdo e Ficheiros

Cloudmersive Document AI Connector

A API Cloudmersive Document AI permite-lhe usar IA de próxima geração para extrair dados, campos, insights e texto de documentos.

Pré-requisitos

Você precisará do seguinte para prosseguir:

  • Um Microsoft Power Apps, Power Automate ou Azure Logic Apps com suporte de conector premium
  • Uma chave de API Cloudmersive

Como obter credenciais

Para usar esse conector, você precisa de uma conta Cloudmersive. Você pode se inscrever com uma conta da Microsoft ou criar uma conta Cloudmersive. Siga as etapas abaixo para obter sua chave de API.

Obtenha a chave da API e o segredo

  • Registe-se para obter uma conta Cloudmersive
  • Clique em Chaves de API

Aqui você pode criar e ver sua(s) chave(s) de API listada(s) na página Chaves de API. Basta copiar e colar esta API Key no Cloudmersive Document AI Connector.

Agora você está pronto para começar a usar o Cloudmersive CDR Connector.

Operações suportadas

O conector suporta as seguintes operações:

  • Enforce Policies to a Document to allow or block it using Advanced AI: Aplicar políticas a um documento para permitir ou bloquear o documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Consome 100 chamadas de API por página.
  • Answer Questions about a Document in a structured way using Advanced AI: Responder a perguntas booleanas (sim/não), de escolha múltipla e de resposta livre sobre o conteúdo de um documento usando IA avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Consome 100 chamadas de API por página.
  • Extract Text from a Document using AI: Extrair texto bruto de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Suporta uma grande variedade de línguas. Consome 100 chamadas de API por página.
  • Extract Field Values from a Document using AI: Extrair Valores de Campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone do Cartão de Visita, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.
  • Extract Field Values from a Document using Advanced AI: Extrair Valores de Campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone do Cartão de Visita, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.
  • Extract Tables of Data from a Document using AI: Extrair Tabelas, compostas por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.
  • Extract Barcodes of from a Document using AI: Extrair todos os códigos de barras de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC e WEBP. Consome 100 chamadas de API por página.
  • Extract All Fields and Tables of Data from a Document using AI: Extrair todos os Campos e Tabelas, compostos por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.
  • Extract Classification or Category from a Document using AI: Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.
  • Extract Classification or Category from a Document using Advanced AI: Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.
  • Extract Summary from a Document using AI: Cria um resumo de 1 parágrafo do documento de entrada usando Inteligência Artificial. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.
  • Extract Text from a Document using AI as a Batch Job: Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Suporta uma grande variedade de línguas. Requer implantação em Instância Gerida ou Cloud Privada.
  • Extract Field Values from a Document using Advanced AI as a Batch Job: Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extraia Valores de Campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone de Cartão de Visita, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.
  • Extract All Fields and Tables of Data from a Document using AI as a Batch Job: Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extraia todos os Campos e Tabelas, compostos por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.
  • Extract Classification or Category from a Document using AI as a Batch Job: Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.
  • Get the status and result of an Extract Document Batch Job: Devolve o resultado do Trabalho Assíncrono - estados possíveis podem ser INICIADOS ou CONCLUÍDOS. Esta API está disponível apenas para implementações de Instância Gerida Cloudmersive e Cloud Privada.

A criar uma ligação

O conector suporta os seguintes tipos de autenticação:

Predefinição Parâmetros para criar conexão. Todas as regiões Não compartilhável

Padrão

Aplicável: Todas as regiões

Parâmetros para criar conexão.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
Apikey securestring O Apikey para esta api Verdade

Limites de Limitação

Nome Chamadas Período de Renovação
Chamadas de API por conexão 100 60 segundos

Ações

Aplicar Políticas a um Documento para permitir ou bloquear o documento usando IA Avançada

Aplicar Políticas a um Documento para permitir ou bloquear o Documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Consome 100 chamadas de API por página.

Extrair Classificação ou Categoria de um Documento usando IA

Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Extrair Classificação ou Categoria de um Documento usando IA Avançada

Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Extrair Classificação ou Categoria de um Documento usando IA como um Batch Job

Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.

Extrair códigos de barras de um documento usando IA

Extrai todos os códigos de barras de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC e WEBP. Consome 100 chamadas de API por página.

Extrair Resumo de um Documento usando IA

Cria um resumo de 1 parágrafo do documento de entrada usando Inteligência Artificial. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Extrair tabelas de dados de um documento usando IA

Extrair Tabelas, compostas por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consume 100 chamadas de API por página.

Extrair Texto de um Documento usando IA

Extrair texto bruto de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Suporta uma grande variedade de línguas. Consome 100 chamadas de API por página.

Extrair Texto de um Documento usando IA como um Batch Job

Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Suporta uma grande variedade de línguas. Requer implantação em Instância Gerida ou Cloud Privada.

Extrair Todos os Campos e Tabelas de Dados de um Documento usando IA

Extraia todos os Campos e Tabelas, compostos por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Extrair todos os campos e tabelas de dados de um documento usando IA como um trabalho em lote

Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extraia todos os Campos e Tabelas, compostos por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.

Extrair Valores de Campo de um Documento usando IA

Extraia valores de campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone do Cartão de Visita, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Extrair Valores de Campo de um Documento usando IA Avançada

Extraia Valores de Campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone de Cartão de Visita, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Extrair Valores de Campo de um Documento usando IA avançada como um trabalho em lote

Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extraia Valores de Campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone de Cartão de Visita, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.

Obtenha o estado e o resultado de um Extrair Trabalho Batch de Documentos

Devolve o resultado do Trabalho Assíncrono – os estados possíveis podem ser INICIADOS ou CONCLUÍDOS. Esta API está disponível apenas para implementações de Instância Gerida Cloudmersive e Cloud Privada.

Responder a perguntas sobre um documento de forma estruturada usando IA avançada

Responder a perguntas booleanas (sim/não), de escolha múltipla e de resposta livre sobre o conteúdo de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Consome 100 chamadas de API por página.

Aplicar Políticas a um Documento para permitir ou bloquear o documento usando IA Avançada

Aplicar Políticas a um Documento para permitir ou bloquear o Documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
InputFile
InputFile byte

Ficheiro de entrada como array de bytes

RuleId
RuleId string
Tipo de regra
RuleType string

Os valores possíveis são ALLOW e NEG

Descrição da Regra
RuleDescription string

Descrição da regra em linguagem natural, por exemplo: Não permitir documentos que contenham linguagem ofensiva

RecognitionMode
RecognitionMode string

Opcional; Modo de reconhecimento - Normal (por defeito) oferece a maior precisão mas velocidade mais lenta, enquanto o Normal proporciona uma resposta mais rápida mas menor precisão para imagens de baixa qualidade

Regressos

Resultado da realização de uma operação de aplicação de políticas documentais

Extrair Classificação ou Categoria de um Documento usando IA

Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Classificação desejada a extrair
Categories string

Classificação desejada a extrair

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da classificação de um documento usando IA

Extrair Classificação ou Categoria de um Documento usando IA Avançada

Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

InputFile
InputFile byte

Ficheiro de documento de entrada para realizar a operação como um array de bytes

Nome da Categoria
CategoryName string

Nome da classificação

CategoriaDescrição
CategoryDescription string

Opcional mas recomendado: Descrição da classificação na língua natural

Pré-processamento
Preprocessing string

Opcional: Defina o nível de pré-processamento da imagem para aumentar a precisão. Os valores possíveis são 'Auto', 'SmoothEdges', 'SmoothEdgesPlus', 'Compatability' e 'Nenhum'. O padrão é Auto. Defina para SmoothEdges para suavizar as bordas duras na imagem de entrada e melhorar a precisão do reconhecimento. Defina para SmoothEdgesPlus para suavizar as arestas mais duras de forma mais elevada. Defina para Compatibilidade para máxima compatibilidade com funcionalidades PDF.

ResultCrossCheck
ResultCrossCheck string

Opcional: Defina o nível de verificação cruzada de precisão da saída para executar na entrada. Os valores possíveis são 'Nenhum', 'Avançado', 'Ultra' e 'Hiper'. O padrão é Nenhum. Ultra e Hyper produzem a maior precisão, mas ao custo de tempos de processamento mais longos.

MaximumPagesProcessed
MaximumPagesProcessed integer

Opcional: Limitar o número de páginas processadas

RotateImageDegrees
RotateImageDegrees double

Opcional: Rodar a imagem de entrada antes do reconhecimento pelo número especificado de graus; valores válidos variam de -360 a +360.

Regressos

Resultado da classificação de um documento usando IA

Extrair Classificação ou Categoria de um Documento usando IA como um Batch Job

Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extrair Classificação ou Categoria (por exemplo, Fatura, Recibo, Formulário Fiscal ou Formulário 1040, Formulário 1040 EZ, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.

Parâmetros

Nome Chave Necessário Tipo Descrição
Classificação desejada a extrair
Categories string

Classificação desejada a extrair

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da realização de um trabalho em lote de documentos divididos

Extrair códigos de barras de um documento usando IA

Extrai todos os códigos de barras de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC e WEBP. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da extração de códigos de barras de um documento

Extrair Resumo de um Documento usando IA

Cria um resumo de 1 parágrafo do documento de entrada usando Inteligência Artificial. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado de resumir um documento

Extrair tabelas de dados de um documento usando IA

Extrair Tabelas, compostas por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consume 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da extração de tabelas de um documento

Extrair Texto de um Documento usando IA

Extrair texto bruto de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Suporta uma grande variedade de línguas. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da extração de texto de um documento

Extrair Texto de um Documento usando IA como um Batch Job

Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Suporta uma grande variedade de línguas. Requer implantação em Instância Gerida ou Cloud Privada.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da realização de um trabalho em lote de documentos divididos

Extrair Todos os Campos e Tabelas de Dados de um Documento usando IA

Extraia todos os Campos e Tabelas, compostos por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Opcional: Defina o nível de pré-processamento da imagem para aumentar a precisão. ...
preprocessing string

Opcional: Defina o nível de pré-processamento da imagem para aumentar a precisão. ...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da extração de campos de um documento

Extrair todos os campos e tabelas de dados de um documento usando IA como um trabalho em lote

Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extraia todos os Campos e Tabelas, compostos por linhas e colunas de dados, de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da realização de um trabalho em lote de documentos divididos

Extrair Valores de Campo de um Documento usando IA

Extraia valores de campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone do Cartão de Visita, etc.) de um documento usando IA. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Campos desejados a extrair, separados por vírgulas
FieldNames string

Campos desejados a extrair, separados por vírgulas

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

Documento de entrada, ou fotos de um documento, para extrair dados de
InputFile file

Documento de entrada, ou fotos de um documento, para extrair dados de

Regressos

Resultado da extração de campos de um documento

Extrair Valores de Campo de um Documento usando IA Avançada

Extraia Valores de Campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone de Cartão de Visita, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG e WEBP. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

InputFile
InputFile byte

Ficheiro de documento de entrada para realizar a operação como um array de bytes

Nome do campo
FieldName string

Nome do campo a extrair

FieldOptional
FieldOptional boolean

Opcional: Verdadeiro se o campo for opcional, falso se necessário (padrão)

Descrição do Campo
FieldDescription string

Opcional mas recomendado: Descrição do campo - use isto para descrever o que é o campo, como está formatado, o que o torna único, etc.

FieldExample
FieldExample string

Opcional: Exemplo de etiqueta ou valor do campo

MaximumPagesProcessed
MaximumPagesProcessed integer

Opcional: Limitar o número de páginas processadas

Pré-processamento
Preprocessing string

Opcional: Defina o nível de pré-processamento da imagem para aumentar a precisão. Os valores possíveis são 'Auto', 'SmoothEdges', 'SmoothEdgesPlus', 'ContrastEdges', 'ContrastEdgesPlus', 'Invert', 'Binarize', 'Compatability' e 'Nenhum'. O padrão é Auto. Defina para SmoothEdges para suavizar as bordas duras na imagem de entrada e melhorar a precisão do reconhecimento. Defina para SmoothEdgesPlus para suavizar as arestas mais duras de forma mais elevada. Defina para ContrastEdges e ContrastEdgesPlus para melhorar o contraste e a legibilidade em imagens a preto e branco ou a cinzento de baixa qualidade. Defina para Inverter para inverter a imagem de entrada. Defina para Binarize para binarizar a imagem de entrada. Defina para Compatibilidade para máxima compatibilidade com funcionalidades PDF.

ResultCrossCheck
ResultCrossCheck string

Opcional: Defina o nível de verificação cruzada de precisão da saída para executar na entrada. Os valores possíveis são 'Nenhum', 'Avançado' e 'Ultra'. O padrão é Nenhum. O Ultra produzirá a maior precisão, mas ao custo de tempos de processamento mais longos.

RotateImageDegrees
RotateImageDegrees double

Opcional: Rodar a imagem de entrada antes do reconhecimento pelo número especificado de graus; valores válidos variam de -360 a +360.

Regressos

Resultado da extração de campos de um documento

Extrair Valores de Campo de um Documento usando IA avançada como um trabalho em lote

Cria um trabalho batch assíncrono para processar um documento grande como um batch job de IA. Extraia Valores de Campo (por exemplo, Número de Fatura, Data da Fatura, Número de Telefone de Cartão de Visita, etc.) de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Requer implantação em Instância Gerida ou Cloud Privada.

Parâmetros

Nome Chave Necessário Tipo Descrição
Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...
recognitionMode string

Opcional; Modo de reconhecimento - Avançado (por defeito) oferece o maior um...

InputFile
InputFile byte

Ficheiro de documento de entrada para realizar a operação como um array de bytes

Nome do campo
FieldName string

Nome do campo a extrair

FieldOptional
FieldOptional boolean

Opcional: Verdadeiro se o campo for opcional, falso se necessário (padrão)

Descrição do Campo
FieldDescription string

Opcional mas recomendado: Descrição do campo - use isto para descrever o que é o campo, como está formatado, o que o torna único, etc.

FieldExample
FieldExample string

Opcional: Exemplo de etiqueta ou valor do campo

MaximumPagesProcessed
MaximumPagesProcessed integer

Opcional: Limitar o número de páginas processadas

Pré-processamento
Preprocessing string

Opcional: Defina o nível de pré-processamento da imagem para aumentar a precisão. Os valores possíveis são 'Auto', 'SmoothEdges', 'SmoothEdgesPlus', 'ContrastEdges', 'ContrastEdgesPlus', 'Invert', 'Binarize', 'Compatability' e 'Nenhum'. O padrão é Auto. Defina para SmoothEdges para suavizar as bordas duras na imagem de entrada e melhorar a precisão do reconhecimento. Defina para SmoothEdgesPlus para suavizar as arestas mais duras de forma mais elevada. Defina para ContrastEdges e ContrastEdgesPlus para melhorar o contraste e a legibilidade em imagens a preto e branco ou a cinzento de baixa qualidade. Defina para Inverter para inverter a imagem de entrada. Defina para Binarize para binarizar a imagem de entrada. Defina para Compatibilidade para máxima compatibilidade com funcionalidades PDF.

ResultCrossCheck
ResultCrossCheck string

Opcional: Defina o nível de verificação cruzada de precisão da saída para executar na entrada. Os valores possíveis são 'Nenhum', 'Avançado' e 'Ultra'. O padrão é Nenhum. O Ultra produzirá a maior precisão, mas ao custo de tempos de processamento mais longos.

RotateImageDegrees
RotateImageDegrees double

Opcional: Rodar a imagem de entrada antes do reconhecimento pelo número especificado de graus; valores válidos variam de -360 a +360.

Regressos

Resultado da realização de um trabalho em lote de documentos divididos

Obtenha o estado e o resultado de um Extrair Trabalho Batch de Documentos

Devolve o resultado do Trabalho Assíncrono – os estados possíveis podem ser INICIADOS ou CONCLUÍDOS. Esta API está disponível apenas para implementações de Instância Gerida Cloudmersive e Cloud Privada.

Parâmetros

Nome Chave Necessário Tipo Descrição
ID de trabalho para o trabalho em lote para obter o estado de
AsyncJobID string

ID de trabalho para o trabalho em lote para obter o estado de

Regressos

Resultado da realização de uma operação de trabalho em lote

Responder a perguntas sobre um documento de forma estruturada usando IA avançada

Responder a perguntas booleanas (sim/não), de escolha múltipla e de resposta livre sobre o conteúdo de um documento usando IA Avançada. Os formatos de documentos de entrada suportados incluem DOCX, PDF, PNG e JPG. Consome 100 chamadas de API por página.

Parâmetros

Nome Chave Necessário Tipo Descrição
InputFile
InputFile byte

Ficheiro de entrada como array de bytes

QuestionId
QuestionId string

ID único da pergunta, por exemplo, 1 ou 2A

PerguntaTexto
QuestionText string

Pergunta em linguagem natural para fazer ao documento cuja resposta é SIM ou NÃO, por exemplo: 'Este documento é assinado e contraassinado por ambas as partes?'

QuestionId
QuestionId string

ID único da pergunta, por exemplo, 1 ou 2A

PerguntaTexto
QuestionText string

Pergunta em linguagem natural a fazer ao documento cuja resposta se resume a uma das escolhas fornecidas, por exemplo, 'Qual é a lei aplicável deste acordo?'

ChoiceId
ChoiceId string

ID único da escolha de resposta, por exemplo, 3C

ChoiceText
ChoiceText string

Texto descritivo desta escolha, por exemplo, 'Delaware'

QuestionId
QuestionId string

ID único da pergunta, por exemplo, 7 ou 5A

PerguntaTexto
QuestionText string

Pergunta em linguagem natural para fazer ao documento cuja resposta se resume a uma resposta livre, por exemplo, 'Quem é a contraparte neste acordo?'

RecognitionMode
RecognitionMode string

Opcional; Modo de reconhecimento - Normal (por defeito) oferece a maior precisão mas velocidade mais lenta, enquanto o Normal proporciona uma resposta mais rápida mas menor precisão para imagens de baixa qualidade

Regressos

Resultado da realização de uma operação de resposta a perguntas de documentos

Definições

DocumentoAvançadoClassificaçãoResultado

Resultado da classificação de um documento usando IA

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

DocumentoCategoriaResultado
DocumentCategoryResult string

Categoria aplicada ao documento; se uma categoria não puder ser identificada, então "outra" será usada. Os espaços são substituídos por sublinhados.

Pontuação de Confiança
ConfidenceScore double

Pontuação de confiança entre 0,0 e 1,0, onde valores > 0,8 indicam alta confiança

DocumentoClassificaçãoResultado

Resultado da classificação de um documento usando IA

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

DocumentoCategoriaResultado
DocumentCategoryResult string

Categoria aplicada ao documento; se uma categoria não puder ser identificada, então "outra" será usada. Os espaços são substituídos por sublinhados.

DocumentPolicyResultado

Resultado da realização de uma operação de aplicação de políticas documentais

Nome Percurso Tipo Descrição
CleanResult
CleanResult boolean

Verdadeiro se o documento cumprir todas as políticas, e falso se não cumprir

Pontuação de Risco
RiskScore double

Pontuação de risco entre 0,0 e 1,0, onde valores acima de 0,5 estão a aumentar os níveis de risco

ViolaçõesRegras
RuleViolations array of PolicyRuleViolation

Violações da política

DocumentarPerguntaRespostaItem

Resposta a uma pergunta de entrada

Nome Percurso Tipo Descrição
QuestionId
QuestionId string

ID da pergunta de entrada

RespostaValor
AnswerValue string

Valor de resposta, formatado como uma cadeia, para esta pergunta. As perguntas booleanas devolvem SIM ou NÃO.

Resposta Racional
AnswerRationale string

Justificação que explica porque esta resposta foi dada

Pontuação de Confiança
ConfidenceScore double

Pontuação de confiança entre 0,0 e 1,0 onde valores acima de 0,8 indicam alta confiança

DocumentarPerguntaRespostasResultado

Resultado da realização de uma operação de resposta a perguntas de documentos

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se a operação foi concluída com sucesso, ou falso caso contrário

Pontuação de Confiança
ConfidenceScore double

Pontuação de confiança entre 0,0 e 1,0 onde valores acima de 0,8 indicam alta confiança

RespostaResultados
AnswerResults array of DocumentQuestionAnswerItem

ExtractBarcodesAiResponse

Resultado da extração de códigos de barras de um documento

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

Resultados do código de barras
BarcodeResults array of ExtractedBarcodeItem

Resultados dos valores da tabela da operação de extração

ExtractDocumentBatchJobResult

Resultado da realização de um trabalho em lote de documentos divididos

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

AsyncJobID
AsyncJobID string

Ao criar um trabalho, é devolvido um ID de Trabalho Assíncrono. Use a API GetAsyncJobStatus para verificar o estado deste trabalho usando o AsyncJobID e obter o resultado quando terminar

ExtractDocumentJobStatusResult

Resultado da realização de uma operação de trabalho em lote

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdade se a operação para verificar o estado do trabalho foi bem-sucedida, falso caso contrário

AsyncJobStatus
AsyncJobStatus string

Devolve o estado do trabalho Assíncrono, se aplicável. Os possíveis estados são INICIADOS e CONCLUÍDOS

AsyncJobID
AsyncJobID string

ID do trabalho

ExtractTextResult
ExtractTextResult ExtractTextResponse

Resultado da extração de texto de um documento

ExtrairCamposETabelasResultado
ExtractFieldsAndTablesResult ExtractFieldsAndTablesResponse

Resultado da extração de campos de um documento

ExtractFieldsResult
ExtractFieldsResult ExtractFieldsResponse

Resultado da extração de campos de um documento

ExtratoClassificaçãoResultado
ExtractClassificationResult DocumentClassificationResult

Resultado da classificação de um documento usando IA

Mensagem de Erro
ErrorMessage string

Mensagem de erro (se existir)

ExtractFieldsAdvancedResponse

Resultado da extração de campos de um documento

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

Results
Results array of FieldAdvancedValue

O valor do campo resulta da operação de extração

Pontuação de Confiança
ConfidenceScore double

Pontuação de confiança entre 0,0 e 1,0, onde valores > 0,8 indicam alta confiança

ExtrairCamposETabelasResposta

Resultado da extração de campos de um documento

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

Resultados de campo
FieldResults array of FieldValue

O valor do campo resulta da operação de extração

Resultados da Tabela
TableResults array of TableResult

Resultados dos valores da tabela da operação de extração

ExtractFieldsResponse

Resultado da extração de campos de um documento

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

Results
Results array of FieldValue

O valor do campo resulta da operação de extração

ExtractTablesResponse

Resultado da extração de tabelas de um documento

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

Resultados da Tabela
TableResults array of TableResult

Resultados dos valores da tabela da operação de extração

ExtractTextResponse

Resultado da extração de texto de um documento

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

PageResultados
PageResults array of ExtractedTextPage

Resultados de página da operação de extração

ItemExtraídoCódigo de Barras

Resultado do código de barras extraído

Nome Percurso Tipo Descrição
BarcodeType
BarcodeType string

Tipo de código de barras identificado, os valores possíveis são: AZTEC, CODABAR, CODE_39, CODE_93, CODE_128, DATA_MATRIX, EAN_8, EAN_13, ITF, MAXICODE, PDF_417, QR_CODE, RSS_14, RSS_EXPANDED, UPC_A, UPC_E, All_1D, UPC_EAN_EXTENSION, MSI, PLESSEY, IMB, DESCONHECIDO

BarcodeValue
BarcodeValue string

Valor do código de barras como uma cadeia

ExtractedTextPage

Página extraída de um documento de entrada

Nome Percurso Tipo Descrição
Número da página
PageNumber integer

Índice de número de página, baseado em 1

TextoResultado
TextResult string

Conteúdo textual da página

FieldAdvancedValue

Resultado do valor do campo da extração de campos de um documento

Nome Percurso Tipo Descrição
Nome do campo
FieldName string

Nome do campo (note que os espaços serão substituídos por sublinhado)

FieldStringValue
FieldStringValue string

Valor de string do campo extraído do documento

Valor do campo

Resultado do valor do campo da extração de campos de um documento

Nome Percurso Tipo Descrição
Nome do campo
FieldName string

Nome do campo (note que os espaços serão substituídos por sublinhado)

FieldStringValue
FieldStringValue string

Valor primário ou da primeira string do campo extraído do documento

ValoresStringaDeCampo Adicional.
AdditionalFieldStringValues array of string

Valores adicionais para este campo quando o mesmo campo está presente com múltiplos valores, por exemplo, se duas instâncias da mesma forma ocorrerem no mesmo documento

PolíticaViolaçãoRegra

Casos de violação das regras da política

Nome Percurso Tipo Descrição
RuleId
RuleId string

Identificação da regra; se não for fornecido ID, o ID é o índice baseado em 1 da regra

Quebra de RegraRiscoPontuação
RuleViolationRiskScore double

Pontuação de risco entre 0,0 e 1,0, onde valores acima de 0,5 estão a aumentar os níveis de risco

Justificativa da Violação da Regra
RuleViolationRationale string

Justificação da linguagem natural da IA para a violação desta política

ResumirDocumentoResposta

Resultado de resumir um documento

Nome Percurso Tipo Descrição
Êxito
Successful boolean

Verdadeiro se bem-sucedido, falso caso contrário

ResumoTexto do Documento
DocumentSummaryText string

Resumo do documento

TableResult

Tabela extraída de um documento

Nome Percurso Tipo Descrição
Title
Title string

Título da tabela (opcional)

Rows
Rows array of TableResultRow

Linhas da tabela

TableResultCell

Célula de uma linha de uma tabela extraída de um documento

Nome Percurso Tipo Descrição
CellHeader
CellHeader string

Cabeçalho da coluna da célula

CellValue
CellValue string

Valor da célula como uma cadeia

TableResultRow

Linha de uma tabela extraída de um documento

Nome Percurso Tipo Descrição
Células
Cells array of TableResultCell

Células na fila