OCR - Reconhecimento Ótico de Caracteres

Aviso

Não recomendamos o uso deste serviço, incluindo a Azure Vision na antiga API OCR v3.2 do Foundry Tools e a API RecognizeText v2.1.

Edições OCR (Leitura)

Importante

Selecione a edição Read que melhor se adapta às suas necessidades.

Entrada	Exemplos	Ler edição	Benefício
Imagens: Imagens gerais, em ambiente natural	rótulos, sinais de rua e cartazes	OCR para imagens (versão 4.0)	Otimizado para imagens gerais não documentais com uma API síncrona de desempenho aprimorado que facilita a incorporação de OCR em cenários de experiência do usuário.
Documentos: digitais e digitalizados, incluindo imagens	livros, artigos e relatórios	Modelo de leitura do Document Intelligence	Otimizado para documentos digitalizados e digitais com grande quantidade de texto, com uma API assíncrona para ajudar a automatizar o processamento inteligente de documentos em escala.

Sobre Azure Vision v3.2 GA Read

Procura pela capacidade de leitura mais recente do Azure Vision v3.2 GA? Todos os futuros aprimoramentos do Read OCR fazem parte dos dois serviços listados anteriormente. Não há mais atualizações para o Azure Vision v3.2. Para mais informações, consulte Call Azure Vision 3.2 GA Read API e Quickstart: Azure Vision v3.2 GA Read.

OCR ou Reconhecimento ótico de carateres também é referido como reconhecimento de texto ou extração de texto. As técnicas de OCR baseadas em aprendizado de máquina permitem extrair texto impresso ou manuscrito de imagens como cartazes, placas de rua e rótulos de produtos, bem como de documentos como artigos, relatórios, formulários e faturas. O texto é normalmente extraído como palavras, linhas de texto e parágrafos ou blocos de texto, permitindo o acesso à versão digital do texto digitalizado. Essa capacidade elimina ou reduz significativamente a necessidade de entrada manual de dados.

motor de OCR

O mecanismo Read OCR da Microsoft usa vários modelos avançados de aprendizado de máquina que suportam idiomas globais. Extrai texto impresso e manuscrito, incluindo línguas e estilos de escrita mistos. Você pode usar Read como um serviço de nuvem ou como um contêiner local para implantação flexível. Ele também está disponível como uma API síncrona para cenários únicos, não documentais e somente de imagem, com aprimoramentos de desempenho que simplificam a implementação de experiências de usuário assistidas por OCR.

O Processamento Inteligente de Documentos (IDP) usa OCR como sua tecnologia fundamental para extrair estrutura, relacionamentos, valores-chave, entidades e outros insights centrados em documentos com um serviço avançado de IA baseado em aprendizado de máquina, como o Document Intelligence. O Document Intelligence inclui uma versão otimizada para documentos do Read como seu mecanismo de OCR enquanto delega a outros modelos para obter insights mais avançados. Se estiver a extrair texto de documentos digitalizados e digitais, use Document Intelligence Read OCR.

Idiomas suportados por OCR

Ambas as versões Read disponíveis atualmente no Azure Vision suportam várias línguas para texto impresso e manuscrito. O OCR para texto impresso suporta inglês, francês, alemão, italiano, português, espanhol, chinês, japonês, coreano, russo, árabe, hindi e outros idiomas internacionais que usam scripts latinos, cirílicos, árabes e devanágaros. OCR para texto manuscrito suporta inglês, chinês simplificado, francês, alemão, italiano, japonês, coreano, português e espanhol.

Consulte a lista completa de idiomas suportados por OCR.

Características comuns do OCR

O modelo Read OCR está disponível no Azure Vision e no Document Intelligence com capacidades comuns de referência, otimizando para os respetivos cenários. A lista a seguir resume as funcionalidades comuns:

Extração de texto impresso e manuscrito em idiomas suportados
Páginas, linhas de texto e palavras com pontuações de localização e confiança
Suporte para idiomas mistos, modo misto (impresso e manuscrito)
Disponível como contêiner Distroless Docker para implantação local

Utilize as APIs de nuvem OCR ou implemente nas instalações locais

A maioria dos clientes prefere as APIs na nuvem porque são fáceis de integrar e oferecem produtividade rápida pronta para uso. A Azure e o serviço Azure Vision tratam das necessidades de escala, desempenho, segurança de dados e conformidade, enquanto você se concentra em satisfazer as necessidades dos seus clientes.

Para implementação local, o contentor Read Docker permite-lhe implementar as capacidades OCR geralmente disponíveis do Azure Vision v3.2 no seu próprio ambiente local. Os contentores são ótimos para requisitos específicos de governação de dados e segurança.

Requisitos de entrada

A API de leitura usa imagens e documentos como entrada. As imagens e documentos devem atender aos seguintes requisitos:

Os formatos de ficheiro suportados são JPEG, PNG, BMP, PDF e TIFF.
Para arquivos PDF e TIFF, até 2.000 páginas são processadas (apenas as duas primeiras páginas para o nível gratuito).
O tamanho do arquivo das imagens deve ser inferior a 500 MB (4 MB para o nível gratuito) com dimensões de pelo menos 50 x 50 pixels e no máximo 10.000 x 10.000 pixels. Os ficheiros PDF não têm limite de tamanho.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768, o que corresponde a um texto de fonte de cerca de 8 pontos a 150 DPI.

Nota

Não é necessário cortar uma imagem para linhas de texto. Envie a imagem completa para a API de leitura e ela reconhece todos os textos.

Privacidade e segurança de dados OCR

Tal como em todas as Foundry Tools, os programadores que utilizam o serviço Azure Vision devem estar atentos às políticas da Microsoft relativamente aos dados dos clientes. Consulte a página Foundry Tools no Microsoft Trust Center para saber mais.

Próximos passos

Para OCR com imagens gerais (não documentais), experimente o início rápido da API REST da Análise de Imagens do Azure Vision 4.0.
Para OCR com documentos PDF, Office e HTML, bem como imagens de documentos, comece com Document Intelligence Read.
Para a versão anterior do GA, consulte o SDK do Azure Vision 3.2 GA ou os quickstarts da API REST.

Comentários

Esta página foi útil?

Last updated on 2025-11-22