Partilhar via


Descrição geral do reconhecimento ótico de carateres no Microsoft Syntex

Nota

Até junho de 2025, pode experimentar o reconhecimento ótico de carateres e outros serviços Syntex selecionados sem custos se tiver a faturação pay as you go configurada. Para obter informações e limitações, consulte Experimentar o Microsoft Syntex e explorar os respetivos serviços.

O serviço de reconhecimento ótico de carateres (OCR) no Microsoft Syntex permite extrair texto impresso ou manuscrito de imagens e documentos. Exemplos de imagens incluem cartazes, desenhos e etiquetas de produto. Exemplos de documentos incluem artigos, relatórios, formulários e faturas.

Normalmente, o texto é extraído como palavras, linhas de texto e parágrafos ou blocos de texto, o que permite o acesso à versão digital do texto digitalizado. As informações extraídas são indexadas na pesquisa e podem ser disponibilizadas para funcionalidades de conformidade, como prevenção de perda de dados (DLP).

Por exemplo, pode ativar o serviço OCR e, em seguida, adicionar ficheiros de imagem à sua biblioteca de documentos. O Microsoft Syntex analisa automaticamente os ficheiros de imagem, extrai o texto relevante e disponibiliza o texto das imagens para pesquisa e indexação. Esta funcionalidade permite-lhe encontrar rápida e precisamente as palavras-chave e expressões que procura.

Requisitos e limitações

Tipos de ficheiros suportados

Ponto final Tipos de ficheiros suportados
SharePoint e OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff e .pdf (apenas imagem)
Dispositivos Teams, Exchange e Windows .bmp, .png, .jpeg, .jpg, .tiff e .pdf (apenas imagem)

Nota

Quando aplica o OCR a um ficheiro de imagem, o texto é armazenado na coluna Metadados de texto extraídos . Quando aplica o OCR a um ficheiro PDF ou TIFF, o texto extraído é indexado na pesquisa, mas não está disponível na coluna de metadados.

Idiomas suportados

O serviço OCR suporta mais de 150 idiomas.

Localizações e soluções suportadas

O serviço OCR suporta várias soluções, conforme mostrado na tabela seguinte. Para obter detalhes sobre soluções de conformidade, consulte Localizações e soluções suportadas no Microsoft Purview.

Localização Solução suportada
Exchange O texto está disponível para soluções orientadas para pesquisa e pesquisa do utilizador final.
O texto está disponível para soluções de conformidade.
Sites do SharePoint O texto está disponível para soluções orientadas para pesquisa e pesquisa do utilizador final.
O texto está disponível para soluções de conformidade.
Contas do OneDrive O texto está disponível para soluções orientadas para pesquisa e pesquisa do utilizador final.
O texto está disponível para soluções de conformidade.
Chat do Teams e mensagem de canal O texto está disponível para soluções de conformidade.
Dispositivos O texto está disponível para soluções de conformidade.

Limitações de ficheiros

  • As imagens têm de ter menos de 50 MB.

  • As imagens têm de ter, pelo menos, 50 x 50 pixéis e não ser superiores a 16 000 x 16 000 pixels.

  • As imagens carregadas após o OCR ter sido ativado são as únicas imagens que são digitalizadas.

  • As imagens incorporadas em documentos do Office não são suportadas.