Saiba mais sobre o reconhecimento ótico de carateres no Microsoft Purview

Artigo
10/02/2024

A análise do reconhecimento ótico de carateres (OCR) permite que o Microsoft Purview analise imagens para obter informações confidenciais. A análise de OCR é uma funcionalidade opcional e tem de ser ativada ao nível do inquilino. Depois de ativada, selecione as localizações onde pretende digitalizar imagens. A análise de imagens está disponível para dispositivos Exchange, SharePoint, OneDrive, Teams, Windows e macOS. Assim que as definições de OCR estiverem configuradas, as políticas existentes para prevenção de perda de dados (DLP), gestão de registos e gestão de riscos internos (IRM) são aplicadas a imagens e conteúdos baseados em texto. Por exemplo, digamos que configurou o conteúdo da condição DLP que contém informações confidenciais e incluiu um classificador de dados, como o tipo de informações confidenciais (SIT) do Cartão de Crédito . Neste caso, o Microsoft Purview procura números de card de crédito em texto e imagens em todas as localizações escolhidas.

Fluxo de trabalho em um relance

Fase	Requisitos
Criar uma subscrição do Azure, se necessário	Se a sua organização ainda não tiver uma subscrição pay as you go do Azure para o seu inquilino, o administrador global tem de começar por criar uma conta do Azure.
Estimar os custos de análise do OCR	Utilize o avaliador de custos do OCR para estimar os custos esperados para os seus casos de utilização específicos.
Configure a faturação pay as you go para ativar o OCR.	O administrador Global ou do SharePoint tem de seguir as instruções em Configurar Microsoft Syntex faturação no Azure para adicionar uma subscrição para o OCR.
Configurar as definições de análise de OCR	O Administrador de conformidade da sua organização configura as definições de OCR para o seu inquilino.

Pré-requisitos

Para utilizar a análise de OCR, o Administrador global da sua organização tem de verificar se está implementada uma subscrição pay as you go do Azure. Caso contrário, é necessário configurá-lo, seguindo as instruções em Criar as subscrições iniciais do Azure

Configurar a faturação

Quando ativa o OCR, todos os tipos de informações confidenciais e classificadores treináveis podem detetar carateres que estão em imagens.

Uma vez que é uma funcionalidade opcional, o administrador global tem de configurar a faturação pay as you go para ativar o OCR. Veja as instruções em Configurar Microsoft Syntex faturação no Azure para adicionar uma subscrição do OCR.

Observação

Assim que as informações de faturação forem introduzidas no Microsoft Syntex, o administrador de Conformidade pode configurar o OCR no Microsoft Purview, sem quaisquer requisitos adicionais de configuração ou licenciamento.

Pode encontrar informações sobre preços pay as you go do OCR na página Configurar Microsoft Syntex faturação no Azure.

Estimar os custos de análise do OCR

O custo da utilização do OCR é de 1,00 $ por cada 1000 itens analisados. Cada imagem analisada conta como uma transação. Isto significa que as imagens autónomas (JPEG, JPG, PNG, BMP ou TIFF) contam como uma única transação. Também significa que cada página num ficheiro PDF é cobrada separadamente. Por exemplo, se existirem 10 páginas num ficheiro PDF, uma análise OCR do ficheiro PDF conta como 10 análises separadas. Para obter informações sobre como utilizar o avaliador de custos do OCR, veja Estimar os custos do OCR.

Observação

Para reduzir os custos de OCR, os custos de análise de cada imagem exclusiva são incorridos apenas uma vez.

As imagens pequenas, como logótipos e assinaturas enviadas por e-mail através do Microsoft Exchange, são analisadas e faturadas apenas uma vez por imagem exclusiva em todos os utilizadores do inquilino. Para todas as instâncias subsequentes, os resultados da análise anterior serão reutilizados.

Além disso, cada imagem analisada pode ser utilizada em qualquer número de políticas em toda a prevenção de perda de dados, gestão de riscos internos, etiquetagem automática e gestão de registos sem custos adicionais.

Importante

Para obter informações sobre os requisitos da Adobe para utilizar funcionalidades Prevenção Contra Perda de Dados do Microsoft Purview (DLP) com ficheiros PDF, consulte este artigo da Adobe: Proteção de Informações do Microsoft Purview Support in Acrobat (Suporte do Adobe: Proteção de Informações do Microsoft Purview no Acrobat).

Configurar as definições de OCR

Selecione a guia apropriada para o portal que você está usando. Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o Portal de conformidade, consulte Portal de conformidade do Microsoft Purview.

Portal do Microsoft Purview
Portal de Conformidade

Inicie sessão no portal do Microsoft Purview.
Selecione Configurações.
Selecione Reconhecimento ótico de carateres (OCR) para introduzir as definições de configuração do OCR.
Selecione as localizações onde pretende digitalizar imagens.
Selecione os grupos de distribuição que pretende incluir ou excluir das análises de OCR.
Selecione Concluído

As localizações e soluções suportadas estão listadas na tabela abaixo.

Permissões

A conta que utiliza para criar e implementar políticas tem de ser membro de um destes grupos de funções

Administrador de conformidade
Administrador de dados de conformidade
Administrador global
Proteção de Informações
Administrador de Proteção de Informações

Observação

Em geral, as definições de OCR são aplicadas cerca de uma hora depois de serem ativadas.
Para obter informações sobre a funcionalidade OCR no Conformidade de Comunicações do Microsoft Purview, veja Criar e gerir políticas de conformidade de comunicação.

Localizações e soluções suportadas

Local	Soluções Suportadas
Exchange	Prevenção contra perda de dados Proteção de informações: políticas de etiquetagem automática Gestão de registos: aplicar automaticamente políticas de etiquetas de retenção¹
Sites do SharePoint	Prevenção contra perda de dados Gestão de riscos^{internos 2} Gestão de registos: aplicar automaticamente políticas de etiquetas de retenção¹
Contas do OneDrive	Prevenção contra perda de dados Gestão de registos: aplicar automaticamente políticas de etiquetas de retenção¹
Bater papo e canal de mensagens do Teams	Prevenção contra perda de dados Gestão de riscos^{internos 2}
Dispositivos	Prevenção contra perda de dados Gestão de riscos^{internos 2}

¹ Suporta palavras-chave e tipos de informações confidenciais.
² Considera tipos de informações confidenciais e classificadores treináveis presentes em imagens para classificação de risco.

Tipos de arquivo compatíveis

Esta funcionalidade suporta a análise de imagens nos seguintes tipos de ficheiro, com os requisitos indicados:

Tipos de arquivo compatíveis	Requisitos de imagem
JPEG, JPG, PNG, BMP, TIFF e PDF (apenas imagem)	Tamanhos de ficheiro: Os ficheiros de imagem não podem ter mais de 20 MB para o Exchange e o Teams. Para pontos finais do SharePoint, OneDrive e Windows e macOS, o tamanho máximo do ficheiro de imagem é de 50 MB. Resolução da imagem: A resolução da imagem tem de ter, pelo menos, 50 x 50 píxeis e não ser superior a 16 000 x 16 000 px.

Importante

Apenas as imagens carregadas após o OCR ter sido ativado são analisadas.
Tanto os e-mails recebidos (e-mails de utilizadores fora da organização) como os e-mails enviados (e-mails enviados por utilizadores dentro da organização) estão sujeitos à análise de OCR. Para restringir as análises OCR apenas a e-mails enviados, altere as definições de OCR do âmbito predefinido de Todos os grupos de distribuição para os grupos de distribuição específicos e especifique os grupos de distribuição internos que pretende que o OCR analise. Para obter informações sobre como alterar esta configuração, consulte Configurar as definições do OCR.
As sugestões de políticas de prevenção de perda de dados não são suportadas para imagens no Exchange.
Se excluir um caminho nas definições de prevenção de perda de dados de ponto final, o OCR não analisará imagens nessas pastas.
Quando o OCR está ativado para dispositivos Windows e macOS, os dispositivos começam a enviar mensagens para a cloud para análise. O limite de largura de banda predefinido é de 1024 MB de dados por dispositivo por dia. O OCR deixa de analisar imagens assim que este limite diário for atingido. Se quiser continuar a digitalizar imagens, pode aumentar o limite de largura de banda.

Idiomas Suportados

A análise de OCR suporta mais de 150 idiomas.

Resumo

Para utilizar o OCR, tem de configurar Microsoft Syntex faturação pay as you go. (Não precisa de configurar Microsoft Syntex em si.)
A configuração do OCR ocorre ao nível do inquilino, pelo que, assim que o OCR estiver configurado, estará disponível para toda a pilha do Microsoft Purview.
Não precisa de criar classificadores de dados separados para o OCR. Assim que o OCR estiver configurado, os tipos de informações confidenciais existentes, os tipos de informações confidenciais baseados em correspondência de dados exatos, os classificadores treináveis e os SITs de impressão digital analisam imagens, bem como documentos e e-mails.

Partilhar via

Saiba mais sobre o reconhecimento ótico de carateres no Microsoft Purview

Fluxo de trabalho em um relance

Pré-requisitos

Configurar a faturação

Estimar os custos de análise do OCR

Configurar as definições de OCR

Permissões

Localizações e soluções suportadas

Tipos de arquivo compatíveis

Idiomas Suportados

Resumo

Confira também

Comentários

Recursos adicionais