Introdução ao Vision Studio no Azure

Concluído

Para usar o serviço Visão de IA do Azure, primeiro você deve criar um recurso para ele em sua assinatura do Azure. Você pode usar qualquer um dos seguintes tipos de recurso:

  • Visão de IA do Azure: Um recurso específico para serviços de visão. Use esse tipo de recurso se você não pretender usar nenhum outro serviço de IA ou se desejar controlar a utilização e os custos do recurso de Pesquisa Visual Computacional separadamente.
  • Serviços de IA do Azure: Um recurso geral que inclui o Visão de IA do Azure juntamente com muitos outros serviços de IA do Azure, como a Linguagem de IA do Azure, a Fala de IA do Azure e muitos outros. Use esse tipo de recurso se planejar usar vários serviços de IA do Azure e desejar simplificar a administração e o desenvolvimento.

Depois que você cria um recurso, há várias maneiras de usar a API de Leitura da Visão de IA do Azure:

  • Vision Studio
  • API REST
  • SDKs (Software Development Kits): Python, C#, JavaScript

A seguir, vamos nos concentrar no Estúdio de Visão.

Estúdio de Visão de IA do Azure

O Estúdio de Visão de IA do Azure fornece acesso às APIs da Visão de IA do Azure por meio de uma interface gráfica do usuário que não exige codificação para começar a usá-la.

A screenshot showing the Vision Studio interface.

Ao abrir o Estúdio de Visão, você precisa selecionar o recurso padrão. Seu recurso padrão no Estúdio de Visão precisa ser um recurso dos serviços de IA do Azure, em vez de um recurso da Visão de IA do Azure.

Na home page do Estúdio de Visão, selecione Reconhecimento Óptico de Caracteres e o bloco Extrair texto de imagens para experimentar o mecanismo OCR de Leitura. Seu recurso começa a gerar custos de uso quando é usado para retornar resultados. Usando um dos seus arquivos ou um arquivo de exemplo, veja como o mecanismo OCR de leitura retorna os atributos detectados. Esses atributos correspondem ao que o computador detecta nas caixas delimitadoras.

A screenshot showing the detected attributes.

Nos bastidores, recursos como pessoas, texto e objetos da imagem são analisados e marcados por caixas delimitadoras. As informações detectadas são processadas, e os resultados são retornados ao usuário. Os resultados brutos são retornados em JSON e incluem informações sobre os locais das caixas delimitadoras na página e no texto detectado. Tenha em mente que o Estúdio de Visão pode retornar exemplos de OCR, mas para criar seu aplicativo OCR, você precisa usar um SDK ou a API REST.

A screenshot showing bounding boxes and the related json returned.