Tipos de serviços de API de visão

Artigo
02/09/2024

O Serviço Cognitivo do Azure para Visão é uma das categorias mais amplas dos Serviços Cognitivos. Você pode usar as APIs para incorporar recursos de visão como análise de imagem, deteção de rosto, análise espacial e reconhecimento ótico de caracteres (OCR) em seus aplicativos, mesmo que tenha conhecimento limitado de aprendizado de máquina.

Serviços

Aqui estão algumas categorias amplas de APIs de visão:

O Computer Vision fornece algoritmos avançados que processam imagens e retornam informações com base nos recursos visuais em que você está interessado. Disponibiliza quatro serviços: OCR, Face service, Análise de Imagem e Análise Espacial. Form Recognizer é uma versão avançada do OCR.
A Visão Personalizada é um serviço de reconhecimento de imagem que você pode usar para criar, implantar e melhorar seus próprios modelos de identificador de imagem.
O serviço Face fornece algoritmos de IA que detetam, reconhecem e analisam rostos humanos em imagens.

Como escolher um serviço

O fluxograma a seguir pode ajudá-lo a escolher um serviço de visão para seu caso de uso específico:

Casos comuns de utilização

Imagem Digitalizada
- Descreva uma imagem. Analise uma imagem, avalie os objetos que são detetados e gere uma frase legível por humanos ou frase que descreva a imagem.
- Marcar recursos visuais. Aplique tags baseadas em um conjunto de milhares de objetos reconhecíveis.
- Categorizar uma imagem. Categorize imagens com base no seu conteúdo.
- Implementar OCR. Detete texto impresso e manuscrito em imagens.
- Detetar tipos de imagem. Por exemplo, identifique imagens de clip-art ou desenhos de linhas.
- Detetar esquemas de cores. Identifique o primeiro plano, o plano de fundo e as cores dominantes e de destaque em uma imagem.
- Gere miniaturas. Crie pequenas versões de imagens.
- Conteúdo moderado. Detete imagens que contenham conteúdo adulto ou que representem cenas sangrentas.
- Detetar conteúdo específico do domínio. Use dois modelos de domínio especializados:
  - Celebridades. Identifique milhares de celebridades conhecidas dos domínios do desporto, entretenimento e negócios.
  - Pontos de referência. Identifique marcos famosos, como o Taj Mahal e a Estátua da Liberdade.
- Detetar objetos. Identifique objetos comuns e retorne as coordenadas de uma caixa delimitadora.
- Detete marcas. Identifique logotipos de um banco de dados existente de milhares de logotipos de produtos reconhecidos mundialmente.
- Detete rostos. Detete e analise rostos humanos em uma imagem. Você pode determinar a idade do sujeito e retornar uma caixa delimitadora que especifica os locais dos rostos. As capacidades de análise facial do serviço de Visão por Computador são um subconjunto das fornecidas pelo serviço Face dedicado.
Visão Personalizada
- Classifique imagens. Preveja uma categoria, ou classe, com base em um conjunto de entradas, que são chamadas de recursos. Calcule uma pontuação de probabilidade para cada classe possível e retorne um rótulo que indique a classe à qual o objeto provavelmente pertence. Para usar esse modelo, você precisa de dados que consistem em recursos e seus rótulos.
- Detetar objetos. Obtenha as coordenadas de um objeto em uma imagem. Para usar esse modelo, você precisa de dados que consistem em recursos e seus rótulos.
Serviços faciais
- Detete rostos. Identifique as regiões de uma imagem que contêm um rosto humano, normalmente retornando as coordenadas da caixa delimitadora que formam um retângulo ao redor do rosto.
- Analise rostos. Retornar informações, como pontos de referência faciais (nariz, olhos, sobrancelhas, lábios e muito mais). Você pode usar esses pontos de referência faciais como recursos para treinar um modelo de aprendizado de máquina que pode inferir informações sobre as pessoas, como sua idade percebida ou estado emocional.
- Reconheça rostos. Treine um modelo de aprendizado de máquina para identificar indivíduos conhecidos a partir de suas características faciais.

Contribuidores

Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.

Principais autores:

Ashish Chahuan - Brasil | Arquiteto de Soluções Cloud Sênior
Kruti Mehta - Brasil | Engenheiro Fast-Track Sénior do Azure

Outros contribuidores:

Mick Alberts - Brasil | Redator Técnico
Brandon Cowen - Brasil | Arquiteto de Soluções Cloud Sênior
Oscar Shimabukuro - Brasil | Arquiteto de Soluções Cloud Sênior
Manjit Singh - Brasil | Engenheiro de Software
Christina Skarpathiotaki - Brasil | Arquiteto de Soluções Cloud Sênior
Nathan Widdup - Brasil | Engenheiro Fast-Track Sénior do Azure

Para ver perfis não públicos do LinkedIn, inicie sessão no LinkedIn.

Tipos de serviços de API de visão

Serviços

Como escolher um serviço

Casos comuns de utilização

Contribuidores

Próximos passos

Comentários

Comentários

Recursos adicionais

Tipos de serviços de API de visão

Serviços

Como escolher um serviço

Casos comuns de utilização

Contribuidores

Próximos passos

Recursos relacionados

Comentários

Comentários

Recursos adicionais