O que é a Análise de Imagem?

O serviço de Análise de Imagem da Pesquisa Visual Computacional pode extrair uma ampla variedade de recursos visuais das suas imagens. Por exemplo, ele pode determinar se uma imagem apresenta conteúdo para adulto, localizar marcas ou objetos específicos ou encontrar rostos humanos.

A versão mais recente do Image Analysis, 4.0, que agora está em pré-visualização pública, possui novos recursos como OCR síncrono e detecção de pessoas. Recomendamos que você use esta versão daqui para frente.

Use a Análise de Imagem por meio de um SDK da biblioteca de clientes ou chamando a API REST diretamente. Siga o guia de início rápido para obter uma introdução.

Você também pode experimentar as funcionalidades da Análise de Imagem de maneira rápida e fácil no navegador usando o Vision Studio.

Esta documentação contém os seguintes tipos de artigos:

  • Os inícios rápidos são instruções passo a passo que permitem fazer chamadas para o serviço e obter resultados em um período curto.
  • Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.
  • Os artigos conceituais fornecem explicações detalhadas sobre a funcionalidade e os recursos do serviço.
  • Os tutoriais são guias mais longos que mostram como usar o serviço como um componente de soluções de negócios mais amplas.

Para obter uma abordagem mais estruturada, siga um módulo de treinamento de análise de imagem.

Recursos da Análise de Imagem

Analise imagens para fornecer insights sobre os recursos visuais e as características. Todos os recursos da lista abaixo são fornecidos pela API de Análise de Imagem. Siga nosso início rápido para começar.

Extrair texto de imagens (versão prévia)

A versão prévia da Versão 4.0 da Análise de imagem oferece o recurso de extrair texto de imagens. Em comparação à leitura assíncrona Pesquisa Visual Computacional 3.2 GA, a nova versão oferece o mecanismo OCR de leitura familiar em uma API síncrona unificada com melhoria de desempenho que facilita a obtenção de todos os insights de imagem, incluindo o OCR, em uma só operação de API. Extrair texto de imagens

Detectar pessoas em imagens (versão prévia)

A versão prévia da Versão 4.0 da Análise de imagem oferece o recurso de detectar pessoas que aparecem nas imagens. São retornadas as coordenadas da caixa delimitadora de cada pessoa detectada, juntamente com uma pontuação de confiança. Detecção facial

Marcar recursos visuais

Identificar e marcar recursos visuais em uma imagem, de um conjunto de milhares de objetos reconhecíveis, seres vivos, cenários e ações. Quando as marcas forem ambíguas ou não pertencerem a um conhecimento comum, a resposta da API fornecerá dicas para esclarecer o contexto da tag. A marcação não está limitada ao assunto principal, como uma pessoa em primeiro plano, mas também inclui cenário (interno ou externo), móveis, ferramentas, plantas, animais, acessórios, gadgets e outros. Marcar recursos visuais

Uma imagem de um nadador com tags captada à direita

Detectar objetos

A detecção de objetos é semelhante à marcação, mas a API retorna as coordenadas da caixa delimitadora para cada tag aplicada. Por exemplo, se uma imagem contiver um cachorro, um gato e uma pessoa, a operação Detect listará esses objetos junto com as coordenadas na imagem. Você pode usar essa funcionalidade para processar ainda mais as relações entre os objetos em uma imagem. Também permite que você saiba quando há várias instâncias da mesma tag em uma imagem. Detectar objetos

Uma imagem de um escritório com um retângulo desenhado em torno de um laptop

Detectar marcas

Identifique as marcas comerciais em imagens ou vídeos de um banco de dados de milhares de logotipos globais. Você pode usar esse recurso, por exemplo, para descobrir quais marcas são mais populares em mídia social ou mais predominantes no posicionamento de produto de mídia. Detectar marcas

Categorizar uma imagem

Identifique e categorize uma imagem inteira usando uma taxonomia de categoria com hierarquias hereditárias de pai/filho. As categorias podem ser usadas autonomamente ou com nossos novos modelos de marcação.
Atualmente, o inglês é o único idioma com suporte para a marcação e categorização de imagens. Categorizar uma imagem

Descrever uma imagem

Gere uma descrição de uma imagem inteira em linguagem compreendida por humanos, usando frases completas. Os algoritmos da Pesquisa Visual Computacional geram várias descrições baseadas nos objetos identificados na imagem. Cada uma das descrições é avaliada e uma pontuação de confiança é gerada. Uma lista é então retornada, ordenada pela pontuação de confiança mais alta à mais baixa. Descrever uma imagem

Uma imagem de animais com uma descrição simples à direita

Detectar faces

Detecte rostos em uma imagem e forneça informações sobre cada rosto detectado. A Pesquisa Visual Computacional retorna as coordenadas, o retângulo, o sexo e a idade de cada rosto detectado. Detectar faces

Você também pode usar a API de Detecção Facial dedicada para essas finalidades. Ela fornece uma análise mais detalhada, como identificação facial e detecção de pose.

Detectar tipos de imagem

Detecte características sobre uma imagem, por exemplo, se uma imagem é um desenho de linha se é, possivelmente, um clip-art. Detectar tipos de imagem

Detectar conteúdo específico de um domínio

Use modelos de domínio para detectar e identificar conteúdo específico de um assunto em uma imagem, como celebridades e pontos turísticos. Por exemplo, se uma imagem contiver pessoas, a Pesquisa Visual Computacional poderá usar um modelo de domínio para celebridades a fim de determinar se as pessoas detectadas na imagem são celebridades conhecidas. Detectar conteúdo específico de um domínio

Detectar o esquema de cores

Analise o uso de cores em uma imagem. A Pesquisa Visual Computacional pode determinar se uma imagem está em preto & branco ou em cores e, para imagens com cores, identificar as cores dominantes e acentuadas. Detectar o esquema de cores

Obter a área de interesse/corte inteligente

Analise o conteúdo de uma imagem para retornar as coordenadas da área de interesse que corresponde a uma taxa de proporção especificada. A Pesquisa Visual Computacional retorna as coordenadas da caixa delimitadora da região, de modo que o aplicativo de chamada possa modificar a imagem original conforme desejado. Gerar uma miniatura

Uma imagem de uma pessoa em uma montanha, com versões cortadas à direita

Moderar conteúdo em imagens

Use a Pesquisa Visual Computacional para detectar conteúdo para adulto em uma imagem e retornar pontuações de confiança para diferentes classificações. O limite para a sinalização de conteúdo pode ser definido em uma escala deslizante para acomodar suas preferências.

Requisitos de imagem

A Análise de Imagem funciona em imagens que atendem aos seguintes requisitos:

  • A imagem deve ser apresentada no formato JPEG, PNG, GIF ou BMP
  • O tamanho do arquivo da imagem deve ser menor que 4 MB (megabytes)
  • As dimensões da imagem devem ser maiores que 50 x 50 pixels e menores que 16.000 x 16.000 pixels

Segurança e privacidade de dados

Assim como ocorre com todos os Serviços Cognitivos, os desenvolvedores que usam o serviço de Pesquisa Visual Computacional devem estar cientes das políticas da Microsoft em relação aos dados do cliente. Confira a página de Serviços Cognitivos na Central de Confiabilidade da Microsoft para saber mais.

Próximas etapas

Comece a usar a Análise de Imagem seguindo o guia de início rápido na linguagem de desenvolvimento de sua preferência: