O que há de novo no Imagem Digitalizada

Saiba o que há de novo no serviço. Estes itens podem ser notas de lançamento, vídeos, posts de blog e outros tipos de informação. Marque esta página para se manter atualizado com novas funcionalidades, melhorias, correções e atualizações de documentação.

Junho de 2022

Lançamento do Vision Studio

Vision Studio é uma ferramenta UI que permite explorar, construir e integrar funcionalidades da Azure Cognitive Services for Vision nas suas aplicações.

O Vision Studio fornece-lhe uma plataforma para experimentar várias funcionalidades de serviço, e ver o que eles retornam de forma visual. Utilizando o Estúdio, pode começar sem precisar de escrever código e, em seguida, utilizar as bibliotecas de clientes disponíveis e ASPIs rest na sua aplicação.

IA responsável pelo rosto

Documentação de transparência facial

  • A documentação de transparência fornece orientações para ajudar os nossos clientes a melhorar a exatidão e equidade dos seus sistemas, incorporando uma análise humana significativa para detetar e resolver casos de identificação errada ou outras falhas, fornecendo apoio a pessoas que acreditam que os seus resultados estavam incorretos, e identificando e abordando flutuações de precisão devido a variações nas condições operacionais.

Reforma de atributos sensíveis

  • Retirámos capacidades de análise facial que pretendem inferir estados emocionais e atributos identitários, tais como sexo, idade, sorriso, pelos faciais, cabelo e maquilhagem.
  • As capacidades de deteção facial (incluindo deteção de borrão, exposição, óculos, cabeceira, marcos, ruído, oclusão, caixa de delimitação facial) permanecerão geralmente disponíveis e não necessitam de uma aplicação.

Pacote Fairlearn e Painel de Justiça da Microsoft

Política de acesso limitado

  • Como parte do alinhamento face à norma de IA responsável atualizada, foi implementada uma nova política de Acesso Limitado para a API face e Imagem Digitalizada. Os clientes existentes têm um ano para se candidatarem e receberem aprovação para o acesso continuado aos serviços de reconhecimento facial com base nos seus casos de utilização fornecidos. Consulte aqui os detalhes do Acesso Limitado para Rosto e para Imagem Digitalizada aqui.

Imagem Digitalizada dedispreação 3.2-pré-visualização

As versões de pré-visualização da API 3.2 deverão ser retiradas em dezembro de 2022. Em vez disso, os clientes são encorajados a utilizar a versão geralmente disponível (GA) da API. Tenha em atenção as seguintes alterações ao migrar das versões de pré-visualização 3.2:

  1. As chamadas de Análise de Imagem e Leitura da API têm agora um parâmetro opcional de versão de modelo que pode utilizar para especificar qual modelo de IA utilizar. Por padrão, utilizarão o modelo mais recente.
  2. As chamadas de Análise de Imagem e Leitura da API também devolvem um model-version campo em respostas bem sucedidas da API. Este campo informa qual o modelo que foi usado.
  3. As APIs de Análise de Imagem utilizam agora um formato diferente de reporte de erros. Consulte a documentação de referência da API para aprender a ajustar qualquer código de tratamento de erros.

Maio de 2022

Ocr (Ler) O modelo API está geralmente disponível (GA)

O mais recente modelo da API (Read) da Imagem Digitalizada com 164 idiomas suportados está agora geralmente disponível como serviço de nuvem e recipiente.

  • O suporte do OCR para texto de impressão expande-se para 164 línguas, incluindo russo, árabe, hindi e outras línguas usando scripts cirílicos, árabes e devanagari.
  • O apoio ao texto manuscrito expande-se para 9 línguas com inglês, chinês simplificado, francês, alemão, italiano, japonês, coreano, português e espanhol.
  • Suporte melhorado para caracteres individuais, datas manuscritas, montantes, nomes, outras entidades geralmente encontradas em recibos e faturas.
  • Melhor processamento de documentos PDF digitais.
  • O limite de tamanho do ficheiro de entrada aumentou 10x a 500 MB.
  • Melhorias de desempenho e latência.
  • Disponível como serviço de nuvem e contentor Docker.

Consulte o guia de como usar o modelo GA.

Fevereiro de 2022

OCR (Ler) API Visualização Pública suporta 164 línguas

A API de OCR (Leia) da Imagem Digitalizada expande as línguas apoiadas para 164 com a sua última pré-visualização:

  • O suporte do OCR para texto de impressão expande-se para 42 novas línguas, incluindo árabe, hindi e outras línguas usando scripts árabes e devanagari.
  • O apoio ao texto manuscrito expande-se para japonês e coreano, além de inglês, chinês simplificado, francês, alemão, italiano, português e espanhol.
  • Melhorias incluindo um melhor suporte para extrair datas manuscritas, quantidades, nomes e caixas de caracteres individuais.
  • Desempenho geral e melhorias de qualidade da IA

Consulte o guia de como usar as novas funcionalidades de pré-visualização.

Novo atributo de qualidade em Detection_01 e Detection_03

  • Para ajudar os construtores de sistemas e seus clientes a capturar imagens de alta qualidade que são necessárias para saídas de alta qualidade da Face API, estamos a introduzir um novo atributo de qualidade QualityForRegnition para ajudar a decidir se uma imagem é de qualidade suficiente para tentar o reconhecimento facial. O valor é uma classificação informal de baixo, médio ou alto. O novo atributo só está disponível quando se utilizam combinações de modelos detection_01 de deteção ou detection_03modelos recognition_03 de reconhecimento ou recognition_04. Apenas são recomendadas imagens de qualidade "elevada" para a inscrição de pessoas e a qualidade acima do "médio" é recomendada para cenários de identificação. Para saber mais sobre o novo atributo de qualidade, consulte a deteção e atributos do Face e veja como usá-lo com o QuickStart.

Setembro de 2021

OCR (Ler) API Visualização Pública suporta 122 línguas

A API de OCR (Read) da Imagem Digitalizada expande as línguas apoiadas para 122 com a sua última pré-visualização:

  • Apoio ao OCR para texto impresso em 49 novas línguas, incluindo russo, búlgaro e outras línguas cirílicas e mais latinas.
  • Apoio ao OCR para texto manuscrito em 6 novas línguas que incluem inglês, chinês simplificado, francês, alemão, italiano, português e espanhol.
  • Melhorias para o processamento de PDFs digitais e texto de zona legível de máquina (MRZ) em documentos de identidade.
  • Desempenho geral e melhorias de qualidade da IA

Consulte o guia de como usar as novas funcionalidades de pré-visualização.

Agosto de 2021

Expansão da linguagem de marcação de imagem

A versão mais recente (v3.2) do image tagger agora suporta tags em 50 idiomas. Consulte a página de suporte do idioma para obter mais informações.

julho de 2021

Novas melhorias headPose e Marcos para Detection_03

  • O modelo Detection_03 foi atualizado para apoiar marcos faciais.
  • Os marcos em Detection_03 é muito mais preciso, especialmente nos marcos oculares que são cruciais para o rastreio do olhar.

Maio de 2021

Atualização do contentor de análise espacial

Uma nova versão do recipiente de Análise Espacial foi lançada com um novo conjunto de funcionalidades. Este recipiente Docker permite-lhe analisar o vídeo de streaming em tempo real para entender as relações espaciais entre as pessoas e o seu movimento através de ambientes físicos.

  • As operações de Análise Espacial podem agora ser configuradas para detetar a orientação que uma pessoa está a enfrentar.

    • Um classificador de orientação pode ser ativado para o personcrossingline e personcrossingpolygon operações configurando o enable_orientation parâmetro. Está programado para desligar por defeito.
  • As operações de Análise Espacial agora também oferecem configuração para detetar a velocidade de uma pessoa durante a caminhada/corrida

    • A velocidade pode ser detetada para as personcrossingline operações ligando personcrossingpolygon o enable_speed classificador, que está desligado por defeito. A saída reflete-se nas saídas speedavgSpeede minSpeed saídas.

abril de 2021

Imagem Digitalizada v3.2 GA

A Imagem Digitalizada API v3.2 está agora geralmente disponível com as seguintes atualizações:

Estrutura de dados personDirectory (pré-visualização)

  • Para realizar operações de reconhecimento facial como Identificar e Encontrar Similares, os clientes da Face API precisam de criar uma lista variada de objetos pessoais . O novo PersonDirectory é uma estrutura de dados que contém IDs exclusivos, cadeias de nomes opcionais e cadeias de metadados de utilizador opcionais para cada identidade de Pessoa adicionada ao diretório. Atualmente, a API Face oferece a estrutura do LargePersonGroup que tem uma funcionalidade semelhante, mas está limitada a 1 milhão de identidades. A estrutura personDirectory pode escalar até 75 milhões de identidades.
  • Outra grande diferença entre personDirectory e estruturas de dados anteriores é que você não precisará mais de fazer nenhuma chamada de Comboio depois de adicionar rostos a um objeto de Pessoa - o processo de atualização acontece automaticamente. Para mais detalhes, consulte a estrutura 'PersonDirectory'.

março de 2021

Imagem Digitalizada atualização de pré-visualização pública 3.2

A pré-visualização pública Imagem Digitalizada VPI v3.2 foi atualizada. O lançamento de pré-visualização tem todas as funcionalidades Imagem Digitalizada juntamente com APIs de leitura e análise atualizadas.

Fevereiro de 2021

Leia API v3.2 Visualização pública com suporte OCR para 73 línguas

A pré-visualização pública Imagem Digitalizada API v3.2, disponível como serviço de nuvem e contentor Docker, inclui estas atualizações:

  • OCR para 73 línguas , incluindo línguas chinesas simplificadas e tradicionais, japonesas, coreanas e latinas.
  • Ordem de leitura natural para a produção da linha de texto (apenas línguas latinas)
  • Classificação do estilo de caligrafia para linhas de texto juntamente com uma pontuação de confiança (apenas línguas latinas).
  • Extrair texto apenas para páginas selecionadas para um documento de várias páginas.
  • Disponível como recipiente distroless para implantação no local.

Consulte o guia de como ler a API para saber mais.

Novo modelo de deteção de API face

  • O novo modelo deteção 03 é o modelo de deteção mais preciso atualmente disponível. Se for um novo cliente, recomendamos a utilização deste modelo. A deteção 03 melhora tanto a recolha como a precisão em rostos mais pequenos encontrados dentro de imagens (64x64 pixels). As melhorias adicionais incluem uma redução global dos falsos positivos e uma melhor deteção nas orientações faciais rotativas. Combinar a Deteção 03 com o novo modelo Recognition 04 também proporcionará uma melhor precisão de reconhecimento. Consulte Especificar um modelo de deteção facial para obter mais detalhes.

Novos atributos de rosto detetáveis

  • O faceMask atributo está disponível com o mais recente modelo Deteção 03, juntamente com o atributo "noseAndMouthCovered" adicional que deteta se a máscara facial está usada como pretendido, cobrindo tanto o nariz como a boca. Para utilizar a mais recente capacidade de deteção de máscaras, os utilizadores precisam de especificar o modelo de deteção no pedido da API: atribua a versão do modelo com o parâmetro de detecçãoModel para detection_03. Consulte Especificar um modelo de deteção facial para obter mais detalhes.

Novo modelo de reconhecimento de API face

  • O novo modelo De Reconhecimento 04 é o modelo de reconhecimento mais preciso atualmente disponível. Se for um novo cliente, recomendamos a utilização deste modelo para verificação e identificação. Melhora a precisão do Reconhecimento 03, incluindo um reconhecimento melhorado para os utilizadores que usam capas faciais (máscaras cirúrgicas, máscaras N95, máscaras de pano). Note que recomendamos contra a inscrição de imagens de utilizadores que usam capas faciais, uma vez que isso reduzirá a qualidade de reconhecimento. Agora os clientes podem construir experiências de utilizador seguras e sem emenda que detetem se um utilizador está a usar uma capa facial com o mais recente modelo de Deteção 03, e reconhecê-los com o mais recente modelo De Reconhecimento 04. Consulte Especificar um modelo de reconhecimento facial para obter mais detalhes.

Janeiro de 2021

Atualização do contentor de análise espacial

Uma nova versão do recipiente de Análise Espacial foi lançada com um novo conjunto de funcionalidades. Este recipiente Docker permite-lhe analisar o vídeo de streaming em tempo real para entender as relações espaciais entre as pessoas e o seu movimento através de ambientes físicos.

  • As operações de análise espacial podem agora ser configuradas para detetar se uma pessoa está a usar uma cobertura facial protetora, como uma máscara.
    • Um classificador de máscara pode ser ativado para o personcount, personcrossingline e personcrossingpolygon operações configurando o ENABLE_FACE_MASK_CLASSIFIER parâmetro.
    • Os atributos face_mask e face_noMask serão devolvidos como metadados com pontuação de confiança para cada pessoa detetada no fluxo de vídeo
  • A operação personcrossingpolygon foi alargada para permitir o cálculo do tempo de vida que uma pessoa passa numa zona. Pode definir o type parâmetro na configuração de Zona para a operação zonedwelltime e um novo evento de tipo personZoneDwellTimeEvent incluirá o durationMs campo povoado com o número de milissegundos que a pessoa passou na zona.
  • Breaking change: O evento personZoneEvent foi renomeado para personZoneEnterExitEvent. Este evento é levantado pela operação personcrossingpolygon quando uma pessoa entra ou sai da zona e fornece informações direcionais com o lado numerado da zona que foi atravessada.
  • O URL de vídeo pode ser fornecido como "Parâmetro Privado/obfuscado" em todas as operações. A obfuscção é opcional agora e só funcionará se KEY e IV for fornecida como variáveis ambientais.
  • A calibração é ativada por padrão para todas as operações. Desative-o do_calibration: false .
  • Suporte adicional para recalibração automática (por defeito desativado) através do parâmetro, consulte as enable_recalibrationoperações de Análise Espacial para mais detalhes
  • Parâmetros de calibração da câmara para o DETECTOR_NODE_CONFIG. Consulte as operações de Análise Espacial para obter mais detalhes.

Mitigar a latência

Dezembro de 2020

Configuração do cliente para armazenamento de ID facial

  • Embora o Serviço Facial não armazene imagens do cliente, a ou as funções faciais extraídas serão armazenadas no servidor. O Face ID é um identificador da função facial e será usado no Face - Identificar, Enfrentar - Verificar e Enfrentar - Encontrar Similar. As características do rosto armazenadas expirarão e serão apagadas 24 horas após a chamada de deteção original. Os clientes podem agora determinar o tempo que estes IDs faciais estão em cache. O valor máximo ainda é de até 24 horas, mas um valor mínimo de 60 segundos pode agora ser definido. Os novos intervalos de tempo para os IDs face serem em cache são qualquer valor entre 60 segundos e 24 horas. Mais detalhes podem ser encontrados na referência Face - Detect API (o parâmetro faceIdTimeToLive ).

Novembro de 2020

App de inscrição de Rosto de Amostra

  • A equipa publicou uma aplicação de inscrição face para demonstrar as melhores práticas para estabelecer um consentimento significativo e criar sistemas de reconhecimento facial de alta precisão através de inscrições de alta qualidade. A amostra de código aberto pode ser encontrada no Guia de aplicações de inscrição Build e no GitHub, pronto para os desenvolvedores implementarem ou personalizarem.

Outubro de 2020

Imagem Digitalizada API v3.1 GA

A Imagem Digitalizada API em Disponibilidade Geral foi atualizada para v3.1.

Setembro de 2020

Pré-visualização do recipiente de análise espacial

O recipiente de Análise Espacial está agora em pré-visualização. A funcionalidade de Análise Espacial de Imagem Digitalizada permite-lhe analisar o vídeo de streaming em tempo real para entender as relações espaciais entre as pessoas e o seu movimento através de ambientes físicos. Análise Espacial é um recipiente Docker que pode usar no local.

Ler API v3.1 Visualização pública adiciona OCR para japonês

A pré-visualização pública Imagem Digitalizada Ler API v3.1 adiciona estas capacidades:

  • OCR para língua japonesa

  • Para cada linha de texto, indique se a aparência é estilo de caligrafia ou impressão, juntamente com uma pontuação de confiança (apenas línguas latinas).

  • Para um texto de extrato de documento de várias páginas apenas para páginas selecionadas ou intervalo de página.

  • Esta versão de pré-visualização da API de leitura suporta línguas inglesa, holandesa, francesa, alemã, italiana, japonesa, portuguesa, chinesa simplificada e espanhola.

Consulte o guia de como ler a API para saber mais.

Agosto de 2020

Encriptação gerida pelo cliente de dados em repouso

  • O serviço Face encripta automaticamente os seus dados ao persistência na nuvem. A encriptação do serviço Face protege os seus dados para ajudá-lo a cumprir os seus compromissos de segurança organizacional e conformidade. Por predefinição, a subscrição utiliza chaves de encriptação geridas pela Microsoft. Existe também uma nova opção para gerir a sua subscrição com as suas próprias chaves chamadas chaves geridas pelo cliente (CMK). Mais detalhes podem ser encontrados em chaves geridas pelo Cliente.

Julho de 2020

Leia API v3.1 Visualização pública com OCR para chinês simplificado

A pré-visualização pública Imagem Digitalizada Read API v3.1 adiciona suporte para chinês simplificado.

  • Esta versão de pré-visualização da API de leitura suporta línguas inglesa, holandesa, francesa, alemã, italiana, portuguesa, chinesa simplificada e espanhola.

Consulte o guia de como ler a API para saber mais.

Maio de 2020

Imagem Digitalizada API v3.0 entrou disponibilidade geral, com atualizações para a API de Leitura:

  • Apoio ao inglês, holandês, francês, alemão, italiano, português e espanhol
  • Precisão melhorada
  • Pontuação de confiança para cada palavra extraída
  • Novo formato de saída

Consulte a visão geral do OCR para saber mais.

Abril de 2020

Novo modelo de reconhecimento de API face

  • O novo modelo de reconhecimento 03 é o modelo mais preciso atualmente disponível. Se for um novo cliente, recomendamos a utilização deste modelo. O reconhecimento 03 proporcionará uma maior precisão tanto para comparações de semelhança como para comparações de pessoas. Mais detalhes podem ser encontrados na Especificar um modelo de reconhecimento facial.

Março de 2020

Janeiro de 2020

Ler API 3.0 Antevisão pública

Agora pode utilizar a versão 3.0 da API de leitura para extrair texto impresso ou manuscrito a partir de imagens. Em comparação com versões anteriores, 3.0 fornece:

  • Precisão melhorada
  • Novo formato de saída
  • Pontuação de confiança para cada palavra extraída
  • Apoio às línguas espanhola e inglesa com o parâmetro da língua

Siga um quickstart de texto extrato para começar a utilizar a API 3.0.

Junho de 2019

Novo modelo de deteção de API face

Abril de 2019

Precisão melhorada do atributo

  • Melhor precisão geral dos age atributos e headPose atributos. O headPose atributo também é atualizado com o pitch valor ativado agora. Utilize estes atributos especificando-os no returnFaceAttributes parâmetro do Face - DetetereturnFaceAttributes o parâmetro.

Melhores velocidades de processamento

Março de 2019

Novo modelo de reconhecimento de API face

Janeiro de 2019

Função Face Snapshot

Outubro de 2018

Mensagens API

Maio de 2018

Precisão melhorada do atributo

  • Melhorou gender significativamente o atributo e também melhorouage, glassesfacialHairatributoshairmakeup. Use-os através do face - Detete oreturnFaceAttributes parâmetro.

Limite de tamanho de ficheiro aumentado

Março de 2018

Nova estrutura de dados

Maio de 2017

Novos atributos de rosto detetáveis

  • Adicionado hair, makeup, accessory, occlusion, , blur, exposuree noise atributos em Face - DetetarreturnFaceAttributes parâmetro.
  • Suportado 10K pessoas num PersonGroup e Face - Identifique.
  • Paginação suportada em PersonGroup Person Person - Lista com parâmetros opcionais: start e top.
  • Apoio de concordância na adição/eliminação de rostos contra diferentes FaceLists e diferentes pessoas no PersonGroup.

Março de 2017

Novo atributo face detetável

  • Atributo adicionado emotion no face - DetetarreturnFaceAttributes parâmetro.

Problemas corrigidos

Novembro de 2016

Novo nível de subscrição

  • Subscrição padrão de armazenamento facial adicionado para armazenar rostos adicionais persistidos ao utilizar persongroup person person - Add Face ou FaceList - Adicionar Face para identificação ou semelhança. As imagens armazenadas são cobradas a 0,5 $ por 1000 rostos e esta tarifa é calculada diariamente. As subscrições de nível livre continuam a ser limitadas a 1.000 pessoas no total.

Outubro de 2016

Mensagens API

Julho de 2016

Novas funcionalidades

  • Autenticação de objetos suportados Face to Person em Face - Verificar.
  • Parâmetro opcional mode adicionado que permite a seleção de dois modos de trabalho: matchPerson e matchFace no Face - Encontrar Similar e padrão é matchPerson.
  • Parâmetro opcional confidenceThreshold adicionado para o utilizador definir o limiar de se um rosto pertence a um objeto pessoa em Face - Identificar.
  • Adicionado opcional start e top parâmetros no PersonGroup - Lista para permitir ao utilizador especificar o ponto de partida e o número total de Grupos de Pessoas para listar.

V1.0 muda de V0

  • Ponto final raiz de serviço atualizado de https://westus.api.cognitive.microsoft.com/face/v0/ .https://westus.api.cognitive.microsoft.com/face/v1.0/ Alterações aplicadas a: Face - Detetar, Rosto - Identificar, Rosto - Encontrar Similar e Cara - Grupo.
  • Atualize o tamanho mínimo do rosto detetável para 36x36 pixels. Não serão detetados rostos com menos de 36x36 pixels.
  • Preprecou os dados do PersonGroup e da Pessoa no Face V0. Estes dados não podem ser acedidos com o serviço Face V1.0.
  • Depreifed the V0 endpoint of Face API on June 30, 2016.

Atualizações do Serviço Cognitivo

Anúncios de atualização da Azure para Serviços Cognitivos