Riconoscimento volto

Questo articolo illustra il concetto di riconoscimento volto, le relative operazioni e strutture di dati sottostanti. In generale, il riconoscimento del viso è il processo di verifica o identificazione degli individui in base ai visi. Il riconoscimento del viso è importante nell'implementazione dello scenario di identificazione, che le aziende e le app possono usare per verificare che un utente (remoto) sia chi dichiara di essere.

È possibile provare le funzionalità di rilevamento volto in modo semplice e rapido, utilizzando Vision Studio.

Operazioni di riconoscimento volto

Attenzione

L'accesso al servizio Viso è limitato in base ai criteri di idoneità e utilizzo al fine di supportare i nostri principi di intelligenza artificiale responsabile. Il servizio Viso è disponibile solo per i clienti e i partner gestiti da Microsoft. Usare il modulo di acquisizione riconoscimento volto per richiedere l'accesso. Per altre informazioni, vedere la pagina Accesso limitato dalla funzione Viso.

Creazione ed esecuzione del training di PersonGroup

È necessario creare un PersonGroup o LargePersonGroup per archiviare il set di persone in base al quale individuare eventuali corrispondenze. I PersonGroup contengono oggetti Persona che rappresentano una singola persona e contengono un set di dati sul viso appartenenti a tale persona.

L’operazione Eseguire il training prepara il set di dati da utilizzare nei confronti con i dati dei visi.

Identificazione

L'operazione Identifica acquisisce uno o più ID viso di origine (da un oggetto DetectedFace o PersistedFace) e un PersonGroup o LargePersonGroup. Quindi, restituisce un elenco di oggetti Person a cui potrebbe appartenere ciascun viso di origine. Gli oggetti Person restituiti vengono inclusi come oggetti Candidato, che hanno un valore di attendibilità di previsione.

Verifica

L'operazione Verifica acquisisce un singolo ID viso (da un oggetto DetectedFace o PersistedFace) e un oggetto Person. Essa determina se il viso appartiene alla stessa persona. La verifica è una corrispondenza uno-a-uno e può essere utilizzata come controllo finale sui risultati della chiamata API di identificazione. Facoltativamente, è possibile trasferire il PersonGroup a cui appartiene la persona candidata per migliorare le prestazioni dell'API.

Le operazioni di riconoscimento utilizzano principalmente le seguenti strutture di dati. Questi oggetti vengono archiviati nel cloud e possono essere referenziati tramite le loro stringhe ID. Le stringhe ID sono sempre univoche all'interno di una sottoscrizione, tuttavia i campi nome possono essere duplicati.

Vedere la guida alle strutture dei dati di riconoscimento dei visi.

Requisiti di input

Avvalersi dei seguenti suggerimenti per assicurarsi che le immagini di input possano fornire i risultati di rilevamento più accurati:

  • I formati immagine di input supportati sono JPEG, PNG, GIF (il primo fotogramma), BMP.
  • La dimensione del file di immagine selezionato deve essere minore di 6 MB.
  • Alcuni visi potrebbero non essere riconosciuti a causa della composizione di foto, ad esempio:
    • Immagini sovrailluminate, ad esempio una retroilluminazione eccessiva.
    • Ostacoli che limitano la visione di uno o entrambi gli occhi.
    • Differenze nel tipo di capelli o peli del volto.
    • Cambiamenti dell'aspetto del viso a causa dell'età.
    • Espressioni facciali estreme.
  • È possibile utilizzare l'attributo nell'operazione qualityForRecognitiondi rilevamento dei volti quando si usano i modelli di rilevamento applicabili come linea guida generale sul fatto che l'immagine sia probabilmente di qualità sufficiente per tentare il riconoscimento dei volti. Per gli scenari di identificazione è consigliabile usare solo "high" immagini di qualità consigliate per la registrazione e la qualità delle persone."medium"

Passaggi successivi

Ora che è stata acquisita una certa familiarità con i concetti relativi al riconoscimento volto, scrivere uno script che identifica i visi rispetto a un PersonGroup sottoposto a training.