Che cos'è il servizio Viso di Intelligenza artificiale di Azure?

Il servizio Viso di Azure AI offre algoritmi di intelligenza artificiale che rilevano, riconoscono e analizzano i visi umani nelle immagini. Il software di riconoscimento facciale è importante in molti scenari diversi, ad esempio identificazione, controllo di accesso senza tocco e sfocatura del viso per la privacy.

È possibile usare il servizio Viso tramite un SDK della libreria client o chiamando direttamente l'API REST. Seguire la guida introduttiva per iniziare.

In alternativa, è possibile provare le funzionalità del servizio Viso in modo rapido e semplice nel browser usando Vision Studio.

Attenzione

L'accesso al servizio Viso è limitato in base ai criteri di idoneità e utilizzo per supportare i principi di IA responsabile. Il servizio Viso è disponibile solo per i clienti e i partner gestiti da Microsoft. Usare il modulo di assunzione riconoscimento del viso per richiedere l'accesso. Per altre informazioni, vedere la pagina Viso con accesso limitato.

Questa documentazione contiene i tipi di articoli seguenti:

  • Le guide introduttive sono istruzioni dettagliate che consentono di effettuare chiamate al servizio e ottenere risultati in un breve periodo di tempo.
  • Le guide pratiche contengono istruzioni per l'uso del servizio in modi più specifici o personalizzati.
  • Gli articoli concettuali forniscono spiegazioni approfondite delle funzionalità e delle funzionalità del servizio.
  • Le esercitazioni sono guide più lunghe che illustrano come usare questo servizio come componente in soluzioni aziendali più ampie.

Per un approccio più strutturato, seguire un modulo Training per Viso.

Caso d'uso di esempio

Verificare l'identità utente: verificare una persona rispetto a un'immagine del viso attendibile. Questa verifica può essere usata per concedere l'accesso a proprietà digitali o fisiche, ad esempio un conto bancario, l'accesso a un edificio e così via. Nella maggior parte dei casi, l'immagine del viso attendibile può provenire da un ID emesso dal governo, ad esempio un passaporto o una patente di guida, oppure può provenire da una foto di registrazione scattata di persona. Durante la verifica, il rilevamento dell'attività può svolgere un ruolo fondamentale per verificare che l'immagine provenga da una persona reale, non da una foto o una maschera stampata. Per altri dettagli sulla verifica con liveness, vedere l'esercitazione sul liveness. Per la verifica dell'identità senza attività, seguire la guida introduttiva.

Rilevamento dello stato attivo: il rilevamento di liveness è una funzionalità anti-spoofing che controlla se un utente è fisicamente presente davanti alla fotocamera. Viene usato per impedire attacchi di spoofing usando una foto stampata, un video o una maschera 3D del viso dell'utente. Esercitazione su Liveness

Controllo di accesso senza tocco: rispetto ai metodi odierni come carte o biglietti, l'identificazione del viso consenso esplicito consente un'esperienza avanzata di controllo degli accessi riducendo al contempo i rischi per l'igiene e la sicurezza derivanti dalla condivisione, dalla perdita o dal furto delle carte. Il riconoscimento facciale assiste il processo di check-in con un umano nel ciclo per check-in in aeroporti, stadi, parchi a tema, edifici, chioschi di ricevimento presso uffici, ospedali, palestra, club o scuole.

Redaction: redact or blur ha rilevato visi di persone registrate in un video per proteggere la privacy.

Avviso

L'11 giugno 2020 Microsoft ha annunciato che non venderà la tecnologia di riconoscimento facciale ai dipartimenti di polizia degli Stati Uniti fino a quando non verranno adottate norme rigorose, che tengano conto dei diritti umani. Di conseguenza, i clienti non possono usare le funzionalità di riconoscimento facciale o le funzionalità incluse in Servizi di Azure, ad esempio Viso o Video Indexer, se il cliente è un dipartimento di polizia degli Stati Uniti o consente l'uso di tali servizi a tale dipartimento. Quando si crea una nuova risorsa Viso, è necessario confermare e accettare nel portale di Azure che non si userà il servizio da o per un reparto di polizia nel Stati Uniti e di aver esaminato la documentazione dell'intelligenza artificiale responsabile e che userà questo servizio in conformità.

Rilevamento e analisi del volto

Il rilevamento dei volti è necessario come primo passaggio in tutti gli altri scenari. L'API Rileva rileva i visi umani in un'immagine e restituisce le coordinate del rettangolo delle posizioni. Restituisce anche un ID univoco che rappresenta i dati del viso archiviati. Questa operazione viene usata nelle operazioni successive per identificare o verificare i visi.

Facoltativamente, il rilevamento dei visi può estrarre un set di attributi correlati al viso, ad esempio la posizione della testa, l'età, l'emozione, i capelli facciali e gli occhiali. Questi attributi sono stime generali, non classificazioni effettive. Alcuni attributi sono utili per garantire che l'applicazione ottenga dati relativi ai visi di alta qualità quando gli utenti si aggiungono a un servizio Viso. Ad esempio, l'applicazione potrebbe consigliare agli utenti di togliersi occhiali da sole se indossano occhiali da sole.

Attenzione

Microsoft ha ritirato le funzionalità di riconoscimento facciale che possono essere usate per provare a dedurre gli stati emotivi e gli attributi di identità che, se usati in modo improprio, possono essere soggetti a stereotipi, discriminazione o negazione ingiusta dei servizi. Queste includono funzionalità che prevedono emozioni, sesso, età, sorriso, capelli facciali, capelli e trucco. Altre informazioni su questa decisione sono disponibili qui.

Per altre informazioni sul rilevamento e l'analisi dei volti, vedere l'articolo Concetti relativi al rilevamento dei volti. Consultare inoltre la documentazione di riferimento dell'API di rilevamento.

È possibile provare il rilevamento viso in modo rapido e semplice nel browser usando Vision Studio.

Rilevamento dello stato attivo

Importante

Gli SDK del client Viso per il liveness sono una funzionalità controllata. È necessario richiedere l'accesso alla funzionalità di attività compilando il modulo di assunzione riconoscimento del viso. Quando alla sottoscrizione di Azure viene concesso l'accesso, è possibile scaricare Face Liveness SDK.

Il rilevamento di Liveness viso può essere usato per determinare se un viso in un flusso video di input è reale (live) o falso (spoofing). Si tratta di un blocco predefinito fondamentale in un sistema di autenticazione biometrica per evitare attacchi di spoofing da impostori che tentano di ottenere l'accesso al sistema usando una fotografia, un video, una maschera o altri mezzi per rappresentare un'altra persona.

L'obiettivo del rilevamento dell'attività è garantire che il sistema interagisca con una persona fisicamente attiva al momento dell'autenticazione. Tali sistemi sono diventati sempre più importanti con l'aumento delle finanze digitali, del controllo degli accessi remoti e dei processi di verifica delle identità online.

La soluzione di rilevamento del liveness difende con successo da una varietà di tipi di spoofing che vanno da stampe cartacee, maschere 2d/3d e presentazioni di spoofing su telefoni e portatili. Il rilevamento del liveness è un'area attiva di ricerca, con continui miglioramenti apportati per contrastare attacchi di spoofing sempre più sofisticati nel tempo. I miglioramenti continui verranno implementati nel client e i componenti del servizio nel corso del tempo, poiché la soluzione complessiva diventa più affidabile per i nuovi tipi di attacchi.

La nostra soluzione di rilevamento del liveness soddisfa la conformità iBeta Level 1 e 2 ISO/IEC 30107-3.

Esercitazione

Documentazione di riferimento di Face liveness SDK:

Riconoscimento volto

Le aziende e le app moderne possono usare le tecnologie di riconoscimento dei volti, tra cui la verifica del viso ("corrispondenza uno-a-uno) e l'identificazione del viso ("corrispondenza uno-a-molti") per verificare che un utente sia chi dichiara di essere.

Importante

Se si usano prodotti o servizi Microsoft per elaborare i dati biometrici, l'utente è responsabile di: (i) fornire comunicazioni agli interessati, inclusi i periodi di conservazione e la distruzione; (ii) ottenere il consenso da parte degli interessati; e (iii) eliminando i dati biometrici, tutti in base ai requisiti di protezione dei dati applicabili e richiesti. "Dati biometrici" avrà il significato indicato nell'articolo 4 del GDPR e, se applicabile, termini equivalenti in altri requisiti di protezione dei dati. Per informazioni correlate, vedere Dati e privacy per Viso.

Identificazione

L'identificazione del viso può indirizzare la corrispondenza "uno-a-molti" di un viso in un'immagine a un set di visi in un repository sicuro. I candidati di corrispondenza vengono restituiti in base alla precisione con cui i dati del viso corrispondono al viso della query. Questo scenario viene usato per concedere all'edificio o all'aeroporto l'accesso a un determinato gruppo di persone o verificare l'utente di un dispositivo.

L'immagine seguente mostra un esempio di un database denominato "myfriends". Ogni gruppo può contenere fino a 1 milione di oggetti persona diversi. Per ogni oggetto persona è possibile registrare fino a 248 visi.

A grid with three columns for different people, each with three rows of face images

Dopo aver creato ed eseguito il training di un gruppo, è possibile eseguire l'identificazione sul gruppo con un nuovo viso rilevato. Se il viso viene identificato come una persona nel gruppo, viene restituito l'oggetto persona.

Verifica

L'operazione di verifica risponde alla domanda "Queste due facce appartengono alla stessa persona?".

La verifica è anche una corrispondenza "uno-a-uno" di un viso in un'immagine a un singolo viso da un repository o da una foto sicura per verificare che siano gli stessi. La verifica può essere usata per il controllo di accesso, ad esempio un'app bancaria che consente agli utenti di aprire un conto di credito in remoto scattando una nuova immagine di se stessi e inviandola con un'immagine del proprio ID foto. Può anche essere usato come controllo finale sui risultati di una chiamata API di identificazione.

Per altre informazioni sul riconoscimento dei volti, vedere la guida ai concetti relativi al riconoscimento facciale o la documentazione di riferimento sull'API Identificazione e verifica .

Individuare visi simili

L'operazione Trova simile esegue la corrispondenza tra un viso di destinazione e un set di visi candidati, trovando un set più piccolo di visi simili al viso di destinazione. Questo è utile per eseguire una ricerca di volti per immagine.

Il servizio supporta due modalità di lavoro, matchPerson e matchFace. La modalità matchPerson restituisce visi simili dopo aver filtrato in base all'appartenenza alla stessa persona usando l'API di verifica. La modalità matchFace ignora il filtro di appartenenza alla stessa persona. Restituisce un elenco di visi candidati simili, che possono appartenere o meno alla stessa persona.

L'esempio seguente mostra il viso di destinazione:

A woman smiling

E queste immagini sono i visi candidati:

Five images of people smiling. Images A and B show the same person.

Per trovare quattro visi simili, la modalità matchPerson restituisce A e B, che mostrano la stessa persona del viso di destinazione. La modalità matchFace restituisce A, B, C e D, che è esattamente quattro candidati, anche se alcuni non sono la stessa persona del target o hanno una bassa somiglianza. Per altre informazioni, vedere Concetti relativi al riconoscimento del viso o la documentazione di riferimento dell'API di individuazione di visi simili.

Raggruppare i visi

L'operazione Group divide un set di visi sconosciuti in diversi gruppi più piccoli in base alla somiglianza. Ogni gruppo è un subset proprio indipendente del set di visi originale. Restituisce anche una singola matrice "messyGroup" che contiene gli ID viso per i quali non sono state trovate analogie.

È probabile che tutti i visi in un gruppo restituito appartengano alla stessa persona, ma possono esserci diversi gruppi per una singola persona. Tali gruppi sono differenziati in base a un altro fattore, ad esempio l'espressione. Per altre informazioni, vedere Concetti relativi al riconoscimento del viso o la documentazione di riferimento dell'API di raggruppamento.

Requisiti di input

Requisiti generali per l'input dell'immagine:

  • I formati di immagine di input supportati sono JPEG, PNG, GIF (il primo fotogramma), BMP.
  • Le dimensioni del file di immagine non devono superare i 6 MB.

Requisiti di input per il rilevamento dei volti:

  • La dimensione minima del viso rilevabile è di 36 x 36 pixel in un'immagine che non è superiore a 1920 x 1080 pixel. Le immagini con dimensioni superiori a 1920 x 1080 pixel hanno dimensioni minime proporzionalmente maggiori. La riduzione delle dimensioni del viso potrebbe causare il rilevamento di alcuni visi, anche se sono maggiori delle dimensioni minime rilevabili del viso.
  • La dimensione massima del viso rilevabile è 4096 x 4096 pixel.
  • I visi al di fuori dell'intervallo di dimensioni da 36 x 36 a 4096 x 4096 pixel non verranno rilevati.

Requisiti di input per il riconoscimento dei visi:

  • Alcuni visi potrebbero non essere riconosciuti a causa della composizione di foto, ad esempio:
    • Immagini con illuminazione estrema, ad esempio un backlight grave.
    • Ostacoli che bloccano uno o entrambi gli occhi.
    • Differenze nel tipo di capelli o nei capelli facciali.
    • Cambiamenti nell'aspetto facciale a causa dell'età.
    • Espressioni facciali estreme.

Privacy e sicurezza dei dati

Come per tutte le risorse dei servizi di intelligenza artificiale di Azure, gli sviluppatori che usano il servizio Viso devono essere consapevoli dei criteri di Microsoft sui dati dei clienti. Per altre informazioni, vedere la pagina dei servizi di intelligenza artificiale di Azure nel Centro protezione Microsoft.

Passaggi successivi

Seguire una guida di avvio rapido per codificare i componenti di base di un'app di riconoscimento volto nel linguaggio preferito.