Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questo articolo illustra come ottenere informazioni dettagliate sul rilevamento dei volti di Video Indexer per intelligenza artificiale di Azure. Il rilevamento viso trova i visi in un file multimediale e raggruppa visi simili. Il sistema genera informazioni dettagliate sul rilevamento dei visi come elenco categorizzato in un file JSON. Ogni voce include una miniatura e un nome o un ID per ogni volto. Nel portale Web, quando si seleziona l'anteprima di un viso, vengono visualizzati dettagli come il nome della persona (se riconosciuto), la percentuale del video in cui viene visualizzata la persona e la biografia della persona se si tratta di una celebrità. È possibile scorrere le istanze nel video in cui viene visualizzata la persona.
Modello di riconoscimento delle celebrità
Il modello di riconoscimento delle celebrità copre circa 1 milione di volti e si basa su fonti di dati comunemente richieste. I volti che Video Indexer non riconosce come celebrità vengono rilevati ma rimangono senza nome. Puoi creare il tuo modello di persona personalizzato per addestrare Video Indexer a riconoscere volti che non vengono riconosciuti di default.
Importante
Per supportare i principi di intelligenza artificiale responsabile Microsoft, l'accesso alle funzionalità di identificazione, personalizzazione e riconoscimento delle celebrità è limitato e basato su criteri di idoneità e utilizzo. Le funzionalità di identificazione facciale, personalizzazione e riconoscimento delle celebrità sono disponibili per i clienti gestiti da Microsoft e i partner. Per richiedere l'accesso, utilizza il modulo di ingresso per il riconoscimento facciale.
Casi d'uso del rilevamento del volto
La seguente lista descrive esempi di casi d'uso comuni per il rilevamento dei volti:
- Riepilogare dove un attore viene visualizzato in un film o riutilizzare filmati eseguendo una ricerca approfondita di visi specifici negli archivi dell'organizzazione per ottenere informazioni dettagliate su una celebrità specifica.
- Ottieni una maggiore efficienza quando crei reportage speciali in un'agenzia di stampa o sportiva. Esempi includono la ricerca approfondita di una celebrità o di un calciatore negli archivi organizzativi.
- È possibile usare i visi visualizzati in un video per creare promozioni, trailer o evidenziazioni. Video Indexer può facilitare l'aggiunta di fotogrammi chiave, indicatori di scena, timestamp e etichettatura in modo che gli editor di contenuto investono meno tempo durante la revisione di numerosi file.
Termini chiave
Termine | Definizione |
---|---|
Riconoscimento del viso | Analisi delle immagini per identificare i visi visualizzati nelle immagini. Questo processo viene implementato tramite l'API Viso di Intelligenza artificiale di Azure. |
Iscrizione | Processo di registrazione di immagini di singoli utenti per la creazione di modelli in modo che possano essere riconosciuti. Quando una persona viene registrata in un sistema di verifica usato per l'autenticazione, il modello viene associato anche a un identificatore primario. L'identificatore viene usato per determinare quale modello confrontare con il modello di probe. Immagini di alta qualità e immagini che rappresentano variazioni naturali nell'aspetto di una persona (ad esempio, indossando occhiali e senza occhiali) generano modelli di registrazione di alta qualità. |
Modello | Le immagini delle persone iscritte sono convertite in modelli, che vengono poi utilizzati per il riconoscimento facciale. Le caratteristiche interpretabili dalla macchina vengono estratte da una o più immagini di un individuo per creare il modello di quell'individuo. L'API Face non archivia le immagini di registrazione o di verifica. Le immagini originali non possono essere ricostruite in base a un modello. La qualità dei modelli è un fattore determinante per l'accuratezza dei tuoi risultati. |
Visualizza il JSON dell'analisi con il portale web
Dopo aver caricato e indicizzato un video, scaricare informazioni dettagliate in formato JSON dal portale Web.
- Seleziona la scheda Library.
- Seleziona il supporto che desideri.
- Selezionare Download e quindi Insights (JSON). Il file JSON si apre in una nuova scheda del browser.
- Trovare la coppia di chiavi descritta nella risposta di esempio.
Usa l'API
- Usare una richiesta di Get Video Index. Passare
&includeSummarizedInsights=false
. - Trovare le coppie chiave descritte nella risposta di esempio.
Importante
Quando rivedi le rilevazioni del viso nell'interfaccia utente, potresti non vedere tutti i volti che appaiono nel video. Esponiamo solo gruppi di volti che hanno una fiducia superiore a 0,5, e il volto deve apparire per un minimo di 4 secondi o il 10 percento del valore di video_duration
. Solo quando queste condizioni sono soddisfatte mostriamo il volto nell'interfaccia utente e nel file Insights.json. Puoi sempre recuperare tutte le istanze del volto dal file dell'artifact del volto utilizzando l'API: https://api.videoindexer.ai/{location}/Accounts/{accountId}/Videos/{videoId}/ArtifactUrl[?Faces][&accessToken]
.
Risposta di esempio
"faces": [
{
"id": 1785,
"name": "Emily Tran",
"confidence": 0.7855,
"description": null,
"thumbnailId": "fd2720f7-b029-4e01-af44-3baf4720c531",
"knownPersonId": "92b25b4c-944f-4063-8ad4-f73492e42e6f",
"title": null,
"imageUrl": null,
"thumbnails": [
{
"id": "4d182b8c-2adf-48a2-a352-785e9fcd1fcf",
"fileName": "FaceInstanceThumbnail_4d182b8c-2adf-48a2-a352-785e9fcd1fcf.jpg",
"instances": [
{
"adjustedStart": "0:00:00",
"adjustedEnd": "0:00:00.033",
"start": "0:00:00",
"end": "0:00:00.033"
}
]
},
{
"id": "feff177b-dabf-4f03-acaf-3e5052c8be57",
"fileName": "FaceInstanceThumbnail_feff177b-dabf-4f03-acaf-3e5052c8be57.jpg",
"instances": [
{
"adjustedStart": "0:00:05",
"adjustedEnd": "0:00:05.033",
"start": "0:00:05",
"end": "0:00:05.033"
}
]
},
]
}
]
Importante
Leggi la panoramica della nota di trasparenza per tutte le funzionalità VI. Ogni approfondimento ha anche una propria nota sulla trasparenza.
Note sul rilevamento facciale
Il rilevamento del volto è uno strumento per molti settori quando viene utilizzato in modo responsabile e attento. Per rispettare la privacy e la sicurezza degli altri, e per conformarsi alle normative locali e globali, consigliamo di seguire queste linee guida per l'uso:
- Considerate attentamente l'accuratezza dei risultati. Per promuovere un rilevamento più accurato, controlla la qualità del video. Un video di bassa qualità potrebbe influenzare le intuizioni che vengono presentate.
- Si consiglia di esaminare attentamente i risultati se si utilizza il riconoscimento facciale per l'applicazione della legge. Le persone potrebbero non essere rilevate se sono piccole, sedute, accovacciate o ostruite da oggetti o altre persone. Per garantire decisioni eque e di alta qualità, combina l'automazione basata sul rilevamento facciale con la supervisione umana.
- Non utilizzare il rilevamento facciale per decisioni che potrebbero avere impatti seri e negativi. Decisioni basate su risultati errati possono avere effetti gravi e negativi. È consigliabile includere una revisione umana delle decisioni che possano avere impatti seri sulle persone.
Componenti per il rilevamento del volto
La tabella seguente descrive come le immagini in un file multimediale vengono elaborate durante la procedura di rilevamento dei volti.
Componente | Definizione |
---|---|
File sorgente | L'utente carica il file sorgente per l'indicizzazione. |
Rilevamento e aggregazione | Il rilevatore di volti identifica i volti in ogni fotogramma. I volti vengono quindi aggregati e raggruppati. |
Riconoscimento | Il modello di celebrità elabora i gruppi aggregati per riconoscere le celebrità. Se hai creato il tuo modello di persone, esso elabora anche i gruppi per riconoscere altre persone. Se le persone non vengono riconosciute, vengono etichettate come Sconosciuto1, Sconosciuto2, e così via. |
Valore di fiducia | Dove applicabile per volti noti o per volti identificati nella lista personalizzabile, il livello di fiducia stimato di ciascuna etichetta è calcolato come un intervallo da 0 a 1. Il punteggio di affidabilità rappresenta la certezza nell'accuratezza del risultato. Ad esempio, una certezza dell'82 percento è rappresentata come un valore di 0,82. |