Ottieni informazioni sulla rilevazione dei volti.

2025-06-05

Questo articolo illustra come ottenere informazioni dettagliate sul rilevamento dei volti di Video Indexer per intelligenza artificiale di Azure. Il rilevamento viso trova i visi in un file multimediale e raggruppa visi simili. Il sistema genera informazioni dettagliate sul rilevamento dei visi come elenco categorizzato in un file JSON. Ogni voce include una miniatura e un nome o un ID per ogni volto. Nel portale Web, quando si seleziona l'anteprima di un viso, vengono visualizzati dettagli come il nome della persona (se riconosciuto), la percentuale del video in cui viene visualizzata la persona e la biografia della persona se si tratta di una celebrità. È possibile scorrere le istanze nel video in cui viene visualizzata la persona.

Modello di riconoscimento delle celebrità

Il modello di riconoscimento delle celebrità copre circa 1 milione di volti e si basa su fonti di dati comunemente richieste. I volti che Video Indexer non riconosce come celebrità vengono rilevati ma rimangono senza nome. Puoi creare il tuo modello di persona personalizzato per addestrare Video Indexer a riconoscere volti che non vengono riconosciuti di default.

Importante

Per supportare i principi di intelligenza artificiale responsabile Microsoft, l'accesso alle funzionalità di identificazione, personalizzazione e riconoscimento delle celebrità è limitato e basato su criteri di idoneità e utilizzo. Le funzionalità di identificazione facciale, personalizzazione e riconoscimento delle celebrità sono disponibili per i clienti gestiti da Microsoft e i partner. Per richiedere l'accesso, utilizza il modulo di ingresso per il riconoscimento facciale.

Casi d'uso del rilevamento del volto

La seguente lista descrive esempi di casi d'uso comuni per il rilevamento dei volti:

Riepilogare dove un attore viene visualizzato in un film o riutilizzare filmati eseguendo una ricerca approfondita di visi specifici negli archivi dell'organizzazione per ottenere informazioni dettagliate su una celebrità specifica.
Ottieni una maggiore efficienza quando crei reportage speciali in un'agenzia di stampa o sportiva. Esempi includono la ricerca approfondita di una celebrità o di un calciatore negli archivi organizzativi.
È possibile usare i visi visualizzati in un video per creare promozioni, trailer o evidenziazioni. Video Indexer può facilitare l'aggiunta di fotogrammi chiave, indicatori di scena, timestamp e etichettatura in modo che gli editor di contenuto investono meno tempo durante la revisione di numerosi file.

Termini chiave

Termine	Definizione
Riconoscimento del viso	Analisi delle immagini per identificare i visi visualizzati nelle immagini. Questo processo viene implementato tramite l'API Viso di Intelligenza artificiale di Azure.
Iscrizione	Processo di registrazione di immagini di singoli utenti per la creazione di modelli in modo che possano essere riconosciuti. Quando una persona viene registrata in un sistema di verifica usato per l'autenticazione, il modello viene associato anche a un identificatore primario. L'identificatore viene usato per determinare quale modello confrontare con il modello di probe. Immagini di alta qualità e immagini che rappresentano variazioni naturali nell'aspetto di una persona (ad esempio, indossando occhiali e senza occhiali) generano modelli di registrazione di alta qualità.
Modello	Le immagini delle persone iscritte sono convertite in modelli, che vengono poi utilizzati per il riconoscimento facciale. Le caratteristiche interpretabili dalla macchina vengono estratte da una o più immagini di un individuo per creare il modello di quell'individuo. L'API Face non archivia le immagini di registrazione o di verifica. Le immagini originali non possono essere ricostruite in base a un modello. La qualità dei modelli è un fattore determinante per l'accuratezza dei tuoi risultati.

Visualizza il JSON dell'analisi con il portale web

Dopo aver caricato e indicizzato un video, scaricare informazioni dettagliate in formato JSON dal portale Web.

Seleziona la scheda Library.
Seleziona il supporto che desideri.
Selezionare Download e quindi Insights (JSON). Il file JSON si apre in una nuova scheda del browser.
Trovare la coppia di chiavi descritta nella risposta di esempio.

Usa l'API

Usare una richiesta di Get Video Index. Passare &includeSummarizedInsights=false.
Trovare le coppie chiave descritte nella risposta di esempio.

Importante

Quando rivedi le rilevazioni del viso nell'interfaccia utente, potresti non vedere tutti i volti che appaiono nel video. Esponiamo solo gruppi di volti che hanno una fiducia superiore a 0,5, e il volto deve apparire per un minimo di 4 secondi o il 10 percento del valore di video_duration. Solo quando queste condizioni sono soddisfatte mostriamo il volto nell'interfaccia utente e nel file Insights.json. Puoi sempre recuperare tutte le istanze del volto dal file dell'artifact del volto utilizzando l'API: https://api.videoindexer.ai/{location}/Accounts/{accountId}/Videos/{videoId}/ArtifactUrl[?Faces][&accessToken].

Risposta di esempio

    "faces": [
        {
        "id": 1785,
        "name": "Emily Tran",
        "confidence": 0.7855,
        "description": null,
        "thumbnailId": "fd2720f7-b029-4e01-af44-3baf4720c531",
        "knownPersonId": "92b25b4c-944f-4063-8ad4-f73492e42e6f",
        "title": null,
        "imageUrl": null,
        "thumbnails": [
            {
            "id": "4d182b8c-2adf-48a2-a352-785e9fcd1fcf",
            "fileName": "FaceInstanceThumbnail_4d182b8c-2adf-48a2-a352-785e9fcd1fcf.jpg",
            "instances": [
                {
                "adjustedStart": "0:00:00",
                "adjustedEnd": "0:00:00.033",
                "start": "0:00:00",
                "end": "0:00:00.033"
                }
            ]
            },
            {
            "id": "feff177b-dabf-4f03-acaf-3e5052c8be57",
            "fileName": "FaceInstanceThumbnail_feff177b-dabf-4f03-acaf-3e5052c8be57.jpg",
            "instances": [
                {
                "adjustedStart": "0:00:05",
                "adjustedEnd": "0:00:05.033",
                "start": "0:00:05",
                "end": "0:00:05.033"
                }
            ]
            },
        ]
        }
    ]

Importante

Leggi la panoramica della nota di trasparenza per tutte le funzionalità VI. Ogni approfondimento ha anche una propria nota sulla trasparenza.

Note sul rilevamento facciale

Il rilevamento del volto è uno strumento per molti settori quando viene utilizzato in modo responsabile e attento. Per rispettare la privacy e la sicurezza degli altri, e per conformarsi alle normative locali e globali, consigliamo di seguire queste linee guida per l'uso:

Considerate attentamente l'accuratezza dei risultati. Per promuovere un rilevamento più accurato, controlla la qualità del video. Un video di bassa qualità potrebbe influenzare le intuizioni che vengono presentate.
Si consiglia di esaminare attentamente i risultati se si utilizza il riconoscimento facciale per l'applicazione della legge. Le persone potrebbero non essere rilevate se sono piccole, sedute, accovacciate o ostruite da oggetti o altre persone. Per garantire decisioni eque e di alta qualità, combina l'automazione basata sul rilevamento facciale con la supervisione umana.
Non utilizzare il rilevamento facciale per decisioni che potrebbero avere impatti seri e negativi. Decisioni basate su risultati errati possono avere effetti gravi e negativi. È consigliabile includere una revisione umana delle decisioni che possano avere impatti seri sulle persone.

Componenti per il rilevamento del volto

La tabella seguente descrive come le immagini in un file multimediale vengono elaborate durante la procedura di rilevamento dei volti.

Componente	Definizione
File sorgente	L'utente carica il file sorgente per l'indicizzazione.
Rilevamento e aggregazione	Il rilevatore di volti identifica i volti in ogni fotogramma. I volti vengono quindi aggregati e raggruppati.
Riconoscimento	Il modello di celebrità elabora i gruppi aggregati per riconoscere le celebrità. Se hai creato il tuo modello di persone, esso elabora anche i gruppi per riconoscere altre persone. Se le persone non vengono riconosciute, vengono etichettate come Sconosciuto1, Sconosciuto2, e così via.
Valore di fiducia	Dove applicabile per volti noti o per volti identificati nella lista personalizzabile, il livello di fiducia stimato di ciascuna etichetta è calcolato come un intervallo da 0 a 1. Il punteggio di affidabilità rappresenta la certezza nell'accuratezza del risultato. Ad esempio, una certezza dell'82 percento è rappresentata come un valore di 0,82.

Esempio di codice

Visualizza tutti i campioni per VI

Condividi tramite

Ottieni informazioni sulla rilevazione dei volti.

Modello di riconoscimento delle celebrità

Casi d'uso del rilevamento del volto

Termini chiave

Visualizza il JSON dell'analisi con il portale web

Usa l'API

Risposta di esempio

Note sul rilevamento facciale

Componenti per il rilevamento del volto

Esempio di codice

Commenti e suggerimenti

Risorse aggiuntive