Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Le traduzioni non in inglese sono disponibili solo per praticità. Consultare la EN-US
versione di questo documento per la versione vincolante.
Annotazioni
Questo articolo viene fornito solo a scopo informativo e non allo scopo di fornire consulenza legale. Quando si implementa il riconoscimento del parlante, è consigliabile richiedere consulenza legale specializzata.
Sebbene la funzionalità Riconoscimento del parlante sia stata progettata tenendo conto della conformità, della privacy e della sicurezza, l'utente è responsabile dell'uso e dell'implementazione di questa tecnologia. Tenere presente che le leggi che regolano le tecnologie di riconoscimento biometrico spesso variano a livello internazionale e nazionale, tra cui a livello federale, statale e locale. Oltre a regolare i casi d'uso consentiti, alcune giurisdizioni impongono requisiti legali speciali per le autorizzazioni che regolano la raccolta, il trasferimento, l'elaborazione online e l'archiviazione dei dati biometrici, in particolare quando vengono usati per l'identificazione o la verifica. Prima di usare Riconoscimento del parlante e Azure per raccogliere, trasferire, elaborare e archiviare i dati biometrici di qualsiasi interessato, è necessario garantire la conformità ai requisiti legali pertinenti applicabili all'applicazione di servizio.
Annotazioni
Per comodità del cliente, si prega di considerare l'utilizzo della seguente informativa relativa al ruolo di Microsoft quando si utilizza il riconoscimento del parlante dei servizi di intelligenza artificiale di Azure con gli utenti finali.
[Società] usa la tecnologia Riconoscimento del parlante Microsoft per elaborare i dati biometrici degli utenti della [Società] come provider di servizi ("Responsabile del trattamento"). Microsoft può elaborare e archiviare le firme audio e vocali della registrazione ai fini della verifica dell'altoparlante e/o dei servizi di identificazione per conto della [società], e solo come indicato da [Società]. Microsoft archivierà questi dati a condizione che [Società] richieda che non siano più di un periodo di tolleranza limitato dopo la data in cui (i) [Società] smette di avere una relazione con Microsoft o (ii) quando [Società] richiede l'eliminazione.
Quali dati vengono elaborati dal riconoscimento del parlante?
Riconoscimento del parlante elabora i tipi di dati seguenti:
Audio di iscrizione: Prima dell'iscrizione, i clienti richiedono un GUID casuale dal servizio. Durante la fase di registrazione, i clienti inviano l'input audio di un altoparlante e il GUID per generare una firma vocale e una corrispondenza di firma passphrase.
Firma vocale registrata: Si tratta del vettore numerico che rappresenta le caratteristiche vocali di un singolo altoparlante, estratto dalle registrazioni audio.
Firma passphrase: Si tratta di una frase predefinita, ad esempio "La mia voce è il mio profilo". Durante la registrazione di un altoparlante, l'audio di registrazione verrà elaborato tramite il servizio Voce di Intelligenza artificiale di Azure per verificare che il testo da tale audio corrisponda alla passphrase richiesta.
Audio di riconoscimento: Dopo la registrazione degli altoparlanti del cliente, il cliente invia l'input audio insieme ai GUID pertinenti da elaborare per la funzionalità Riconoscimento del parlante e le firme vocali per determinare se l'audio corrisponde alle firme vocali degli altoparlanti registrati. Se si usa la verifica voce dipendente dal testo, anche la firma della passphrase viene trascritta dal riconoscimento vocale per determinare se esiste una corrispondenza con la passphrase.
In che modo il riconoscimento del parlante elabora questi dati?
Sistema di verifica dell'altoparlante dipendente dal testo:
- Fase di registrazione: La voce dell'altoparlante viene registrata pronunciando una passphrase da un set di frasi predefinite. Riconoscimento del parlante estrae le funzionalità vocali da queste registrazioni audio per formare una firma vocale univoca e il testo della passphrase scelta viene verificato tramite il riconoscimento vocale. Sia la firma vocale che la passphrase vengono archiviate per la fase di riconoscimento.
- Fase di riconoscimento: Il parlante deve pronunciare la stessa passphrase dalla fase di registrazione. Durante la fase di riconoscimento, Riconoscimento del Parlante estrae le caratteristiche vocali dall'audio e riconosce la passphrase nell'audio. Il servizio confronta quindi sia le caratteristiche vocali che la passphrase rispetto alla firma vocale e alla firma della passphrase nel record. Solo quando sia la voce che la passphrase corrispondono alla firma vocale registrata e alla firma passphrase ottenendo la soglia di corrispondenza, la risposta restituisce Accept e fornisce un punteggio di somiglianza.
Sistema di verifica o identificazione dell'altoparlante indipendente dal testo:
- Fase di attivazione e registrazione: Riconoscimento del parlante estrae le funzionalità vocali dall'audio di registrazione di un altoparlante per formare una firma vocale univoca. La registrazione prevede due passaggi:
Nel passaggio di attivazione quando è abilitata la registrazione attiva, la voce dell'altoparlante viene registrata dicendo una frase di attivazione definita da Microsoft. Il testo della frase di attivazione viene trascritto usando la tecnologia di riconoscimento vocale fornita da Riconoscimento vocale di Azure e quindi confrontato con la frase di attivazione predefinita. Se viene trovata una corrispondenza, l'audio della frase di attivazione viene archiviato come firma vocale. A differenza della passphrase nel sistema dipendente dal testo, il testo della frase di attivazione non verrà archiviato.
Il parlante può continuare a registrarsi parlando nella lingua di tutti i giorni per migliorare le prestazioni di verifica o identificazione future. Questo passaggio è facoltativo ma consigliato. Dopo il passaggio di attivazione, non esiste alcuna restrizione su ciò che l'altoparlante dice nell'audio. Il contenuto vocale non verrà elaborato, solo la firma vocale verrà estratta e archiviata per la fase di riconoscimento.
- Fase di riconoscimento: Dopo la fase di attivazione e registrazione, il cliente può inviare audio alla funzionalità Riconoscimento del parlante. Riconoscimento del parlante estrae le funzionalità vocali dall'audio. Per il sistema di identificazione del parlatore, il Riconoscimento del parlatore confronta queste caratteristiche vocali con un elenco di firme vocali associate ai GUID specificati, uno per uno. Il servizio classifica quindi l'elenco dei GUID in base ai punteggi di somiglianza e restituisce fino a cinque GUID e i relativi punteggi di somiglianza. Per il sistema di verifica del parlante, il riconoscimento del parlante confronta queste caratteristiche vocali con la firma vocale nei registri. Quando la voce corrisponde alla firma vocale registrata ottenendo la soglia di corrispondenza, la risposta restituisce Accetta e fornisce un punteggio di somiglianza.
- Fase di attivazione e registrazione: Riconoscimento del parlante estrae le funzionalità vocali dall'audio di registrazione di un altoparlante per formare una firma vocale univoca. La registrazione prevede due passaggi:
Come vengono conservati i dati e quali sono i controlli dei clienti disponibili?
Le informazioni di registrazione, firme audio e vocali, e le passphrase vengono archiviate in modo sicuro nel tenant di Azure del cliente. Questi dati sono associati solo a GUID casuali e Microsoft non è in grado di connettere nomi dei clienti, ID (diversi dal GUID casuale) o altre informazioni personali all'audio di registrazione, alle firme vocali o alle firme delle frasi di accesso. Gli sviluppatori possono creare, aggiornare ed eliminare i dati di registrazione (sia la firma vocale che l'audio di registrazione correlato) per singoli altoparlanti tramite chiamate API. Quando la sottoscrizione viene eliminata, vengono eliminati anche tutti i dati di registrazione vocale associati alla sottoscrizione. Nella tabella seguente vengono riepilogati i controlli e la conservazione dei dati di Riconoscimento del parlante.
Tipo di dati | Conservazione | Controlli dei clienti |
---|---|---|
Audio di iscrizione | Microsoft assegna GUID generati in modo casuale (identificatori univoci globali) all'audio di iscrizione per ogni singolo utente. Questo GUID è associato anche alla firma vocale. | È possibile gestire ed eliminare tutti i dati archiviati associati a qualsiasi SINGOLO GUID o a tutti i GUID. |
Firma vocale registrata | Microsoft assegna un identificatore univoco generato in modo casuale a ogni firma vocale registrata. | È possibile gestire ed eliminare tutti i dati archiviati associati a qualsiasi SINGOLO GUID o a tutti i GUID. |
Firma della passphrase | Per la registrazione dipendente dal testo, la firma passphrase viene archiviata come testo insieme alla firma vocale. | È possibile gestire ed eliminare tutti i dati archiviati associati a qualsiasi SINGOLO GUID o a tutti i GUID. |
Audio di riconoscimento | L'audio inviato al servizio non viene archiviato dopo l'analisi della firma vocale. | Non esistono controlli cliente per questo tipo di dati. |
Per altre informazioni sugli impegni relativi alla privacy e alla sicurezza, vedere il Centro protezione Microsoft.