Condividi tramite


Dati, privacy e sicurezza per il servizio OpenAI di Azure

Importante

Le traduzioni non in inglese sono disponibili solo per praticità. Consultare la EN-US versione di questo documento per la versione vincolante.

Questo articolo fornisce informazioni dettagliate sul modo in cui i dati forniti dall'utente al servizio Azure OpenAI vengono elaborati, usati e archiviati. Azure OpenAI archivia ed elabora i dati per fornire il servizio e monitorare gli usi che violano le condizioni del prodotto applicabili. Vedere anche l'Addendum Microsoft Products and Services Data Protection, che regola l'elaborazione dei dati da parte del servizio OpenAI di Azure. Azure OpenAI è un servizio di Azure; Altre informazioni sulle offerte di conformità di Azure applicabili.

Importante

Le richieste (input) e i completamenti (output), gli incorporamenti e i dati di training:

  • NON sono disponibili per altri clienti.
  • NON sono disponibili per OpenAI.
  • NON vengono usati per migliorare i modelli OpenAI.
  • NON vengono usati per addestrare, riaddestrare o migliorare i modelli di base del servizio Azure OpenAI.
  • NON vengono utilizzati per migliorare prodotti o servizi microsoft o di terze parti senza l'autorizzazione o l'istruzione dell'utente.
  • I modelli di Azure OpenAI ottimizzati sono disponibili esclusivamente per l'uso personale.

Il servizio OpenAI di Azure viene gestito da Microsoft come servizio di Azure; Microsoft ospita i modelli OpenAI nell'ambiente Azure di Microsoft e il servizio non interagisce con alcun servizio gestito da OpenAI (ad esempio ChatGPT o l'API OpenAI).

Quali dati vengono elaborati dal servizio Azure OpenAI?

Azure OpenAI elabora i tipi di dati seguenti:

  • Richieste e contenuti generati. Le richieste vengono inviate dall'utente e il contenuto viene generato dal servizio, tramite i completamenti, i completamenti delle chat, le immagini e le operazioni di incorporamento.
  • Dati caricati. È possibile fornire dati personalizzati per l'uso con determinate funzionalità del servizio (ad esempio, ottimizzazione, API assistenti, elaborazione batch) usando l'API File o l'archivio vettoriale.
  • Dati per le entità con stato. Quando si usano alcune funzionalità facoltative del servizio Azure OpenAI, ad esempio la funzionalità Thread dell'API Assistants e i completamenti archiviati, il servizio crea un archivio dati per rendere persistente la cronologia dei messaggi e altri contenuti, in base alla modalità di configurazione della funzionalità.
  • Dati aumentati inclusi con o tramite richieste. Quando si usano dati associati a entità con stato, il servizio recupera i dati pertinenti dall'archivio dati configurato e aumenta la richiesta di produrre generazioni basate sui dati. Le richieste possono anche essere arricchite con dati recuperati da una fonte inclusa nel prompt stesso, ad esempio un URL.
  • Dati di allenamento e convalida. È possibile fornire dati di training personalizzati costituiti da coppie di completamento prompt ai fini dell'ottimizzazione di un modello OpenAI.

In che modo il servizio OpenAI di Azure elabora i dati?

Il diagramma seguente illustra come vengono elaborati i dati. Questo diagramma illustra diversi tipi di elaborazione:

  1. In che modo il servizio Azure OpenAI elabora i tuoi prompt tramite inferenza per generare contenuto (incluso quando vengono aggiunti dati extra da un'origine dati designata a un prompt utilizzando Azure OpenAI sui tuoi dati, Assistenti o elaborazione batch).
  2. Come la funzione Assistants archivia i dati in relazione a Messaggi, Thread ed Esecuzioni.
  3. Come la funzionalità Batch elabora i dati caricati.
  4. Come il servizio Azure OpenAI crea un modello ottimizzato (personalizzato) con i dati caricati.
  5. In che modo il servizio OpenAI di Azure e il personale Microsoft analizzano richieste e completamenti (testo e immagine) per contenuti dannosi e per i modelli che suggeriscono l'uso del servizio in modo da violare il Codice di comportamento o altri termini del prodotto applicabili.

Diagramma del flusso di dati per il servizio.

Come illustrato nel diagramma precedente, i clienti gestiti possono applicare per modificare il monitoraggio degli abusi.

Generazione di completamenti, immagini o incorporamenti tramite l'inferenza

I modelli (base o ottimizzati) distribuiti nella vostra risorsa elaborano i richiami di input e generano risposte con testo, immagini o embedding. Le interazioni dei clienti con il modello sono logicamente isolate e protette usando misure tecniche, tra cui, ad esempio, la crittografia del trasporto di TLS1.2 o versione successiva, il perimetro di sicurezza di calcolo, la tokenizzazione del testo e l'accesso esclusivo alla memoria GPU allocata. I prompt e i completamenti vengono valutati in tempo reale per i tipi di contenuto dannosi e la generazione di contenuto viene filtrata in base alle soglie configurate. Per altre informazioni, vedere Filtro del contenuto del servizio OpenAI di Azure.

Le richieste e le risposte vengono elaborate all'interno dell'area geografica specificata dal cliente (a meno che non si usi un tipo di distribuzione globale), ma possono essere elaborate tra aree all'interno dell'area geografica a scopo operativo (incluse le prestazioni e la gestione della capacità). Vedere di seguito per informazioni sulla posizione di elaborazione quando si usa un tipo di distribuzione globale.

I modelli sono senza stato: nel modello non vengono archiviate richieste o generazioni. Le richieste e le generazioni non vengono inoltre usate per eseguire il training, ripetere il training o migliorare i modelli di base.

Informazioni sulla posizione di elaborazione per i tipi di distribuzione "Global" e "Data zone"

Oltre alle distribuzioni standard, il servizio Azure OpenAI offre opzioni di distribuzione etichettate come "Global" e "DataZone". Per qualsiasi tipo di distribuzione etichettato come "Global", le richieste e le risposte possono essere elaborate in qualsiasi area geografica in cui viene distribuito il modello di Azure OpenAI pertinente. Altre informazioni sulla disponibilità a livello di area dei modelli. Per qualsiasi tipo di distribuzione etichettato come "DataZone", le richieste e le risposte possono essere elaborate in qualsiasi area geografica all'interno della zona dati specificata, come definito da Microsoft. Se si crea una distribuzione DataZone in una risorsa di Azure OpenAI che si trova negli Stati Uniti, è possibile che le richieste e risposte vengano elaborate ovunque all'interno del Stati Uniti. Se si crea una distribuzione DataZone in una risorsa di Azure OpenAI che si trova in una nazione membro dell'Unione europea, è possibile che le richieste e risposte vengano elaborate in tale paese o in qualsiasi altra nazione membro dell'Unione europea. Per i tipi di distribuzione Global e DataZone, tutti i dati archiviati inattivi, ad esempio i dati caricati, vengono archiviati nell'area geografica designata dal cliente. Solo la posizione di elaborazione è interessata quando un cliente usa un tipo di distribuzione Global o un tipo di distribuzione DataZone nel servizio OpenAI di Azure. Gli impegni di elaborazione e conformità dei dati di Azure rimangono applicabili.

Potenziare i prompt per basare i risultati generati sui tuoi dati

La funzionalità "on your data" di Azure OpenAI consente di connettere le fonti di dati per basare i risultati generati sui tuoi dati. I dati rimangono archiviati nell'origine dati e nella posizione designata; Il servizio Azure OpenAI non crea un archivio dati duplicato. Quando viene ricevuta una richiesta dell'utente, il servizio recupera i dati pertinenti dall'origine dati connessa e aumenta la richiesta. Il modello elabora questa richiesta aumentata e il contenuto generato viene restituito come descritto in precedenza. Altre informazioni su come usare la funzionalità On Your Data in modo sicuro.

Archiviazione dei dati per le funzionalità del servizio OpenAI di Azure

Alcune funzionalità del servizio OpenAI di Azure archiviano dati nel servizio. Questi dati vengono caricati dal cliente, usando l'API File o l'archivio vettoriale, o vengono archiviati automaticamente in connessione con determinate entità con stato, ad esempio la funzionalità Threads dell'API Assistants e i completamenti archiviati. I dati archiviati per le funzionalità del servizio OpenAI di Azure:

  • Viene archiviato inattivo nella risorsa OpenAI di Azure nel tenant di Azure del cliente, all'interno della stessa area geografica della risorsa OpenAI di Azure;
  • È sempre crittografato inattivo con la crittografia AES-256 di Microsoft per impostazione predefinita, con la possibilità di usare una chiave gestita dal cliente (alcune funzionalità di anteprima potrebbero non supportare le chiavi gestite dal cliente).
  • Possono essere eliminati dal cliente in qualsiasi momento.

Annotazioni

Le funzionalità OpenAI di Azure in anteprima potrebbero non supportare tutte le condizioni precedenti.

I dati archiviati possono essere usati con le funzionalità/funzionalità del servizio seguenti:

  • Creazione di un modello personalizzato (ottimizzato). Ulteriori informazioni su come funziona la messa a punto. I modelli ottimizzati sono disponibili esclusivamente per il cliente i cui dati sono stati usati per creare il modello ottimizzato, vengono crittografati inattivi (quando non vengono distribuiti per l'inferenza) e possono essere eliminati dal cliente in qualsiasi momento. I dati di training caricati per l'ottimizzazione non vengono usati per eseguire il training, ripetere il training o migliorare i modelli di base Microsoft o di terze parti.
  • Elaborazione batch. Altre informazioni sul funzionamento dell'elaborazione batch. L'elaborazione batch è un tipo di distribuzione globale; i dati archiviati inattivi rimangono nell'area geografica di Azure designata fino a quando non diventa disponibile la capacità di elaborazione; l'elaborazione può verificarsi in qualsiasi area geografica in cui viene distribuito il modello OpenAI di Azure pertinente (altre informazioni sulla disponibilità dell'area dei modelli).
  • API degli Assistenti (anteprima) Altre informazioni sul funzionamento dell'API Assistants. Alcune funzionalità di Assistenti, ad esempio Thread, archivia cronologia messaggi e altri contenuti.
  • Completamenti archiviati (anteprima). I completamenti archiviati memorizzano le coppie di input-output dai modelli Azure OpenAI distribuiti dal cliente, come GPT-4o, tramite l'API di completamento della chat e visualizzano le coppie nel portale di Azure AI Foundry. Ciò consente ai clienti di creare set di dati con i dati di produzione, che possono quindi essere usati per la valutazione o l'ottimizzazione dei modelli (come consentito nelle Condizioni di prodotto applicabili).

Prevenzione dell'abuso e generazione di contenuti dannosi

Per ridurre il rischio di uso dannoso del servizio Azure OpenAI, il servizio Azure OpenAI include sia funzionalità di filtro del contenuto che di monitoraggio degli abusi. Per altre informazioni sul filtro del contenuto, vedere Filtro del contenuto del servizio OpenAI di Azure. Per altre informazioni sul monitoraggio degli abusi, vedere Monitoraggio degli abusi.

Il filtro del contenuto si verifica in modo sincrono quando i processi del servizio richiedono di generare contenuto come descritto in precedenza e qui. Nessuna richiesta o contenuto generato viene archiviato nei modelli di classificatore di contenuto e i prompt e gli output non vengono usati per eseguire il training, ripetere il training o migliorare i modelli di classificatore senza il consenso dell'utente.

Le valutazioni di sicurezza dei modelli ottimizzati valutano un modello ottimizzato per le risposte potenzialmente dannose usando le metriche di sicurezza e rischio di Azure. Solo la valutazione risultante (distribuibile o non distribuibile) viene registrata dal servizio.

Il sistema di monitoraggio degli abusi di Azure OpenAI è progettato per rilevare e attenuare le istanze di contenuto ricorrente e/o comportamenti che suggeriscono l'uso del servizio in modo che possa violare il codice di comportamento o altri termini del prodotto applicabili. Come descritto qui, il sistema usa algoritmi ed euristica per rilevare gli indicatori di potenziali abusi. Quando vengono rilevati questi indicatori, è possibile selezionare un campione di richieste e completamenti del cliente per la revisione. La revisione viene condotta da LLM per impostazione predefinita, con revisioni aggiuntive da parte dei revisori umani in base alle esigenze. Informazioni dettagliate sull'intelligenza artificiale e sulla revisione umana sono disponibili in Monitoraggio degli abusi del servizio OpenAI di Azure.

Per la revisione dell'intelligenza artificiale, le richieste e i completamenti dei clienti non vengono archiviati dal sistema o usati per eseguire il training dell'LLM o di altri sistemi. Per la revisione umana, l'archivio dati in cui vengono archiviati i prompt e i completamenti è separato logicamente dalla risorsa del cliente( ogni richiesta include l'ID risorsa della risorsa Azure OpenAI del cliente). Un archivio dati separato si trova in ogni area geografica in cui è disponibile il servizio Azure OpenAI e i prompt e i contenuti generati di un cliente vengono archiviati nell'area geografica di Azure in cui viene distribuita la risorsa del servizio Azure OpenAI del cliente, entro il limite del servizio Azure OpenAI. I revisori umani che valutano potenziali abusi possono accedere ai dati relativi a richieste e completamenti solo quando tali dati sono già stati contrassegnati dal sistema di monitoraggio degli abusi. I revisori umani sono dipendenti Microsoft autorizzati che accedono ai dati tramite query basate su punti usando ID richiesta, workstation di accesso sicuro e richieste JIT (Just-In-Time) concesse dai responsabili del team. Per il servizio Azure OpenAI distribuito nell'Area economica europea, i dipendenti Microsoft autorizzati si trovano nell'Area economica europea.

Se il cliente è stato approvato per il monitoraggio degli abusi modificati (altre informazioni sul monitoraggio degli abusi del servizio OpenAI di Azure), Microsoft non archivia le richieste e i completamenti associati alle sottoscrizioni di Azure approvate e il processo di revisione umana descritto in precedenza non è possibile e non viene eseguito. È tuttavia possibile eseguire comunque una revisione dell'intelligenza artificiale, sfruttando i modelli linguistici di grandi dimensioni (LLM) che esaminano le richieste e i completamenti forniti o generati in quel momento, a seconda delle esigenze.

Annotazioni

Le funzionalità di anteprima di Azure, inclusi i modelli OpenAI di Azure in anteprima, possono usare procedure di privacy diverse, tra cui il monitoraggio degli abusi. Le anteprime possono essere soggette a condizioni supplementari all'indirizzo: Condizioni supplementari per l'utilizzo per le anteprime di Microsoft Azure.

In che modo un cliente può verificare se l'archiviazione dei dati per il monitoraggio degli abusi è disattivata?

Esistono due modi per i clienti, una volta approvati per disattivare il monitoraggio degli abusi, per verificare che l'archiviazione dei dati per il monitoraggio degli abusi sia stata disattivata nella sottoscrizione di Azure approvata:

  • Uso del portale di Azure o
  • Interfaccia della riga di comando di Azure (o qualsiasi API di gestione).

Annotazioni

Il valore "false" per l'attributo "ContentLogging" viene visualizzato solo se l'archiviazione dei dati per il monitoraggio degli abusi è disattivata. In caso contrario, questa proprietà non verrà visualizzata nel portale di Azure o nell'output dell'interfaccia della riga di comando di Azure.

Prerequisiti

  1. Accesso ad Azure
  2. Selezionare la sottoscrizione di Azure che ospita la risorsa del servizio OpenAI di Azure.
  3. Passare alla pagina Panoramica della risorsa del servizio Azure OpenAI.
  1. Passare alla pagina Panoramica della risorsa

  2. Fare clic sul collegamento visualizzazione JSON nell'angolo superiore destro, come illustrato nell'immagine seguente.

    Visualizzazione JSON dello stato di registrazione nel portale di Azure.

Nell'elenco Funzionalità sarà presente un valore denominato "ContentLogging", che verrà visualizzato e impostato su FALSE quando la registrazione per il monitoraggio degli abusi è disattivata.

{ 
    "name":"ContentLogging",
    "value":"false"
}

Per altre informazioni sull'impegno per la privacy e la sicurezza di Microsoft, vedere il Centro protezione Microsoft.

Log delle modifiche

Dati Cambiamenti
17 dicembre 2024 Sono state aggiunte informazioni sull'elaborazione dei dati e l'archiviazione in connessione con la nuova funzionalità Completamenti archiviati; aggiunta del linguaggio che chiarisce che le funzionalità openAI di Azure in anteprima potrebbero non supportare tutte le condizioni di archiviazione dei dati; rimozione della designazione "anteprima" per l'elaborazione batch
18 novembre 2024 Sono state aggiunte informazioni sulla posizione dell'elaborazione dei dati per i nuovi tipi di distribuzione "Zona dati". sono state aggiunte informazioni sulla nuova revisione dell'IA delle richieste e dei completamenti nell'ambito della prevenzione dell'abuso e della generazione di contenuti dannosi
4 settembre 2024 Sono state aggiunte informazioni (e modificato il testo esistente di conseguenza) sull'elaborazione dei dati per le nuove funzionalità, tra cui l'API Assistants (anteprima), Batch (anteprima) e le distribuzioni globali; linguaggio modificato relativo alla posizione del trattamento dei dati, in conformità ai principi di residenza dei dati di Azure; sono state aggiunte informazioni sull'elaborazione dei dati per le valutazioni di sicurezza dei modelli ottimizzati; chiarimento degli impegni relativi all'uso di richieste e completamenti; revisioni secondarie per migliorare la chiarezza
23 giugno 2023 Aggiunta di informazioni sull'elaborazione dei dati per la nuova funzionalità di Azure sui dati; sono state rimosse informazioni sul monitoraggio degli abusi, ora disponibile in Monitoraggio degli abusi del servizio OpenAI di Azure. Aggiunta della nota di riepilogo. Contenuto aggiornato e semplificato e diagrammi aggiornati per maggiore chiarezza. aggiunto il log delle modifiche

Vedere anche