Che cos'è il rilevamento delle informazioni personali (PII) nel linguaggio di intelligenza artificiale di Azure?

Articolo
02/01/2024

Il rilevamento delle informazioni personali è una delle funzionalità offerte dal linguaggio di intelligenza artificiale di Azure, una raccolta di algoritmi di Machine Learning e intelligenza artificiale nel cloud per lo sviluppo di applicazioni intelligenti che coinvolgono il linguaggio scritto. La funzionalità di rilevamento delle informazioni personali consente di identificare, classificare e redattire le informazioni riservate in testo non strutturato. Ad esempio: numeri di telefono, indirizzi di posta elettronica e forme di identificazione. Il metodo per l'utilizzo delle informazioni personali nelle conversazioni è diverso da altri casi d'uso e gli articoli per questo uso sono separati.

Le guide introduttive sono istruzioni introduttive che consentono di eseguire richieste al servizio.
Le guide pratiche contengono istruzioni per l'uso del servizio in modi più specifici o personalizzati.
Gli articoli concettuali forniscono spiegazioni approfondite delle funzionalità e delle funzionalità del servizio.

Le informazioni personali vengono inserite in due forme:

INFORMAZIONI personali : funziona su testo non strutturato.
Informazioni personali di conversazione (anteprima): modello personalizzato per lavorare sulla trascrizione della conversazione.

Flusso di lavoro tipico

Per usare questa funzionalità, inviare i dati per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione aggiunta al modello usato nei dati.

Creare una risorsa del linguaggio di intelligenza artificiale di Azure, che concede l'accesso alle funzionalità offerte dal linguaggio di intelligenza artificiale di Azure. Genera una password (denominata chiave) e un URL dell'endpoint usato per autenticare le richieste API.
Creare una richiesta usando l'API REST o la libreria client per C#, Java, JavaScript e Python. È anche possibile inviare chiamate asincrone con una richiesta batch per combinare richieste API per più funzionalità in una singola chiamata.
Inviare la richiesta contenente i dati di testo. La chiave e l'endpoint vengono usati per l'autenticazione.
Trasmettere o archiviare la risposta in locale.

Supporto per documenti nativi

Un documento nativo fa riferimento al formato di file usato per creare il documento originale, ad esempio Microsoft Word (docx) o un file di documento portatile (pdf). Il supporto di documenti nativi elimina la necessità di pre-elaborazione del testo prima di usare le funzionalità delle risorse del linguaggio di intelligenza artificiale di Azure. Attualmente, il supporto dei documenti nativi è disponibile per la funzionalità PiiEntityRecognition.

Attualmente le informazioni personali supportano i formati di documento nativi seguenti:

Tipo di file	Estensione di file	Descrizione
Testo	`.txt`	Documento di testo non formattato.
Adobe PDF	`.pdf`	Documento formattato con file di documento portabile.
Microsoft Word	`.docx`	Un file di documento di Microsoft Word.

Per altre informazioni, vedereUsare documenti nativi per l'elaborazione della lingua

Introduzione al rilevamento delle informazioni personali

Per usare il rilevamento delle informazioni personali, inviare testo per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione del modello usato nei dati. Esistono due modi per usare il rilevamento delle informazioni personali:

Opzione di sviluppo	Descrizione
Language Studio	Language Studio è una piattaforma basata sul Web che consente di provare il collegamento di entità con esempi di testo senza un account Azure e i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio.
API REST o libreria client (Azure SDK)	Integrare il rilevamento delle informazioni personali nelle applicazioni usando l'API REST o la libreria client disponibile in varie lingue. Per altre informazioni, vedere la guida introduttiva al rilevamento delle informazioni personali.

Documentazione di riferimento ed esempi di codice

Quando si usa questa funzionalità nelle applicazioni, vedere la documentazione di riferimento e gli esempi seguenti per il linguaggio di intelligenza artificiale di Azure:

Opzione di sviluppo/linguaggio	Documentazione di riferimento	Esempi
REST API	Documentazione dell'API REST
C#	Documentazione di C#	Esempi di C#
Java	Documentazione di Java	Esempi di Java
JavaScript	Documentazione di JavaScript	Esempi JavaScript
Python	Documentazione di Python	Esempi per Python

Intelligenza artificiale responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere la nota sulla trasparenza per informazioni personali sull'uso e sulla distribuzione di intelligenza artificiale responsabili nei sistemi. Per altre informazioni, vedere gli articoli seguenti:

Scenari di esempio

Applicare etichette di riservatezza: ad esempio, in base ai risultati del servizio informazioni personali, è possibile applicare un'etichetta di riservatezza pubblica ai documenti in cui non vengono rilevate entità PII. Per i documenti in cui vengono riconosciuti gli indirizzi e i numeri di telefono degli Stati Uniti, è possibile applicare un'etichetta riservata. È possibile usare un'etichetta estremamente riservata per i documenti in cui vengono riconosciuti i numeri di routing bancari.
Redact alcune categorie di informazioni personali provenienti da documenti che ottengono una circolazione più ampia: ad esempio, se i record di contatto del cliente sono accessibili ai rappresentanti del supporto in prima linea, l'azienda può redigire le informazioni personali del cliente oltre al nome dalla versione della cronologia dei clienti per preservare la privacy del cliente.
Redact personal information in modo da ridurre il pregiudizio inconscio: ad esempio, durante il processo di revisione del curriculum di un'azienda, possono bloccare il nome, l'indirizzo e il numero di telefono per ridurre il sesso inconscio o altri pregiudizi.
Sostituire le informazioni personali nei dati di origine per l'apprendimento automatico per ridurre l'iniquità : ad esempio, se si vogliono rimuovere nomi che potrebbero rivelare il sesso durante il training di un modello di Machine Learning, è possibile usare il servizio per identificarli e sostituirli con segnaposto generici per il training del modello.
Rimuovere le informazioni personali dalla trascrizione del call center: ad esempio, se si vogliono rimuovere nomi o altri dati personali che si verificano tra l'agente e il cliente in uno scenario del call center. È possibile usare il servizio per identificarli e rimuoverli.
Pulizia dei dati per l'analisi scientifica dei dati: le informazioni personali possono essere usate per rendere i dati pronti per data scientist e ingegneri per poter usare questi dati per eseguire il training dei modelli di Machine Learning. Redacting the data to make sure that customer data isn't exposed.Redacting the data to make sure that customer data isn't exposed.

Passaggi successivi

Esistono due modi per iniziare a usare la funzionalità di collegamento delle entità:

Language Studio, una piattaforma basata sul Web che consente di provare diverse funzionalità del servizio di linguaggio senza dover scrivere codice.
L'articolo di avvio rapido contiene istruzioni su come effettuare richieste al servizio usando l'API REST e l'SDK della libreria client.