Che cos'è il rilevamento delle informazioni personali (PII) nel linguaggio di intelligenza artificiale di Azure?

Il rilevamento delle informazioni personali è una delle funzionalità offerte dal linguaggio di intelligenza artificiale di Azure, una raccolta di algoritmi di Machine Learning e intelligenza artificiale nel cloud per lo sviluppo di applicazioni intelligenti che coinvolgono il linguaggio scritto. La funzionalità di rilevamento delle informazioni personali consente di identificare, classificare e redattire le informazioni riservate in testo non strutturato. Ad esempio: numeri di telefono, indirizzi di posta elettronica e forme di identificazione. Il metodo per l'utilizzo delle informazioni personali nelle conversazioni è diverso da altri casi d'uso e gli articoli per questo uso sono separati.

Le informazioni personali vengono inserite in due forme:

Flusso di lavoro tipico

Per usare questa funzionalità, inviare i dati per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione aggiunta al modello usato nei dati.

  1. Creare una risorsa del linguaggio di intelligenza artificiale di Azure, che concede l'accesso alle funzionalità offerte dal linguaggio di intelligenza artificiale di Azure. Genera una password (denominata chiave) e un URL dell'endpoint usato per autenticare le richieste API.

  2. Creare una richiesta usando l'API REST o la libreria client per C#, Java, JavaScript e Python. È anche possibile inviare chiamate asincrone con una richiesta batch per combinare richieste API per più funzionalità in una singola chiamata.

  3. Inviare la richiesta contenente i dati di testo. La chiave e l'endpoint vengono usati per l'autenticazione.

  4. Trasmettere o archiviare la risposta in locale.

Supporto per documenti nativi

Un documento nativo fa riferimento al formato di file usato per creare il documento originale, ad esempio Microsoft Word (docx) o un file di documento portatile (pdf). Il supporto di documenti nativi elimina la necessità di pre-elaborazione del testo prima di usare le funzionalità delle risorse del linguaggio di intelligenza artificiale di Azure. Attualmente, il supporto dei documenti nativi è disponibile per la funzionalità PiiEntityRecognition.

Attualmente le informazioni personali supportano i formati di documento nativi seguenti:

Tipo di file Estensione di file Descrizione
Testo .txt Documento di testo non formattato.
Adobe PDF .pdf Documento formattato con file di documento portabile.
Microsoft Word .docx Un file di documento di Microsoft Word.

Per altre informazioni, vedereUsare documenti nativi per l'elaborazione della lingua

Introduzione al rilevamento delle informazioni personali

Per usare il rilevamento delle informazioni personali, inviare testo per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione del modello usato nei dati. Esistono due modi per usare il rilevamento delle informazioni personali:

Opzione di sviluppo Descrizione
Language Studio Language Studio è una piattaforma basata sul Web che consente di provare il collegamento di entità con esempi di testo senza un account Azure e i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio.
API REST o libreria client (Azure SDK) Integrare il rilevamento delle informazioni personali nelle applicazioni usando l'API REST o la libreria client disponibile in varie lingue. Per altre informazioni, vedere la guida introduttiva al rilevamento delle informazioni personali.

Documentazione di riferimento ed esempi di codice

Quando si usa questa funzionalità nelle applicazioni, vedere la documentazione di riferimento e gli esempi seguenti per il linguaggio di intelligenza artificiale di Azure:

Opzione di sviluppo/linguaggio Documentazione di riferimento Esempi
REST API Documentazione dell'API REST
C# Documentazione di C# Esempi di C#
Java Documentazione di Java Esempi di Java
JavaScript Documentazione di JavaScript Esempi JavaScript
Python Documentazione di Python Esempi per Python

Intelligenza artificiale responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere la nota sulla trasparenza per informazioni personali sull'uso e sulla distribuzione di intelligenza artificiale responsabili nei sistemi. Per altre informazioni, vedere gli articoli seguenti:

Scenari di esempio

  • Applicare etichette di riservatezza: ad esempio, in base ai risultati del servizio informazioni personali, è possibile applicare un'etichetta di riservatezza pubblica ai documenti in cui non vengono rilevate entità PII. Per i documenti in cui vengono riconosciuti gli indirizzi e i numeri di telefono degli Stati Uniti, è possibile applicare un'etichetta riservata. È possibile usare un'etichetta estremamente riservata per i documenti in cui vengono riconosciuti i numeri di routing bancari.
  • Redact alcune categorie di informazioni personali provenienti da documenti che ottengono una circolazione più ampia: ad esempio, se i record di contatto del cliente sono accessibili ai rappresentanti del supporto in prima linea, l'azienda può redigire le informazioni personali del cliente oltre al nome dalla versione della cronologia dei clienti per preservare la privacy del cliente.
  • Redact personal information in modo da ridurre il pregiudizio inconscio: ad esempio, durante il processo di revisione del curriculum di un'azienda, possono bloccare il nome, l'indirizzo e il numero di telefono per ridurre il sesso inconscio o altri pregiudizi.
  • Sostituire le informazioni personali nei dati di origine per l'apprendimento automatico per ridurre l'iniquità : ad esempio, se si vogliono rimuovere nomi che potrebbero rivelare il sesso durante il training di un modello di Machine Learning, è possibile usare il servizio per identificarli e sostituirli con segnaposto generici per il training del modello.
  • Rimuovere le informazioni personali dalla trascrizione del call center: ad esempio, se si vogliono rimuovere nomi o altri dati personali che si verificano tra l'agente e il cliente in uno scenario del call center. È possibile usare il servizio per identificarli e rimuoverli.
  • Pulizia dei dati per l'analisi scientifica dei dati: le informazioni personali possono essere usate per rendere i dati pronti per data scientist e ingegneri per poter usare questi dati per eseguire il training dei modelli di Machine Learning. Redacting the data to make sure that customer data isn't exposed.Redacting the data to make sure that customer data isn't exposed.

Passaggi successivi

Esistono due modi per iniziare a usare la funzionalità di collegamento delle entità:

  • Language Studio, una piattaforma basata sul Web che consente di provare diverse funzionalità del servizio di linguaggio senza dover scrivere codice.
  • L'articolo di avvio rapido contiene istruzioni su come effettuare richieste al servizio usando l'API REST e l'SDK della libreria client.