Aumentare l'accuratezza del classificatore

I classificatori, ad esempio i tipi di informazioni sensibili (SIT) e i classificatori sottoponibili a training, vengono usati in vari tipi di criteri per identificare le informazioni sensibili. Come la maggior parte di questi modelli, a volte identificano un elemento come sensibile che non lo è. In alternativa, potrebbero non identificare un elemento come sensibile quando lo è effettivamente. Questi sono chiamati falsi positivi e falsi negativi.

Questo articolo illustra come verificare se gli elementi corrispondenti a un classificatore sono veri positivi (una corrispondenza) o falsi positivi (non una corrispondenza) e fornire un feedback di corrispondenza/non corrispondente . È possibile usare tale feedback per ottimizzare i classificatori per aumentare l'accuratezza. È anche possibile inviare a Microsoft versioni redacted del documento, nonché il feedback Match, Not a Match a Microsoft se si vuole aumentare l'accuratezza dei classificatori forniti da Microsoft.

Le esperienze Match, Not a match e Contextual Summary sono disponibili in:

  • Esplora contenuto - per siti di SharePoint, siti di OneDrive
  • Pagina Elementi corrispondenti tipo di informazioni riservate - per siti di SharePoint, siti di OneDrive
  • Pagina Elementi corrispondenti del classificatore sottoponibile al training - per i siti di SharePoint, i siti di OneDrive
  • Pagina Avvisi Prevenzione della perdita dei dati Microsoft Purview (DLP): per siti di SharePoint, OneDrive e messaggi di posta elettronica in Exchange
  • Pagina Avvisi di Microsoft Threat Protection (MTP): per siti di SharePoint, siti di OneDrive e messaggi di posta elettronica in Exchange

L'esperienza Di riepilogo contestuale è disponibile in:

  • Microsoft Purview Information Protection (MIP) Auto-labeling simulation matched items - for SharePoint sites, OneDrive sites

Consiglio

Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.

Si applica a

Classificatore Riepilogo contestuale Pannello di anteprima con redacted Corrispondenza e non corrispondenza
SEDERSI
SIT personalizzato No
Impronta digitale SIT No No
Corrispondenza esatta dei dati con SIT No* No No
Entità denominate No* No No
Analisi delle credenziali No* No No
Classificatori di training predefiniti Sì**
Classificatore sottoponibile a training personalizzato No No

* Questi classificatori sono supportati negli elementi corrispondenti della simulazione di etichettatura automatica MIP, per siti di SharePoint e siti di OneDrive.

** Elenco dei classificatori di training predefiniti e che supportano il riepilogo contestuale.

Importante

Gli elementi di supporto del feedback di corrispondenza/non corrispondenza e dell'esperienza di riepilogo contestuale in: siti di SharePoint & siti di OneDrive: per Esplora contenuto, Tipo di informazioni sensibili e Elementi corrispondenti del classificatore sottoponibile a training, avvisi DLP e avvisi MTP. Messaggi di posta elettronica in Exchange: per avvisi DLP e avvisi MTP. L'esperienza di riepilogo contestuale supporta gli elementi in: siti di SharePoint e siti di OneDrive- per gli elementi corrispondenti della simulazione MIP

Licenze e sottoscrizioni

Per informazioni sulle licenze e le sottoscrizioni pertinenti, vedere i requisiti di licenza per l'analisi della classificazione dei dati: Panoramica del contenuto & Esplora attività.

Limitazioni note

  • Il riepilogo contestuale mostra solo un numero limitato di corrispondenze in un determinato elemento, non tutte le corrispondenze.
  • L'esperienza di riepilogo e feedback contestuale è disponibile solo per gli elementi creati o aggiornati dopo che l'esperienza di feedback è stata abilitata per il tenant. Gli elementi classificati prima dell'abilitazione della funzionalità potrebbero non avere l'esperienza contestuale di riepilogo e feedback disponibile.

Come valutare l'accuratezza della corrispondenza e fornire commenti e suggerimenti

L'esperienza di riepilogo contestuale, in cui si indica se un elemento corrispondente è un vero positivo (corrispondenza) o un falso positivo (non una corrispondenza), è simile in tutte le posizioni in cui viene visualizzato.

Importante

È necessario aver già distribuito criteri DLP che usano SIT o classificatori sottoponibili a training a siti di OneDrive, siti di SharePoint o cassette postali di Exchange. È inoltre necessario che gli elementi corrispondano prima che gli elementi vengano visualizzati nella pagina Di riepilogo contestuale .

Uso di Esplora contenuto

Questo esempio illustra come usare la scheda Riepilogo contestuale per fornire commenti e suggerimenti.

  1. Aprire la paginaesplora contenuto per la classificazione>Portale di conformità di Microsoft Purview> Data.
  2. Digitare il nome del classificatore SIT o sottoponibile a training per cui si desidera controllare le corrispondenze in Filtro per etichette, tipi di informazioni o categorie.
  3. Selezionare sit.
  4. Selezionare il percorso e assicurarsi che nella colonna File sia presente un valore diverso da zero. Le uniche posizioni supportate sono SharePoint e OneDrive.
  5. Aprire la cartella e quindi selezionare un documento.
  6. Selezionare il collegamento nella colonna Tipo di informazioni sensibili per il documento per visualizzare i SIT corrispondenti all'elemento e il livello di attendibilità.
  7. Scegliere Chiudi
  8. Aprire un documento e selezionare la scheda Riepilogo contestuale .
  9. Esaminare l'elemento e verificare se si tratta o meno di una corrispondenza.
  10. Se si tratta di una corrispondenza, scegliere Chiudi. Hai finito.
  11. Se non si tratta di una corrispondenza, scegliere Non corrisponde.
  12. Se si commette un errore e si sceglie l'opzione sbagliata, selezionare Ritira feedback accanto a Chiudi. In questo modo l'elemento viene nuovamente inserito nello stato Not amatch Match .This puts the item back into the Not a match/ state.
  13. Esaminare l'elemento e redigere o annullare la redazione di qualsiasi testo.
  14. Scegliere Chiudi.

Uso della pagina Elementi corrispondenti al tipo di informazioni riservate

È possibile accedere agli stessi meccanismi di feedback nella pagina Tipi di informazioni sensibili .

  1. Aprire il Portale di conformità di Microsoft Purview e passare a Tipidi informazioni sensibiliclassificatoridi classificazione> dei > dati.
  2. Nel campo Cerca immettere il nome del SIT di cui si vuole verificare l'accuratezza.
  3. Aprire il sit. Verrà visualizzata la scheda Panoramica . Qui puoi vedere il conteggio del numero di elementi che corrispondono, un conteggio del numero di elementi che non corrispondono e il numero di elementi con feedback.
  4. Selezionare la scheda Elementi corrispondenti .
  5. Aprire la cartella e selezionare un documento. Solo SharePoint, OneDrive sono percorsi supportati qui. Assicurarsi che nella colonna File sia presente un valore diverso da zero.
  6. Selezionare il collegamento nella colonna Tipo di informazioni sensibili per un elemento per visualizzare i SIT corrispondenti all'elemento e il livello di attendibilità.
  7. Scegliere Chiudi.
  8. Aprire un documento e quindi selezionare la scheda Riepilogo contestuale .
  9. Esaminare l'elemento e verificare se si tratta di una corrispondenza.
  10. Se si tratta di una corrispondenza, scegliere Corrispondenza e quindi Chiudi.
  11. Se non si tratta di una corrispondenza, scegliere **Non corrisponde ****
  12. Se si commette un errore e si seleziona l'opzione sbagliata, selezionare Ritira feedback accanto a Chiudi. In questo modo l'elemento viene nuovamente inserito nello stato Not amatch Match .This puts the item back into the Not a match/ state.
  13. Scegliere Chiudi.

Pagina Using Trainable Classifier Matched Items (Uso degli elementi corrispondenti del classificatore sottoponibile a training)

  1. Aprire il Portale di conformità di Microsoft Purview e passare a Classificatori di classificazione>dei dati Classificatori>sottoponibili a training.
  2. Selezionare il classificatore sottoponibile a training di cui si vuole controllare l'accuratezza.
  3. Aprire il classificatore sottoponibile a training. Verrà visualizzata la scheda Panoramica . Qui puoi vedere il conteggio del numero di elementi che corrispondono, un conteggio del numero di elementi che non corrispondono e il numero di elementi con feedback.
  4. Selezionare la scheda Elementi corrispondenti .
  5. Aprire la cartella e aprire un documento. Solo SharePoint, OneDrive sono percorsi supportati qui. Assicurarsi che nella colonna File sia presente un valore diverso da zero.
  6. Aprire un documento e quindi selezionare la scheda Riepilogo contestuale .
  7. Esaminare l'elemento e verificare se si tratta di una corrispondenza.
  8. Se si tratta di una corrispondenza, scegliere Corrispondenza e quindi scegliere Chiudi.
  9. Se non si tratta di una corrispondenza, scegliere **Non corrisponde ****
  10. Se si commette un errore e si seleziona l'opzione sbagliata, scegliere Ritira feedback accanto a Chiudi. In questo modo l'elemento viene nuovamente inserito nello stato Not amatch Match .This puts the item back into the Not a match/ state.
  11. Scegliere Chiudi.

Pagina Uso degli avvisi di prevenzione della perdita dei dati

  1. Aprire il Portale di conformità di Microsoft Purview e passare alla paginaAvvisi di prevenzione della> perdita dei dati.
  2. Scegliere un avviso.
  3. Scegliere Visualizza dettagli.
  4. Scegliere la scheda Eventi .
  5. Ingrandire la scheda Dettagli .
  6. Esaminare l'elemento e verificare se si tratta di una corrispondenza.
  7. Scegliere Azioni.
  8. Se si tratta di una corrispondenza, chiudere la finestra. Hai finito.
  9. Se non corrisponde, scegliere Azioni e quindi Non corrisponde.
  10. Esaminare l'elemento e redigere o annullare la redazione di qualsiasi testo.
  11. Chiudere la finestra.

Uso del feedback per ottimizzare i classificatori

Se i SIT o i classificatori sottoponibili a training restituiscono troppi falsi positivi in base al feedback, provare alcune di queste opzioni per affinarli e aumentarne l'accuratezza.

Classificatori sottoponibili a training

Usare la procedura descritta in Come ripetere il training di un classificatore in Esplora contenuto per aumentare l'accuratezza di un classificatore sottoponibile a training.

Tipi di informazioni sensibili

  • Aumentare le soglie dei tipi di informazioni sensibili rilevati per determinare la gravità. È possibile usare soglie diverse per i singoli classificatori.

  • Comprendere i livelli di attendibilità e come vengono definiti. Provare a usare una bassa attendibilità con un numero elevato di istanze o un livello di confidenza superiore con un numero di istanze basso.

  • Clonare e modificare i SIT predefiniti per includere altre condizioni, ad esempio la presenza di parole chiave, la corrispondenza di valori più rigorosa o requisiti di formattazione più rigorosi.

  • Modificare un sit personalizzato per escludere prefissi, suffissi o modelli noti. Ad esempio, un SIT personalizzato per rilevare i numeri di telefono potrebbe essere attivato per ogni messaggio di posta elettronica se le firme di posta elettronica o le intestazioni del documento includono numeri di telefono. L'esclusione delle sequenze di numeri di telefono dell'organizzazione dal sit personalizzato può impedire l'attivazione della regola per ogni messaggio di posta elettronica o documento.

  • Includere più SIT basati su dizionario come condizioni per limitare le corrispondenze agli elementi che parlano degli articoli pertinenti. Ad esempio, una regola per la diagnostica dei pazienti corrispondente può essere migliorata richiedendo la presenza di parole come diagnostica, diagnosi, condizione, sintomo e paziente.

  • Per i SIT con entità denominate, ad esempio Tutti i nomi completi, è consigliabile impostare una soglia di conteggio istanze superiore, ad esempio 10 o 50. Se vengono rilevati sia i nomi delle persone che i numeri di previdenza sociale (SSN), è più probabile che i nomi SSN siano effettivamente SSN e si riduce il rischio che i criteri non vengano attivati perché vengono rilevati troppi SSN.