Condividi tramite


Testare un tipo di informazione sensibile con corrispondenza dei dati esatta

Consiglio

Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.

Si applica a

Dopo aver creato il tipo di informazioni sensibili (SIT) e un'ora dopo aver verificato che la tabella delle informazioni sensibili abbia completato il caricamento e l'indicizzazione, è possibile verificare se rileva o meno le informazioni da proteggere usando la funzione Test nella sezione Tipi di informazioni sensibili del portale di conformità Microsoft Purview.

Nota

La propagazione delle modifiche in un sit EDM esistente può richiedere del tempo nel sistema. Se si apportano modifiche a un SIT EDM per risolvere i problemi di rilevamento, assicurarsi di attendere almeno un'ora dopo aver apportato tali modifiche prima di usare la funzione Test per convalidarne l'impatto.

Indipendentemente dal metodo usato per il test, i risultati del test includeranno corrispondenze sia per il sit EDM specifico che per gli elementi primari configurati per tale SIT EDM.

Metodi per il test di EDM SIT

Esistono due metodi che è possibile usare per testare il sit EDM.

Metodo Disponibile nella nuova esperienza EDM Disponibile nell'esperienza EDM nuova e classica
Metodo SIT (Sensitive Information Type)
Metodo dei classificatori EDM No

Nota

Se si usa l'esperienza EDM classica, è necessario usare il metodo SIT.

Test di un SIT EDM con il metodo Sensitive Information Types

Per testare un SIT EDM con il metodo Tipi di informazioni riservate , seguire questa procedura.

Selezionare la scheda appropriata per il portale in uso. Per altre informazioni sul portale di Microsoft Purview, vedere Portale di Microsoft Purview. Per altre informazioni sul portale di conformità, vedere Portale di conformità di Microsoft Purview.

  1. Accedere al portale >di Microsoft Purview Information Protection >Classifiers>Tipi di informazioni sensibili.

  2. Selezionare il sit EDM dall'elenco e quindi selezionare l'icona Test .

  3. Nel riquadro a comparsa caricare un file contenente i dati da rilevare. Ad esempio, creare un file che contiene un subset delle righe nella tabella delle informazioni riservate. Se è stata usata la funzionalità di corrispondenza configurabile nello schema per definire delimitatori ignorati, assicurarsi che il file di esempio includa esempi con e senza tali delimitatori.

  4. Scegliere Test.

  5. Dopo il caricamento e l'analisi del file, verificare la presenza di corrispondenze nel sit EDM.

  6. Se la funzione Test in SIT rileva una corrispondenza, verificare che sit non lo stia tagliando o estraendo l'elemento corrispondente in modo non corretto. I problemi comuni includono i SIT che:

    • Estrarre solo una sottostringa della stringa completa che deve essere rilevata
    • Selezionare solo la prima parola in una stringa di più parole
    • Includere simboli o caratteri aggiuntivi nell'estrazione

Per informazioni dettagliate sull'uso di espressioni regolari, vedere Il linguaggio delle espressioni regolari - Guida di riferimento rapido.

Testare il sit EDM con il metodo di classificazione EDM

Selezionare la scheda appropriata per il portale in uso. Per altre informazioni sul portale di Microsoft Purview, vedere Portale di Microsoft Purview. Per altre informazioni sul portale di conformità, vedere Portale di conformità di Microsoft Purview.

  1. Accedere aiclassificatori EDM del portale> di Microsoft Purview Information Protection>Classifiers>.

  2. Assicurarsi che l'interruttore Nuova esperienza EDM sia impostato su Attivato.

  3. Selezionare il sit EDM dall'elenco e quindi selezionare l'icona Test .

  4. Caricare un file contenente i dati da rilevare. Ad esempio, creare un file che contiene un subset delle righe nella tabella delle informazioni riservate. Se è stata usata la funzionalità di corrispondenza configurabile nello schema per definire delimitatori ignorati, assicurarsi che il file di esempio includa esempi con e senza tali delimitatori.

  5. Dopo il caricamento e l'analisi del file, verificare la presenza di corrispondenze nel sit EDM.

  6. Se la funzione Test in SIT rileva una corrispondenza, verificare che sit non lo stia tagliando o estraendo l'elemento corrispondente in modo non corretto. I problemi comuni includono i SIT che:

    • Estrarre solo una sottostringa della stringa completa che deve essere rilevata
    • Selezionare solo la prima parola in una stringa di più parole
    • Includere simboli o caratteri aggiuntivi nell'estrazione

Testare ed eseguire il test di EDM SIT con PowerShell

Per testare con PowerShell, usare il cmdlet di PowerShell seguente:

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Indipendentemente dal metodo usato per il test, i risultati del test includeranno corrispondenze sia per il sit EDM specifico che per gli elementi primari configurati per tale SIT EDM.

Nota

Quando si crea o si modifica un tipo di informazioni riservate EDM o il sit primario su cui si basa un tipo EDM, tutto il nuovo contenuto (nonché il contenuto che viene modificato dopo aver apportato modifiche ai SIT) verrà sottoposto a ricerca per indicizzazione per il contenuto corrispondente alle nuove definizioni. Tuttavia, il contenuto preesistente non verrà sottoposto a ricerca per indicizzazione fino a quando non viene modificato o indicizzato nuovamente.

Per forzare la ricerca per indicizzazione del contenuto esistente in un sito o una raccolta di SharePoint o in OneDrive, seguire le istruzioni riportate in Richiedere manualmente la ricerca per indicizzazione e la reindicizzazione di un sito, una raccolta o un elenco.

Testare il sit EDM con i criteri di protezione delle informazioni

È possibile vedere dove viene usato il sit EDM e quanto sia accurato nell'ambiente di produzione, usandolo nei criteri:

  1. Creare un criterio di etichettatura automatica ed eseguirlo in Panoramica della simulazione.

  2. Aggiungere alcuni contenuti che attiveranno il SIT EDM, insieme al contenuto che non attiverà IL SIT EDM, in una posizione che i criteri monitorano.

  3. Aprire la scheda Elementi da rivedere per controllare le corrispondenze.

  4. Ottimizzare i criteri in base alle esigenze.

Dopo aver soddisfatto i risultati dei test e dell'ottimizzazione, il sit personalizzato basato su EDM è pronto per l'uso nei criteri di protezione delle informazioni, ad esempio:

Suggerimenti per la risoluzione dei problemi

Se il sit EDM non rileva corrispondenze nei dati, i suggerimenti seguenti potrebbero aiutare a diagnosticare il problema.

Problema Suggerimenti per la risoluzione dei problemi
Nessuna corrispondenza trovata Verificare che i dati sensibili siano stati caricati correttamente usando i comandi illustrati in Hash e caricare la tabella di origine delle informazioni riservate per i tipi di informazioni sensibili corrispondenti esattamente ai tipi di informazioni sensibili.
Nessuna corrispondenza trovata Testare il sit usato quando è stato configurato l'elemento primario in ognuno dei modelli. Questo test verifica se sit può corrispondere agli esempi nell'elemento. L'uso di un SIT erroneamente definito come elemento di classificazione di un SIT EDM è la causa più comune per gli errori di rilevamento in EDM.
L'elemento SIT selezionato per un elemento primario nel tipo EDM non trova una corrispondenza nell'elemento o trova meno corrispondenze del previsto Verificare che sit supporti i separatori e i delimitatori che si verificano nel contenuto. Assicurarsi di includere i delimitatori ignorati definiti nello schema.
L'elemento SIT associato all'elemento primario trova corrispondenze nel contenuto, ma il sit EDM non lo trova.
  • Controllare se le istruzioni REGEX rilevano delimitatori di spazi vuoti all'inizio o alla fine di un elemento da rilevare. Ad esempio, cercare le istruzioni che includono il \s delimitatore. Se sono inclusi delimitatori di spazi vuoti, lo spazio vuoto non corrisponderà al valore hash nella tabella dati. Usare invece un delimitatore di parole, ad \besempio .
  • Controllare le istruzioni REGEX per assicurarsi che acquisissero l'intera stringa da rilevare, non solo una sottostringa. Si consideri, ad esempio, questo modello per gli indirizzi di posta elettronica: \b[a-zA-Z]{2,30}@[a-zA-Z]{2,20}.[a-zA-Z]{2,3}\b. Questo modello corrisponderà user@contoso.comcorrettamente a , ma verrà acquisito user@contoso.co.jp solo in un formato incompleto.
Un SIT EDM con elementi primari, ma nessun elemento secondario definito, rileva gli elementi ma non rileva corrispondenze (o rileva meno corrispondenze del previsto) quando sono necessari sia gli elementi primari che quelli secondari. Se i valori in una colonna usata per l'evidenza secondaria non sono costituiti da una singola parola o da stringhe che non contengono spazi, virgole o altri separatori di parole, esistono due modi per eseguire il test:
  1. Selezionare l'opzione di corrispondenza multi-token .
  2. Associare i valori a un sit che usa un REGEX progettato per rilevare stringhe di più parole che seguono il modello desiderato ,ad esempio un numero fisso di parole consecutive che iniziano con un carattere maiuscolo, o un dizionario di parole chiave che elenca tutti i valori univoci in tale colonna. Ad esempio, se è presente una colonna di prova aggiuntiva per la città o la residenza di una persona, è possibile creare un elenco con tutti i nomi univoci della città dalla tabella e quindi usarlo per creare un tipo di informazioni riservate basato sul dizionario.

Usare questo sit come elemento di classificazione per la colonna corrispondente in EDM SIT esportando e modificando la definizione SIT EDM in XML. Per altre informazioni, vedere Creare manualmente un pacchetto di regole.
La funzione di test SIT non rileva alcuna corrispondenza. Verificare che sit selezionato includa requisiti per parole chiave aggiuntive o altre convalide. Per i SIT predefiniti, vedere Definizioni di entità del tipo di informazioni riservate per determinare quali sono i requisiti minimi per la corrispondenza di ogni tipo.
La funzionalità Test funziona, ma gli elementi di SharePoint o OneDrive non vengono rilevati nelle regole di prevenzione della perdita dei dati o di etichettatura automatica Verificare che i documenti in cui si prevede di trovare le corrispondenze vengano effettivamente visualizzati in Esplora contenuto. Le corrispondenze vengono rilevate solo nel contenuto creato dopo l'applicazione delle modifiche apportate a SIT. Pertanto, se non vengono visualizzate corrispondenze previste, eseguire di nuovo la ricerca per indicizzazione dei siti e delle librerie per eventuali elementi preesistenti. Per informazioni dettagliate sulla ricerca per indicizzazione di SharePoint e OneDrive, vedere Richiedere manualmente la ricerca per indicizzazione e la reindicizzazione di un sito, una raccolta o un elenco.
Le regole di prevenzione della perdita dei dati o di etichettatura automatica che richiedono più corrispondenze non vengono attivate Assicurarsi che siano soddisfatti i requisiti di prossimità sia per il SIT EDM che per i SIT di base. Ad esempio, se la distanza massima tra l'elemento primario e le parole chiave di supporto è di 300 caratteri, ma le parole chiave sono presenti solo nella prima riga di una tabella lunga, è probabile che solo le prime righe di valori corrispondenti soddisfino i requisiti di prossimità. Modificare le definizioni SIT per supportare regole di prossimità più rilassate o usare l'opzione Via internet nel documento per le condizioni di prova aggiuntive.
Il rilevamento di un SIT EDM è incoerente o irregolare Assicurarsi che il sit usato come base per l'elemento primario in EDM SIT non rilevi contenuto non necessario. L'uso di un sit che corrisponde a un numero eccessivo di contenuti non correlati, ad esempio qualsiasi parola, numero o indirizzo di posta elettronica, può causare l'ignorare le corrispondenze pertinenti del servizio. Controllare il numero di parti di contenuto che corrispondono al tipo sensibile usato per gli elementi primari in Esplora contenuto.

Per stimare se il sit corrisponde a un numero eccessivo di contenuti:
  1. Dividere il numero di elementi di contenuto in Esplora contenuto di Microsoft Purview per il numero di giorni dalla creazione del tipo sensibile.
  2. Se il numero di corrispondenze al giorno è compreso nell'intervallo di centinaia di migliaia o più, è possibile che il sit primario sia troppo ampio.

Per consigli e procedure consigliate per la selezione del tipo di informazioni sensibili appropriato per un SIT EDM, vedere Informazioni sui tipi di informazioni sensibili basati sulla corrispondenza dei dati esatti.