Creare uno schema SIT EDM e un pacchetto di regole (nuova esperienza)
È possibile creare sia lo schema di corrispondenza esatta dei dati (EDM) che il tipo di informazioni sensibili EDM (SIT) nella nuova esperienza usando un singolo flusso di lavoro nel portale di conformità di Microsoft Purview.
Consiglio
Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.
Si applica a
- Nuova esperienza
Se si vuole creare un SIT EDM usando l'esperienza classica, vedere Creare un SIT EDM (esperienza classica).If you want to create an EDM SIT using the classic experience, see Create an EDM SIT (Classic experience). Per informazioni su quale esperienza usare, vedere Scelta dell'esperienza di creazione corretta di EDM SIT.
Prima di iniziare
Assicurarsi di completare i passaggi descritti negli articoli seguenti prima di iniziare le procedure descritte in questo articolo.
- Esportare i dati di origine per i tipi di informazioni sensibili basati sulla corrispondenza dei dati esatti
- Creare il file di esempio SIT EDM (nuova esperienza)
Se non si ha familiarità con i SIT basati su EDM o la relativa implementazione, è essenziale acquisire familiarità con i concetti illustrati negli articoli seguenti:
- Informazioni sui tipi di informazioni riservate
- Informazioni sui tipi di informazioni sensibili basate sulla corrispondenza esatta dei dati
- Informazioni sulla corrispondenza con più token
- Introduzione ai tipi di informazioni sensibili basati sulla corrispondenza esatta dei dati
- Creare una corrispondenza esatta dei dati SIT (nuova esperienza)
- Definizioni delle entità tipo di informazioni sensibili
Autorizzazioni
È necessario disporre delle autorizzazioni di amministratore globale o amministratore della conformità per creare, testare e distribuire un tipo di informazioni sensibili personalizzato tramite il portale di conformità. Per altre informazioni su ruoli e autorizzazioni, vedere Informazioni sui ruoli di amministratore in Office 365.
Considerazioni importanti
Di seguito sono riportate alcune considerazioni importanti di cui tenere conto durante la creazione dello schema EDM e dei SIT basati su EDM.
Prima di selezionare gli elementi primari, esaminare i SIT predefiniti per avere un'idea di quali sono quelli più adatti alle proprie esigenze.
Per ogni SIT EDM, è necessario selezionare almeno un elemento primario e non più di 10 elementi primari. Se si dispone di un campo dati convalidativo multi-token, scegliere una delle opzioni seguenti:
- Selezionare Corrispondenza multi-token.
- Eseguire il mapping degli elementi nei campi multi-token a un sit in grado di rilevare tale contenuto. Maggiore è il numero di campi con valori univoci mappati, maggiore sarà l'accuratezza del sit EDM. Il mapping di più campi consente inoltre di migliorare le prestazioni, ridurre il carico di elaborazione ed evitare timeout di sistema.
Quando si selezionano gli elementi primari per sit, selezionare i campi che assicurano che ogni riga nella tabella dati sia univoca. Ad esempio, non usare campi come
FirstName
oDateOfBirth
. Perché? Poiché è probabile che i nomi e le date di nascita vengano duplicati nella tabella dei dati sensibili. Usare invece campi con valori univoci, adSocialSecurityNumber
esempio oBankAccountNumber
.Raccomandazione: Compilare lo schema EDM da un file di dati di esempio. In seguito a questa raccomandazione, assicurarsi che il file di dati di esempio rispetti i requisiti seguenti:
- I dati devono essere organizzati come tabella, con colonne e righe. Usare i nomi dei campi per le intestazioni di colonna. Le righe della tabella corrispondono ai singoli elementi di dati.
- I nomi dei campi possono includere solo caratteri alfanumerici.
- I nomi dei campi devono iniziare con una lettera e devono essere costituiti da almeno tre caratteri alfanumerici.
- Se questi requisiti di denominazione non vengono soddisfatti, potrebbero verificarsi errori durante il caricamento del file di dati di esempio.
Se si usa un file di esempio di informazioni riservate per configurare il sit EDM, il sistema suggerisce il sit esistente per ogni campo che rileva al meglio i dati caricati, se tale SIT è disponibile. Per impostazione predefinita, Microsoft Purview usa la corrispondenza con token singolo per il rilevamento di contenuti sensibili. Pertanto, se nessun SIT esistente è in grado di rilevare i dati per un campo nello schema EDM, applica la modalità di corrispondenza a token singolo. È fondamentale assicurarsi che il sit suggerito per ogni elemento rilevi la stringa esatta da monitorare:
- Assicurarsi che l'elemento SIT suggerito non contenga caratteri circostanti diversi dal contenuto che si vuole rilevare.
- Assicurarsi che l'elemento SIT suggerito non escluda alcuna parte valida della stringa archiviata nella tabella delle informazioni riservate.
- Assicurarsi che il sit usato corrisponda al formato dei dati che si desidera rilevare. Ad esempio, cercare qualcosa di simile
Nine digits with optional hyphens or spaces
piuttosto che semplicementedigits
, o verificareA combination of 32 characters consisting of letters and digits
anziché semplicementetext strings
.
L'uso di SIT che corrispondono al formato dei dati che si sta tentando di rilevare è un altro modo per migliorare l'accuratezza dei risultati e ridurre il tempo necessario per completare la corrispondenza.
Nota
Tutti i dati vengono salvati mentre si passa avanti (Avanti) e indietro (Indietro) attraverso lo strumento mentre si effettuano le selezioni. Lo spostamento indietro supporta solo lo spostamento dalla pagina di primo livello alla pagina di primo livello e dalla pagina secondaria alla pagina secondaria. Non è possibile spostarsi all'indietro da una pagina di primo livello alla pagina secondaria precedente o da una pagina secondaria a una pagina di primo livello precedente.
Creare lo schema EDM e SIT
La procedura seguente fornisce istruzioni dettagliate per la creazione dello schema EDM e dei SIT usando la nuova esperienza. Per una panoramica concettuale e un diagramma del processo nel suo complesso, vedere Panoramica del flusso di lavoro EDM (Nuova esperienza).
Istruzioni
Nel portale di conformità per il tenant passare aClassificatori EDM di classificazione> dei dati.
Assicurarsi che l'interruttore Nuova esperienza EDM sia impostato su Attivato.
Scegliere + Crea classificatore EDM.
Assegnare un nome a SIT e aggiungere una descrizione. Il sistema usa questo nome, aggiunto alla parola schema, per lo schema associato generato.
Scegliere Avanti.
Selezionare il metodo da usare per lo schema: Caricare un file contenente dati di esempio o Definire manualmente la struttura dei dati. La procedura consigliata consiste nel caricare un file di dati di esempio. Il resto di questa procedura presuppone questa opzione.
In entrambi i casi, sono necessarie le informazioni illustrate in Creare un file di esempio SIT EDM (Nuova esperienza) per il file di esempio.Scegliere Avanti.
Selezionare il file di esempio e quindi Selezionare Carica file. Scegliere Avanti.
Se durante il caricamento vengono visualizzati errori, indirizzarli e riprovare.Nella pagina Seleziona elementi primari :
- Nella colonna Elemento primario selezionare l'elemento primario. Ogni elemento primario deve essere mappato a un sit. La procedura consigliata consiste nel selezionare i campi che mostrano la corrispondenza completa nella colonna Convalida corrispondenza .
- Nella colonna Modalità corrispondenza per ogni campo, specificare quale delle opzioni di corrispondenza seguenti da applicare:
- Opzione 1: Non fare nulla per accettare il sit suggerito dal sistema.
- Opzione 2: Espandere il menu a discesa. In Tipo di informazioni sensibili (SIT) scegliere l'icona a matita (modifica) e quindi selezionare un altro sit esistente.
- Opzione 3: In Modalità di corrispondenza selezionare Token singolo.
- Opzione 4: In Modalità di corrispondenza selezionare Multi-token.
Scegliere Avanti.
Configurare le impostazioni per i dati nelle colonne selezionate.
- L'interruttore Usa le stesse impostazioni per tutte le colonne è impostato su Attivato per impostazione predefinita. Se si desidera usare impostazioni separate per ogni campo dati, impostare l'interruttore su Disattivato.
- L'opzione Data in columns are case-in-insensitive è selezionata per impostazione predefinita. Per applicare il rilevamento con distinzione tra maiuscole e minuscole , deselezionare questa casella.
- Se necessario, selezionare l'opzione Ignora delimitatori e punteggiatura per i dati in tutte le colonne . È quindi possibile selezionare i delimitatori e i segni di punteggiatura da ignorare da un elenco oppure immettere delimitatori e segni di punteggiatura personalizzati da ignorare.
Importante
Se si seleziona l'opzione Ignora delimitatori per la colonna dell'elemento primario nello schema, assicurarsi che l'opzione SIT a cui si esegue il mapping sia progettata per la corrispondenza dei dati con e senza i delimitatori selezionati.
- Choose Submit.
Al termine, EDM genera automaticamente una regola di rilevamento per ognuno degli elementi primari identificati. Crea anche una regola con attendibilità elevata e una regola di attendibilità media . Le regole con attendibilità elevata hanno più requisiti di corrispondenza rispetto alle regole di attendibilità media, che, a loro volta, hanno più requisiti rispetto alle regole di bassa attendibilità. Le regole di bassa attendibilità devono essere create manualmente. È possibile esaminare e modificare queste regole nella pagina Configura regole di rilevamento per gli elementi primari .
Consiglio
Gli elementi che non sono selezionati come primario possono comunque essere usati come prova corroborativa (a supporto). Più elementi di supporto si trovano in una prossimità definita agli elementi primari, maggiore è la probabilità che la corrispondenza sia un vero positivo.
Suggerimenti
Attendere almeno un'ora dopo aver creato o modificato uno schema prima di scaricarlo e usarlo per il caricamento dei dati EDM. Ciò consente di garantire che lo schema sia sincronizzato con il sistema. Se uno schema viene scaricato troppo presto, potrebbe essere visualizzato un messaggio di errore quando si tenta di scaricare lo schema tramite la riga di comando.
Non usare l'agente di caricamento EDM per scaricare, modificare manualmente e quindi ricaricare uno schema. In questo modo viene generato un errore perché l'uso dell'agente di caricamento EDM per scaricare uno schema aggiunge tag allo schema che non superano i controlli di creazione dello schema.
Per garantire che vengano rilevate tutte le prove corroborative, eseguire una delle azioni seguenti: - Tagliare i campi delle prove corroborative multi-token al numero massimo di token supportati dalla funzionalità multi-token (attualmente cinque token).
- Eseguire il mapping del campo multi-token a un sit in grado di rilevare completamente i dati multi-token. - Dopo aver creato o modificato il sit EDM, testarlo usando il cmdlet di PowerShell seguente e quindi attendere 24 ore prima di testarlo in una soluzione di criteri di prevenzione della perdita dei dati (DLP).
Test-DataClassification -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]”