Modificare lo schema Exact Data Match per usare la corrispondenza configurabile
Consiglio
Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.
Si applica a
- Creazione del tipo di informazioni sensibili (SIT) di corrispondenza dati esatta (EDM) tramite PowerShell.
La classificazione basata su EDM consente di creare tipi di informazioni sensibili personalizzati che fanno riferimento a valori esatti in un database di informazioni sensibili. Quando è necessario consentire varianti di una stringa esatta, è possibile usare la corrispondenza configurabile per indicare a Microsoft Purview di ignorare maiuscole e minuscole e alcuni delimitatori.
Importante
Usare questa procedura per modificare lo schema EDM e il file di dati esistenti.
Disinstallare dal computer EdmUploadAgent.exe che viene usato per connettersi a Microsoft 365 per caricare il file di dati e lo schema EDM.
Scaricare il file EdmUploadAgent.exe appropriato per l'abbonamento tramite i collegamenti seguenti:
- Commerciale + GCC: consigliato per la maggior parte dei clienti commerciali
- GCC-High: specifico per gli abbonati al cloud di enti pubblici con sicurezza elevata
- DoD: specifico per i clienti del cloud del Dipartimento della difesa degli Stati Uniti
Autorizzare l'agente di caricamento di EDM, aprire una finestra del prompt dei comandi (come amministratore) ed eseguire il comando seguente:
EdmUploadAgent.exe /Authorize
Se non si dispone di una copia attuale dello schema esistente, è necessario scaricarne una copia eseguendo questo comando:
EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
Personalizzare lo schema in modo che ogni colonna utilizzi "caseInsensitive" e/o "ignoredDelimiters". Il valore predefinito per "caseInsensitive" è "false" e per "ignoredDelimiters" è una stringa vuota.
Nota
Il tipo di informazioni sensibili personalizzato sottostante o il tipo di informazioni riservate predefinito usato per rilevare il modello regex generale deve supportare il rilevamento delle varianti di input elencate con ignoredDelimiters. Ad esempio, il tipo di informazioni riservate SSN (Social Security Number) predefinito negli Stati Uniti può rilevare variazioni nei dati che includono trattini, spazi o mancanza di spazi tra i numeri raggruppati che costituiscono il nome SSN. Di conseguenza, gli unici delimitatori rilevanti da includere in ignoredDelimiters di EDM per i dati SSN sono: trattino e spazio.
Di seguito è riportato uno schema di esempio che simula la corrispondenza senza distinzione tra maiuscole e minuscole creando le colonne aggiuntive necessarie per riconoscere le variazioni tra maiuscole e minuscole nei dati sensibili.
<EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm"> <DataStore name="PatientRecords" description="Schema for patient records policy" version="1"> <Field name="PolicyNumber" searchable="true" /> <Field name="PolicyNumberLowerCase" searchable="true" /> <Field name="PolicyNumberUpperCase" searchable="true" /> <Field name="PolicyNumberCapitalLetters" searchable="true" /> </DataStore> </EdmSchema>
Nell'esempio riportato in precedenza, le variazioni della colonna
PolicyNumber
originale non saranno più necessarie se vengono aggiunticaseInsensitive
eignoredDelimiters
.Per aggiornare questo schema in modo che EDM usi la corrispondenza configurabile, usare i
caseInsensitive
flag eignoredDelimiters
. Ecco come:<EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm"> <DataStore name="PatientRecords" description="Schema for patient records policy" version="1"> <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" /> </DataStore> </EdmSchema>
Il contrassegno
ignoredDelimiters
supporta qualsiasi carattere non alfanumerico. Ecco alcuni esempi:- .
- -
- /
- _
- *
- ^
- #
- !
- ?
- [
- ]
- {
- }
- \
- ~
- ;
Il contrassegno
ignoredDelimiters
non supporta:- Caratteri 0-9
- A-Z
- a-z
- "
- ,
- \n (nuova riga)
- \t (scheda)
Connettersi alla sicurezza & PowerShell per la conformità.
Nota
Se l'organizzazione ha configurato la chiave del cliente per Microsoft 365 a livello di tenant (anteprima pubblica), Exact Data Match userà automaticamente la relativa funzionalità di crittografia. Questa opzione è disponibile solo per i tenant con licenza E5 nel cloud commerciale.
Aggiornare lo schema eseguendo il comando seguente:
Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
Se necessario, aggiornare il file di dati in base alla nuova versione dello schema.
Consiglio
Facoltativamente, è possibile eseguire una convalida sul file CSV prima di caricarlo eseguendo:
EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]
Ad esempio:
EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml
Per altre informazioni su tutti i parametri supportati da EdmUploadAgent.exe, eseguire
EdmUploadAgent.exe /?
Aprire una finestra del prompt dei comandi (come amministratore) ed eseguire il comando seguente per eseguire l'hash e caricare i dati sensibili:
EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]
Articoli correlati
- Informazioni sui tipi di informazioni sensibili basate sulla corrispondenza esatta dei dati
- Definizioni delle entità tipo di informazioni riservate
- Tipi di informazioni sensibili personalizzati
- Informazioni sulla prevenzione della perdita dei dati di Microsoft Purview
- Microsoft Defender for Cloud Apps
- New-DlpEdmSchema