Modificare lo schema Exact Data Match per usare la corrispondenza configurabile

Consiglio

Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.

Si applica a

  • Creazione del tipo di informazioni sensibili (SIT) di corrispondenza dati esatta (EDM) tramite PowerShell.

La classificazione basata su EDM consente di creare tipi di informazioni sensibili personalizzati che fanno riferimento a valori esatti in un database di informazioni sensibili. Quando è necessario consentire varianti di una stringa esatta, è possibile usare la corrispondenza configurabile per indicare a Microsoft Purview di ignorare case e alcuni delimitatori.

Importante

Usare questa procedura per modificare lo schema EDM e il file di dati esistenti.

  1. Disinstallare il EdmUploadAgent.exe dal computer usato per connettersi a Microsoft 365 per scopi di caricamento di file di dati e schema EDM

  2. Scaricare il file diEdmUploadAgent.exe appropriato per la sottoscrizione usando i collegamenti seguenti:

    • Commerciale + GCC - La maggior parte dei clienti commerciali deve usare questa opzione
    • GCC-High - Questa opzione è specifica per gli abbonati al cloud per enti pubblici ad alta sicurezza
    • DoD: questa opzione è specifica per Stati Uniti clienti cloud del Dipartimento della difesa
  3. Autorizzare l'agente di caricamento di EDM, aprire una finestra del prompt dei comandi (come amministratore) ed eseguire il comando seguente:

    EdmUploadAgent.exe /Authorize
    
  4. Se non si dispone di una copia corrente dello schema esistente, è necessario scaricare una copia dello schema esistente. A tale scopo, eseguire questo comando:

    EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
    
  5. Personalizzare lo schema in modo che ogni colonna utilizzi caseInsensitive e/o ignoredDelimiters. Il valore predefinito per caseInsensitive è "false" e per ignoredDelimiters, il valore predefinito è una stringa vuota.

    Nota

    Il tipo di informazioni sensibili personalizzato sottostante o il tipo di informazioni riservate predefinito usato per rilevare il modello regex generale deve supportare il rilevamento delle varianti di input elencate con ignoredDelimiters. Ad esempio, il tipo di informazioni sensibili predefinito U.S. Social Security Number (SSN) può rilevare variazioni nei dati che includono trattini, spazi o mancanza di spazi tra i numeri raggruppati che costituiscono il SSN. Di conseguenza, gli unici delimitatori rilevanti da includere in EDM ignoredDelimiters per i dati SSN sono: trattino e spazio.

    Ecco uno schema di esempio che simula la corrispondenza senza distinzione tra maiuscole e minuscole creando le colonne aggiuntive necessarie per riconoscere le variazioni tra maiuscole e minuscole nei dati sensibili.

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
               <Field name="PolicyNumber" searchable="true" />
               <Field name="PolicyNumberLowerCase" searchable="true" />
               <Field name="PolicyNumberUpperCase" searchable="true" />
               <Field name="PolicyNumberCapitalLetters" searchable="true" />
      </DataStore>
    </EdmSchema>
    

    Nell'esempio precedente le varianti della colonna originale PolicyNumber non sono necessarie se vengono aggiunte entrambe e ignoredDelimiterscaseInsensitive .

    Per aggiornare questo schema in modo che EDM usi la corrispondenza configurabile, usare i caseInsensitive flag e ignoredDelimiters . Ecco come:

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
             <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
      </DataStore>
    </EdmSchema>
    

    Per informazioni sui caratteri supportati dal ignoredDelimiters flag, vedere Uso dei campi caseInsensitive e ignoredDelimiters.

  6. Connettersi a PowerShell per Sicurezza e conformità

    Nota

    Se l'organizzazione ha configurato la chiave del cliente per Microsoft 365 a livello di tenant, Exact Data Match userà automaticamente la relativa funzionalità di crittografia. Questa opzione è disponibile solo per i tenant con licenza E5 nel cloud commerciale. Per altre informazioni, vedere Panoramica della chiave del cliente.

  7. Aggiornare lo schema eseguendo il comando seguente:

    Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    
  8. Se necessario, aggiornare il file di dati in base alla nuova versione dello schema.

    Consiglio

    Facoltativamente, è possibile eseguire una convalida sul file CSV prima di caricarlo eseguendo:

    EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

    Ad esempio: EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml

    Per altre informazioni su tutti i parametri supportati da EdmUploadAgent.exe, eseguire

    EdmUploadAgent.exe /?

  9. Aprire una finestra del prompt dei comandi (come amministratore) ed eseguire il comando seguente per eseguire l'hash e caricare i dati sensibili:

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]