Úprava schématu přesné shody dat tak, aby používalo konfigurovatelnou shodu

Tip

Pokud nejste zákazníkem E5, využijte 90denní zkušební verzi řešení Microsoft Purview a zjistěte, jak můžou další funkce purview pomoci vaší organizaci spravovat požadavky na zabezpečení dat a dodržování předpisů. Začněte hned v centru zkušebních verzí Portál dodržování předpisů Microsoft Purview. Přečtěte si podrobnosti o podmínkách registrace a zkušebních verzích.

Platí pro

  • Vytvoření typu citlivých informací (SIT) přesná shoda dat (EDM) pomocí PowerShellu

Klasifikace na základě přesné shody dat (EDM) umožňuje vytvářet vlastní typy citlivých informací, které odkazují na přesné hodnoty v databázi citlivých informací. Pokud potřebujete povolit varianty přesného řetězce, můžete pomocí konfigurovatelné shody říct Microsoft Purview, aby ignorovala velká a malá písmena a některé oddělovače.

Důležité

Tento postup slouží k úpravě existujícího schématu EDM a datového souboru.

  1. Odinstalujte EdmUploadAgent.exe z počítače, který používáte pro připojení k Microsoftu 365 pro účely nahrání schématu EDM a datového souboru.

  2. Pomocí následujících odkazů si stáhněte příslušný EdmUploadAgent.exe soubor pro vaše předplatné:

    • Komerční + GCC – většina komerčních zákazníků by tuto možnost měla používat
    • GCC-High – toto je speciálně pro předplatitele cloudu pro státní správu s vysokou úrovní zabezpečení.
    • DoD – konkrétně pro zákazníky cloudu ministerstva obrany USA
  3. Autorizujete agenta nahrávání EDM, otevřete okno příkazového řádku (jako správce) a spusťte následující příkaz:

    EdmUploadAgent.exe /Authorize
    
  4. Pokud nemáte aktuální kopii existujícího schématu, budete si muset stáhnout kopii existujícího schématu a spusťte tento příkaz:

    EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
    
  5. Přizpůsobte schéma tak, aby každý sloupec používal "caseInsitive" a / nebo "ignoredDelimiters". Výchozí hodnota pro "caseInsensitive" je "false" a pro "ignoredDelimiters" je to prázdný řetězec.

    Poznámka

    Základní vlastní typ citlivých informací nebo předdefinovaný typ citlivých informací použitý k detekci obecného vzoru regulárního výrazu musí podporovat detekci vstupních variant uvedených s ignoredDelimiters. Například integrovaný typ citlivých informací číslo sociálního pojištění (SSN) v USA může detekovat odchylky v datech, které zahrnují pomlčky, mezery nebo nedostatek mezer mezi seskupenými čísly, která tvoří SSN. V důsledku toho jsou jedinými oddělovači, které jsou relevantní pro zahrnutí do ignorovanýchdelimiterů EDM pro data SSN: pomlčka a mezera.

    Tady je ukázkové schéma, které simuluje porovnávání bez rozlišování malých a malých písmen vytvořením sloupců navíc potřebných k rozpoznávání variant písmen v citlivých datech.

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
               <Field name="PolicyNumber" searchable="true" />
               <Field name="PolicyNumberLowerCase" searchable="true" />
               <Field name="PolicyNumberUpperCase" searchable="true" />
               <Field name="PolicyNumberCapitalLetters" searchable="true" />
      </DataStore>
    </EdmSchema>
    

    Ve výše uvedeném příkladu už nebudou při přidání obou caseInsensitiveignoredDelimiters variant původního PolicyNumber sloupce potřeba.

    Pokud chcete toto schéma aktualizovat tak, aby EDM používal konfigurovatelnou shodu, použijte caseInsensitive příznaky a ignoredDelimiters . Vypadá to takto:

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
             <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
      </DataStore>
    </EdmSchema>
    

    Příznak ignoredDelimiters podporuje všechny jiné než alfanumerické znaky. Tady je několik příkladů:

    • .
    • -
    • /
    • _
    • *
    • ^
    • #
    • !
    • ?
    • [
    • ]
    • {
    • }
    • \
    • ~
    • ;

    Příznak ignoredDelimiters nepodporuje:

    • znaky 0–9
    • A–Z
    • a-z
    • "
    • ,
    • \n (nový řádek)
    • \t (tab)
  6. Připojení k zabezpečení & PowerShell pro dodržování předpisů.

    Poznámka

    Pokud vaše organizace nastavila klíč zákazníka pro Microsoft 365 na úrovni tenanta (Public Preview), funkce přesného párování dat automaticky využije funkce šifrování. Tato možnost je dostupná jenom pro tenanty s licencí E5 v komerčním cloudu.

  7. Aktualizujte schéma spuštěním následujícího příkazu:

    Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    
  8. V případě potřeby aktualizujte datový soubor tak, aby odpovídal nové verzi schématu.

    Tip

    Volitelně můžete pro soubor CSV před nahráním spustit ověření spuštěním příkazu:

    EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

    Příklad: EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml

    Další informace o všech parametrech podporovaných EdmUploadAgent.exe získáte spuštěním příkazu

    EdmUploadAgent.exe /?

  9. Otevřete okno příkazového řádku (jako správce) a spuštěním následujícího příkazu hashujte a nahrajte citlivá data:

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]