Úprava schématu přesné shody dat tak, aby používalo konfigurovatelnou shodu
Tip
Pokud nejste zákazníkem E5, využijte 90denní zkušební verzi řešení Microsoft Purview a zjistěte, jak můžou další funkce purview pomoci vaší organizaci spravovat požadavky na zabezpečení dat a dodržování předpisů. Začněte hned v centru zkušebních verzí Portál dodržování předpisů Microsoft Purview. Přečtěte si podrobnosti o podmínkách registrace a zkušebních verzích.
Platí pro
- Vytvoření typu citlivých informací (SIT) přesná shoda dat (EDM) pomocí PowerShellu
Klasifikace na základě přesné shody dat (EDM) umožňuje vytvářet vlastní typy citlivých informací, které odkazují na přesné hodnoty v databázi citlivých informací. Pokud potřebujete povolit varianty přesného řetězce, můžete pomocí konfigurovatelné shody říct Microsoft Purview, aby ignorovala velká a malá písmena a některé oddělovače.
Důležité
Tento postup slouží k úpravě existujícího schématu EDM a datového souboru.
Odinstalujte EdmUploadAgent.exe z počítače, který používáte pro připojení k Microsoftu 365 pro účely nahrání schématu EDM a datového souboru.
Pomocí následujících odkazů si stáhněte příslušný EdmUploadAgent.exe soubor pro vaše předplatné:
- Komerční + GCC – většina komerčních zákazníků by tuto možnost měla používat
- GCC-High – toto je speciálně pro předplatitele cloudu pro státní správu s vysokou úrovní zabezpečení.
- DoD – konkrétně pro zákazníky cloudu ministerstva obrany USA
Autorizujete agenta nahrávání EDM, otevřete okno příkazového řádku (jako správce) a spusťte následující příkaz:
EdmUploadAgent.exe /Authorize
Pokud nemáte aktuální kopii existujícího schématu, budete si muset stáhnout kopii existujícího schématu a spusťte tento příkaz:
EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
Přizpůsobte schéma tak, aby každý sloupec používal "caseInsitive" a / nebo "ignoredDelimiters". Výchozí hodnota pro "caseInsensitive" je "false" a pro "ignoredDelimiters" je to prázdný řetězec.
Poznámka
Základní vlastní typ citlivých informací nebo předdefinovaný typ citlivých informací použitý k detekci obecného vzoru regulárního výrazu musí podporovat detekci vstupních variant uvedených s ignoredDelimiters. Například integrovaný typ citlivých informací číslo sociálního pojištění (SSN) v USA může detekovat odchylky v datech, které zahrnují pomlčky, mezery nebo nedostatek mezer mezi seskupenými čísly, která tvoří SSN. V důsledku toho jsou jedinými oddělovači, které jsou relevantní pro zahrnutí do ignorovanýchdelimiterů EDM pro data SSN: pomlčka a mezera.
Tady je ukázkové schéma, které simuluje porovnávání bez rozlišování malých a malých písmen vytvořením sloupců navíc potřebných k rozpoznávání variant písmen v citlivých datech.
<EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm"> <DataStore name="PatientRecords" description="Schema for patient records policy" version="1"> <Field name="PolicyNumber" searchable="true" /> <Field name="PolicyNumberLowerCase" searchable="true" /> <Field name="PolicyNumberUpperCase" searchable="true" /> <Field name="PolicyNumberCapitalLetters" searchable="true" /> </DataStore> </EdmSchema>
Ve výše uvedeném příkladu už nebudou při přidání obou
caseInsensitive
ignoredDelimiters
variant původníhoPolicyNumber
sloupce potřeba.Pokud chcete toto schéma aktualizovat tak, aby EDM používal konfigurovatelnou shodu, použijte
caseInsensitive
příznaky aignoredDelimiters
. Vypadá to takto:<EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm"> <DataStore name="PatientRecords" description="Schema for patient records policy" version="1"> <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" /> </DataStore> </EdmSchema>
Příznak
ignoredDelimiters
podporuje všechny jiné než alfanumerické znaky. Tady je několik příkladů:- .
- -
- /
- _
- *
- ^
- #
- !
- ?
- [
- ]
- {
- }
- \
- ~
- ;
Příznak
ignoredDelimiters
nepodporuje:- znaky 0–9
- A–Z
- a-z
- "
- ,
- \n (nový řádek)
- \t (tab)
Připojení k zabezpečení & PowerShell pro dodržování předpisů.
Poznámka
Pokud vaše organizace nastavila klíč zákazníka pro Microsoft 365 na úrovni tenanta (Public Preview), funkce přesného párování dat automaticky využije funkce šifrování. Tato možnost je dostupná jenom pro tenanty s licencí E5 v komerčním cloudu.
Aktualizujte schéma spuštěním následujícího příkazu:
Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
V případě potřeby aktualizujte datový soubor tak, aby odpovídal nové verzi schématu.
Tip
Volitelně můžete pro soubor CSV před nahráním spustit ověření spuštěním příkazu:
EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]
Příklad:
EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml
Další informace o všech parametrech podporovaných EdmUploadAgent.exe získáte spuštěním příkazu
EdmUploadAgent.exe /?
Otevřete okno příkazového řádku (jako správce) a spuštěním následujícího příkazu hashujte a nahrajte citlivá data:
EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]