Implementacja odcisków cyfrowych dokumentu

Ukończone

Jako pracownik przetwarzający informacje codziennie obsługujesz poufne dokumenty, niezależnie od tego, czy są to formularze prawne, rejestry pracowników czy dokumenty zgodności. Ochrona tych danych przed nieautoryzowanym dostępem lub przypadkowym udostępnianiem ma kluczowe znaczenie. Odciskanie dokumentów w Microsoft Purview upraszcza ten proces poprzez automatyczne wykrywanie i zabezpieczanie standardowych formularzy stosowanych w twojej organizacji.

Co to jest identyfikacja dokumentu?

Odciski palców dokumentów konwertuje typowe formy, takie jak standardowy kontrakt lub wniosek patentowy, na unikatowy typ informacji poufnych (SIT). Ten SIT służy następnie do tworzenia zasad ochrony przed utratą danych (DLP), które automatycznie wykrywają, blokują lub zezwalają na przesyłanie zawierające poufne informacje.

Możesz na przykład utworzyć odcisk palca dokumentu dla pustego formularza ubezpieczenia zdrowotnego. Po skonfigurowaniu zasady DLP mogą identyfikować wszystkie przypadki tego formularza wysyłane z wypełnionymi poufnymi szczegółami, nawet jeśli reszta dokumentu została nieco zmodyfikowana.

Funkcje odcisku palca dokumentu

Odcisk palca dokumentu oferuje kilka korzyści:

  • Działa na wielu platformach: zasady DLP wykorzystujące odciski palców dokumentów można stosować do Exchange, SharePoint, OneDrive, Teams i urządzeń.
  • Obsługuje automatyczne etykietowanie: Automatyczne etykietowanie w usłudze Information Protection może używać odcisku palca dokumentu jako metody wykrywania w Exchange, SharePoint i OneDrive.
  • Obsługuje wiele typów dopasowania: dostępne są zarówno częściowe, jak i dokładne dopasowanie, zapewniając elastyczne i skuteczne wykrywanie.
  • Wykrywanie wielu języków: wykrywa zawartość w wielu językach, w tym języki dwu bajtów, takie jak chiński, japoński i koreański.
  • Ulepszona dokładność: koncentrując się na unikatowych wzorcach słów, odcisk palca dokumentu zmniejsza liczbę wyników fałszywie dodatnich i zwiększa dokładność wykrywania poufnych formularzy.

Jak działa identyfikacja dokumentu

Odciski palców dokumentów działają, identyfikując unikatowe wzorce wyrazów w dokumencie. Podczas przekazywania formularza lub szablonu DLP analizuje ten wzorzec i generuje odcisk palca jako mały plik XML Unicode zawierający wartość skrótu. Oryginalny dokument nie jest przechowywany. Ten odcisk palca staje się SIT-em, który może być skojarzony z zasadami DLP, aby wykrywać dokumenty wychodzące pasujące do oryginalnego formularza.

Załóżmy na przykład, że przekazujesz pusty szablon aplikacji patentowej. Po utworzeniu odcisku palca zasady DLP mogą wykrywać i zarządzać dowolnym dokumentem zawierającym ten szablon, niezależnie od tego, czy jest on częściowo wypełniony, czy kompletny.

Obraz ilustruje ten proces.

  1. Tworzenie odcisków palców: system analizuje szablon patentowy i tworzy odcisk palca na podstawie jego wzorców słów. Ten odcisk palca może być teraz używany do wykrywania.

  2. Dopasowywanie odcisków palców: podczas skanowania dokumentu zawierającego ten szablon patentowy system DLP wykrywa dopasowanie na podstawie unikatowego odcisku palca i stosuje odpowiednie zasady do odpowiedniego zarządzania dokumentem.

Diagram ilustrujący przepływ pracy na potrzeby odcisku palca dokumentu.

Ten proces gwarantuje, że zostaną wykryte tylko dokumenty po oryginalnym formacie, nawet jeśli dane osobowe zostaną dodane później.

Typy obsługiwanych plików

Sygnatury dokumentów wspierają większość typów plików dozwolonych w regułach przepływu poczty, w tym formaty tekstowe, takie jak .docx, .pdf i .txt. Jednak typy plików szablonu, takie jak .dotx, nie są obsługiwane. Aby uzyskać więcej informacji na temat typów plików, zobacz Obsługiwane typy plików na potrzeby inspekcji zawartości reguły przepływu poczty.

Ograniczenia dotyczące odcisków palców dokumentów

Technologia tworzenia odcisków palców dokumentów najlepiej sprawdza się w przypadku dokumentów tekstowych. Nie wykrywa poufnych informacji w:

  • Pliki chronione hasłem
  • Tylko pliki obrazów
  • Pliki brakującego tekstu z oryginalnego formularza
  • Pliki większe niż 4 MB

Przekazany szablon musi zawierać co najmniej 256 znaków, a wyodrębniony tekst nie może przekraczać 204 800 znaków. Jeśli szablon jest za krótki, odcisk nie będzie miał wystarczającej liczby wzorców słownych, aby wygenerować niezawodne dopasowania. Należy również pamiętać, że tekst w dokumentach osadzonych nie jest brany pod uwagę podczas tworzenia odcisków palców, dlatego używaj prostego, autonomicznego pliku szablonu, aby uzyskać najlepsze wyniki.

Opcje dopasowywania odcisku dokumentu

Częściowe dopasowywanie

W przypadku częściowego dopasowywania zasady DLP mogą wykrywać formularze, które są wypełniane tylko częściowo. Poziom ufności wykrywania można dostosować do poziomu niskiego, średniego lub wysokiego , aby określić, ile tekstu musi odpowiadać. Na przykład możesz zezwolić na dokumenty, w których 30% tekstu pasuje do odcisku palca, aby wyzwolić alert DLP.

Wysoki poziom ufności zwraca najmniej wyników fałszywie dodatnich, ale może spowodować więcej wyników fałszywie ujemnych. Niski lub średni poziom ufności zwraca więcej wyników fałszywie dodatnich, ale niewiele lub wcale wyników fałszywie ujemnych. Jeśli na przykład ustawisz niski poziom ufności, system może oznaczać więcej dokumentów jako potencjalnie poufnych, ale niektóre mogą być fałszywymi alarmami (fałszywie dodatnie). Wysoki poziom ufności byłby bardziej rygorystyczny i może przegapić niektóre poufne dokumenty (wyniki fałszywie ujemne).

  • Niska pewność: przechwytuje najbardziej poufne dokumenty, ale może generować więcej wyników fałszywie dodatnich.
  • Średnia pewność: równoważy fałszywie dodatnie i fałszywie ujemne.
  • Wysoka pewność: wykrywa tylko dokładne dopasowania, minimalizując prawdopodobieństwo wyników fałszywie dodatnich, ale ryzykując pominięcie dokumentów.

Dokładne dopasowywanie

Dokładne dopasowanie zapewnia, że tylko dokumenty identyczne z oryginalnym szablonem są oznaczane. Ta opcja jest idealna, gdy potrzebujesz rygorystycznych zasad, które wyzwalają tylko wtedy, gdy cały tekst formularza jest zgodny z oryginałem.

Tworzenie odcisku palca opartego na protokole SIT w Microsoft Purview

  1. Zaloguj się do portal Microsoft Purview, następnie przejdź do Solutions>Information Protection>Classifiers>Sensitive info types.

  2. Na stronie Typy informacji poufnych wybierz pozycję Utwórz SIT oparte na odcisku palca.

  3. Na stronie Nazwij swoją SIT bazującą na odcisku palca, wprowadź nazwę i opis dla swojej nowej SIT, a następnie wybierz Dalej.

  4. Przekaż plik, aby utworzyć odcisk palca dla pliku, a następnie opcjonalnie dostosuj wymagania dla każdego poziomu ufności.

    Zrzut ekranu przedstawiający, gdzie dostosować poziom zaufania podczas tworzenia odcisku palca dokumentu SIT.

    Aby użyć dokładnego dopasowania, rozwiń listę rozwijaną Wysoki, a następnie wybierz pozycję Dokładna.

  5. Wybierz Dalej.

  6. Na stronie Przeglądanie ustawień i kończenie przejrzyj ustawienia, a następnie wybierz pozycję Utwórz.

  7. Na stronie potwierdzenia wybierz pozycję Gotowe.

Aby używać odcisków palców dokumentów z urządzeniami, należy włączyć zaawansowaną klasyfikację, skanowanie i ochronę.

Odciski palców są przechowywane w osobnym pakiecie reguł. Ten pakiet reguł ma maksymalny limit rozmiaru wynoszący 300 KB. Biorąc pod uwagę ten limit, można utworzyć około 100 odcisków palców na najemcę.

Ważna

Jeśli jesteś klientem E5, zalecamy zaktualizowanie istniejących odcisków palców w celu skorzystania z zestawu funkcji pełnego odcisku palca dokumentu. Jeśli jesteś klientem E3, zalecamy uaktualnienie do licencji E5.

Aby uzyskać więcej informacji na temat tworzenia nowej polityki DLP przy użyciu SITS opartych na odciskach palców, zobacz Tworzenie nowej polityki przy użyciu odcisku palca SIT.