Omówienie optycznego rozpoznawania znaków w Microsoft Syntex

Uwaga

Do czerwca 2024 r. możesz bezpłatnie wypróbować optyczne rozpoznawanie znaków i inne wybrane usługi Syntex, jeśli masz skonfigurowane rozliczenia zgodnie z rzeczywistym użyciem . Aby uzyskać informacje i ograniczenia, zobacz Wypróbuj Microsoft Syntex i zapoznaj się z jej usługami.

Usługa optycznego rozpoznawania znaków (OCR) w Microsoft Syntex umożliwia wyodrębnianie tekstu drukowanego lub odręcznego z obrazów i dokumentów. Przykłady obrazów obejmują plakaty, rysunki i etykiety produktów. Przykłady dokumentów obejmują artykuły, raporty, formularze i faktury.

Tekst jest zwykle wyodrębniany jako wyrazy, wiersze tekstowe, akapity lub bloki tekstowe, co umożliwia dostęp do cyfrowej wersji zeskanowanego tekstu. Wyodrębnione informacje są indeksowane w wyszukiwaniu i mogą być dostępne dla funkcji zgodności, takich jak ochrona przed utratą danych (DLP).

Na przykład włączasz usługę OCR, a następnie dodajesz pliki obrazów do biblioteki dokumentów. Microsoft Syntex automatycznie skanuje pliki obrazów, wyodrębnia odpowiedni tekst i udostępnia tekst z obrazów do wyszukiwania i indeksowania. Ta funkcja umożliwia szybkie i dokładne znajdowanie wyszukiwanych słów kluczowych i fraz.

Wymagania i ograniczenia

Obsługiwane typy plików

Punkt końcowy Obsługiwane typy plików
Program SharePoint i usługa OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff i .pdf (tylko obraz)
Urządzenia z systemem Teams, Exchange i Windows .bmp, .png, .jpeg, .jpg, .tiff i .pdf (tylko obraz)

Uwaga

Po zastosowaniu funkcji OCR do pliku obrazu tekst jest przechowywany w kolumnie Wyodrębnione metadane tekstu. Po zastosowaniu funkcji OCR do pliku PDF lub TIFF wyodrębniony tekst jest indeksowany w wyszukiwaniu, ale nie jest dostępny w kolumnie metadanych.

Obsługiwane języki

Usługa OCR obsługuje ponad 150 języków.

Obsługiwane lokalizacje i rozwiązania

Usługa OCR obsługuje wiele rozwiązań, jak pokazano w poniższej tabeli. Aby uzyskać szczegółowe informacje na temat rozwiązań zgodności, zobacz Obsługiwane lokalizacje i rozwiązania w usłudze Microsoft Purview.

Lokalizacja Obsługiwane rozwiązanie
Exchange Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych.
Tekst jest dostępny dla rozwiązań zgodności.
Witryny programu SharePoint Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych.
Tekst jest dostępny dla rozwiązań zgodności.
Konta usługi OneDrive Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych.
Tekst jest dostępny dla rozwiązań zgodności.
Komunikat dotyczący czatu i kanału w usłudze Teams Tekst jest dostępny dla rozwiązań zgodności.
Urządzeń Tekst jest dostępny dla rozwiązań zgodności.

Ograniczenia dotyczące plików

  • Obrazy muszą być mniejsze niż 50 MB.

  • Obrazy muszą być co najmniej 50 x 50 pikseli i nie większe niż 16 000 x 16 000 pikseli.

  • Obrazy przekazane po włączeniu funkcji OCR są jedynymi skanowanymi obrazami.

  • Obrazy osadzone w dokumentach pakietu Office nie są obsługiwane.