Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Uwaga
Do grudnia 2025 r. możesz bezpłatnie wypróbować ograniczoną ilość optycznego rozpoznawania znaków i innych wybranych usług zawartości, jeśli masz skonfigurowane rozliczenia zgodnie z rzeczywistym użyciem . Aby uzyskać informacje i ograniczenia, zobacz Wypróbuj usługi z płatnością zgodnie z rzeczywistym użyciem.
Usługa optycznego rozpoznawania znaków (OCR) w programie SharePoint umożliwia wyodrębnianie tekstu drukowanego lub odręcznego z obrazów i dokumentów. Przykłady obrazów obejmują plakaty, rysunki i etykiety produktów. Przykłady dokumentów obejmują artykuły, raporty, formularze i faktury.
Tekst jest zwykle wyodrębniany jako wyrazy, wiersze tekstowe, akapity lub bloki tekstowe, co umożliwia dostęp do cyfrowej wersji zeskanowanego tekstu. Wyodrębnione informacje są indeksowane w wyszukiwaniu i mogą być dostępne dla funkcji zgodności, takich jak ochrona przed utratą danych (DLP).
Na przykład włączasz usługę OCR, a następnie dodajesz pliki obrazów do biblioteki dokumentów. Funkcja automatycznie skanuje pliki obrazów, wyodrębnia odpowiedni tekst i udostępnia tekst z obrazów do wyszukiwania i indeksowania. Ta funkcja umożliwia szybkie i dokładne znajdowanie wyszukiwanych słów kluczowych i fraz.
Wymagania i ograniczenia
Obsługiwane typy plików
Punkt końcowy | Obsługiwane typy plików |
---|---|
Program SharePoint i usługa OneDrive |
.bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf (scanned and hybrid) Obrazy osadzone w programie docx, pptx, xlsx są wyodrębniane i skanowane |
Exchange |
.jpeg, .jpg, .png, .bmp, .tiff, and PDFs (scanned and hybrid) . Obrazy osadzone w docx, pptx, xlsx, rar, tar, zip, 7z |
Teams, Windows i macOS endpoint | .jpeg, .jpg, .png, .bmp, .tiff, and PDF (image only) |
Oprócz formatu PDF opartego na obrazach usługa SharePoint OCR obsługuje hybrydowy plik PDF (tekst i obraz PDF). Nowo przekazane hybrydowe pliki PDF będą przetwarzane przez usługę OCR.
Uwaga
Po zastosowaniu funkcji OCR do pliku obrazu tekst jest przechowywany w kolumnie Wyodrębnione metadane tekstu. Po zastosowaniu funkcji OCR do pliku PDF lub TIFF wyodrębniony tekst jest indeksowany w wyszukiwaniu, ale nie jest dostępny w kolumnie metadanych.
Obsługa plików pakietu Office w programie SharePoint
Program SharePoint obsługuje teraz protokół OCR dla plików pakietu Microsoft 365 Office, w tym dokumentów Word, PowerPoint i Excel. Wszystkie obrazy dodane do tych plików zostaną automatycznie zeskanowane przy użyciu usługi OCR, a wyodrębniony tekst zostanie zindeksowany do celów wyszukiwania i zintegrowany z rozwiązaniami zgodności. Ponadto program SharePoint zaimplementował procesy deduplikacji w celu sprawdzenia, czy nie ma unikatowych obrazów, aby uniknąć zduplikowanych opłat za te same obrazy.
Obsługiwane języki
Usługa OCR obsługuje ponad 150 języków.
Obsługiwane lokalizacje i rozwiązania
Usługa OCR obsługuje wiele rozwiązań, jak pokazano w poniższej tabeli. Aby uzyskać szczegółowe informacje na temat rozwiązań zgodności, zobacz Obsługiwane lokalizacje i rozwiązania w usłudze Microsoft Purview.
Lokalizacja | Obsługiwane rozwiązanie |
---|---|
Exchange | Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności. |
Witryny programu SharePoint | Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności. |
Konta usługi OneDrive | Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności. |
Komunikat dotyczący czatu i kanału w usłudze Teams | Tekst jest dostępny dla rozwiązań zgodności. |
Urządzeń | Tekst jest dostępny dla rozwiązań zgodności. |
Ograniczenia dotyczące plików
Obrazy muszą być mniejsze niż 50 MB.
Obrazy muszą być co najmniej 50 x 50 pikseli i nie większe niż 16 000 x 16 000 pikseli.
Obrazy przekazane po włączeniu funkcji OCR są jedynymi skanowanymi obrazami.