Sdílet prostřednictvím


Přehled optického rozpoznávání znaků v Microsoft Syntexu

Poznámka

Až do června 2025 si můžete zdarma vyzkoušet optické rozpoznávání znaků a další vybrané služby Syntex, pokud máte nastavené průběžné platby . Informace a omezení najdete v tématu Vyzkoušejte si Microsoft Syntex a prozkoumejte jeho služby.

Služba optického rozpoznávání znaků (OCR) v Microsoft Syntexu umožňuje extrahovat tištěný nebo ručně psaný text z obrázků a dokumentů. Mezi příklady obrázků patří plakáty, kresby a popisky produktů. Mezi příklady dokumentů patří články, sestavy, formuláře a faktury.

Text se obvykle extrahuje jako slova, řádky textu a odstavce nebo bloky textu, což umožňuje přístup k digitální verzi naskenovaného textu. Extrahované informace se indexují při hledání a dají se zpřístupnit pro funkce dodržování předpisů, jako je ochrana před únikem informací (DLP).

Například povolíte službu OCR a pak do knihovny dokumentů přidáte soubory obrázků. Microsoft Syntex automaticky prohledá soubory obrázků, extrahuje příslušný text a zpřístupní text z obrázků pro vyhledávání a indexování. Tato funkce umožňuje rychle a přesně najít klíčová slova a fráze, které hledáte.

Požadavky a omezení

Podporované typy souborů

Koncový bod Podporované typy souborů
SharePoint a OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff a .pdf (jenom obrázek)
Teams, Exchange a zařízení s Windows .bmp, .png, .jpeg, .jpg, .tiff a .pdf (jenom obrázek)

Poznámka

Když použijete OCR u souboru obrázku, text se uloží do sloupce Extrahovaná textová metadata. Když použijete OCR u souboru PDF nebo TIFF, extrahovaný text se indexuje při hledání, ale není k dispozici ve sloupci metadat.

Podporované jazyky

Služba OCR podporuje více než 150 jazyků.

Podporovaná umístění a řešení

Služba OCR podporuje několik řešení, jak je znázorněno v následující tabulce. Podrobnosti o řešeních dodržování předpisů najdete v tématu Podporovaná umístění a řešení v Microsoft Purview.

Umístění Podporované řešení
Exchange Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním.
Pro řešení dodržování předpisů je k dispozici text.
Sharepointové weby Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním.
Pro řešení dodržování předpisů je k dispozici text.
Účty OneDrivu Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním.
Pro řešení dodržování předpisů je k dispozici text.
Zpráva chatu a kanálu Teams Pro řešení dodržování předpisů je k dispozici text.
Zařízení Pro řešení dodržování předpisů je k dispozici text.

Omezení souborů

  • Obrázky musí být menší než 50 MB.

  • Obrázky musí být alespoň 50 × 50 pixelů a nesmí být větší než 16 000 × 16 000 pixelů.

  • Obrázky nahrané po povolení technologie OCR jsou jediné obrázky, které se kontrolují.

  • Obrázky vložené do dokumentů Office se nepodporují.