Předem připravený model pro rozpoznávání textu

Předem vytvořený model pro rozpoznávání textu extrahuje slova z dokumentů a obrázků do strojově čitelných znakových proudů. Používá moderní technologii optického rozpoznávání znaků (OCR) ke zjišťování tištěného a rukopisného textu v obrázcích.

Tento model zpracovává soubory obrázků a dokumentů a extrahuje z nich řádky tištěného nebo rukopisného textu.

Používáno v Power Apps

Předem vytvořený model pro rozpoznávání textu je k dispozici v Power Apps prostřednictvím komponenty pro rozpoznávání textu. Více informací:Použití součásti pro rozpoznávání textu v Power Apps

Použití v Power Automate

Informace o tom, jak používat tento model v Power Automate, viz Použijte předem připravený model rozpoznávání textu Power Automate.

Podporovaný jazyk, formát a velikost

Soubory, které se dají prohledávat pomocí tohoto modelu pro rozpoznávání textu, musí mít tyto charakteristiky:

  • Jazyk pro tištěný text : afrikánština, albánština, angičtina (dévanágiri), arabština, asturština, awadhi-hindština (dévanágiri), ázerbájdžánština (latinka), bagheli, baskičtina, běloruština (cyrilice), běloruština (latinka), bhódžpuri-hindština (dévanágiri), bišlama, bódština (dévanágiri), bosenština (latinka), brajbha, bretonština, bulharština, bundeli, burjatština (cyrilice), katalánština, čeština, dánština, čamlingština, čamorro, čhattísgarština (dévanágiri), čínština (zjednodušená), čínština (tradiční), kornština, korsičtina, krymská tatarština (latinka), chorvatština, čeština, dánština, darí, dhimalština (dévanágiri), dogri (dévanágiri), holandština, angličtina, eržština (cyrilice), estonština, faerština, fidžijština, filipínština, finština, francouzština, friulština, gagauzština (latina), galicijština, němčina, gilbertština, gondština (dévanágiri), grónština, gurungština (dévanágiri), haitská kreolština, halbština (dévanágiri), hani, harjanština, havajština, hindština, hmongština (latina), ho(dévanágiri), maďarština, islandština, inarijština, indonéština, interlingva, inuktitština (latinka), irština, italština, japonština, džunšarština (dévanágiri), javánština, kabuverdianu, kačínština (latinka), kangri (dévanágiri), karačajbalkarština, kara-kalpak (cyrilice), kara-kalpak (latinka), kašubština, kazaština (cyrilice), kazaština (latinka), chalingština, chasijština, k'icheština, korejština, korkuština, korjačtina, kosrajština, kumykština (cyrilice), kurdština (arabština), kurdština (latinka), kuruchština (dévanágiri), kyrgyzština (cyrilice), lakotština, latinka, litevština, dolnolužická srbština, lulešská samijština, lucemburština, mahasu paharí (dévanágiri), malajština (latinka), maltština, maltézština (dévanágiri), manština, maorština, maráthština, mongolština (cyrilice), černohorština (cyrilice), černohorština (latinka), neapolština, nepálština, nijština, nogajština, severosamijština (latinka), norština, okcitánština, osetština, paštunština, perština, polština, portugalština, paňdžábština (arabština), ripuárština, rumunština, rumunština, ruština, sádrí (dévanágarí), samojština (latinka), sanskrt (dévanágarí), santali (dévanágarí), skotština, skotská gaelština, srbština (latinka), šerpa (dévanágarí), sirmauri (dévanágarí), skoltština, slovenština, slovinština, somálština (arabština), jižní samijština, španělština, svahilština (latinka), švédština, tádžičtina (cyrilice), tatarština (latinka), tetumština, thangmština, tongánština, turečtina, turkmenština (latinka), tuvinština, hornolužická srbština, urdština, ujgurština (arabština), uzbečtina (arabština), uzbečtina (cyrilice), uzbečtina (latinka), volápükština, valaština, západofríština, yucatecká mayština, zhuang, zulu
  • Jazyk pro ručně psaný text: angličtina, čínština (zjednodušená), francouzština, němčina, italština, japonština, korejština, portugalština, španělština
  • Formát:
    • JPG
    • PNG
    • BMP
    • PDF
  • velikost: Maximální velikost 20 MB
  • U dokumentů PDF se zpracuje pouze prvních 2,000 stránek.

Výstup modelu

Při zjištění dokumentu jsou výstupem modelu pro rozpoznávání textu tyto informace:

  • Výsledky: Seznam řádků extrahovaných ze vstupního textu.
  • Text: Řetězce obsahující řádek zjištěného textu.
  • BoundingBox: Čtyři hodnoty, které popisují ohraničující rámeček – horní a levá pozice, šířka a výška.

Limity

Akce Limit Období prodloužení
Volání rozpoznávání textu (podle prostředí) 480 60 sekund

Viz také

Cvičení: Rozpoznejte text pomocí AI Builder (modul)