Inbyggd modell för textidentifiering
Den inbyggda textigenkänningsmodellen kan extrahera identifierade ord från dokument och bilder till maskinläsbara teckenströmmar. Den använder OCR (optisk teckenläsning) till att identifiera tryckt och handskriven text i bilder.
Denna modell bearbetar bilder och dokumentfiler för att extrahera rader med tryckt eller handskriven text.
Används i Power Apps
Den fördefinierade textigenkänningsmodellen är tillgänglig i Power Apps via textigenkänningskomponenten. Mer information: Använda textigenkänningskomponenten i Power Apps
Används i Power Automate
Information om hur du använder den här modellen i Power Automate finns i Använda den fördefinierade modellen för textidentifiering i Power Automate.
Språk, format och storlek som stöds
De filer som du kan skanna med textigenkänningsmodellen måste ha följande egenskaper:
- Språk för tryck text: Afrikaans, albanska, angika (devanagiri), arabiska, asturianska, awadhi-hindi (devanagiri), azerbajdzjanska (latin), bagheli, baskiska, vitryska (kyrilliska), vitryska (latin), bhojpuri-hindi (devanagiri), bislama, devanagiri , bosniska (latin), brajbha, bretonska, bulgariska, bundeli, buryat (kyrilliska), katalanska, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kinesiska (förenklad), kinesiska (traditionell), korniska, korsikanska, krimtatariska (latinska), kroatiska, tjeckiska, danska, dari, dhimal (devanagiri), dogri (devanagiri), holländska, engelska, erzya (kyrilliska), estniska, färöiska, fijianska, filippinska, finska, franska, friuliska, gagauz (latin), galiciska, tyska, gilbertesiska, gondi (devanagiri), grönländska, gurung (devanagiri), haitisk kreol, halbi (devanagiri), hani, haryanvi, hawaiiska, hindi, hmong daw (latin), ho (devanagiri), ungerska, isländska, enaresamiska, indonesiska, interlingua, inuktitut (latin), irländska, italienska, japanska, jaunsari (devanagiri), javanesiska, kabuverdianu, kachin (latin), kangri (devanagiri), karachay-balkar, kara-kalpak (kyrilliska), kara-kalpak (latin), kashubian, kazakh (kyrilliska), kazakh (latin), khaling, khasi, k'iche ', korean, korku, koryak, kosraisk, kumyk (kyrilliska), kurdiska (arabiska), kurdiska (latinska), kurukh (devanagiri), kirgiziska (kyrilliska), lakota, latinska, litauiska, lägre, lulesamiska, luxemburgska, mahasu pahari (devanagiri), malajiska ( latinska), maltesiska, malto (devanagiri), manx, maori, marathi, mongoliska (kyrilliska), montenegrinska (kyrilliska), montenegrinska (latinska), napolitanska, nepalesiska, niueanska, nogayiska, nordsamiska (latinska), norska, occitanska, ossetiska, pashto, persiska, polska, portugisiska, punjabi (arabiska), ripuariska, rumänska, romanska, ryska, sadri(devanagiri), samoanska (latin), sanskrit (devanagari), santali (devanagiri), lågskotska, skotsk gäliska, serbiska (latin), sherpa (devanagiri), sirmauri (devanagiri), skoltsamiska, slovakiska, slovenska, somaliska (arabiska), sydsamiska, spanska, swahili (latin), svenska, tadzjikiska (kyrilliska), tatariska (latinska), tetum, thangmi, tonganska, turkiska, turkmeniska (latinska), tuvanska, övre, urdu, uiguriska (arabiska), uzbekiska (arabiska), uzbekiska (kyrilliska), uzbekiska (latin), volapük, walsertyska, walesiska, västfrisiska, yukatek, zhuang, zulu
- Språk för handskriven text: engelska, kinesiska (förenklad), franska, tyska, italienska, japanska, koreanska, portugisiska, spanska
- Format:
- JPG
- PNG
- BMP
- Storlek: 20 MB maximalt
- För PDF-dokument bearbetas endast de första 2,000 sidorna.
Modell-utdata
Om ett dokument identifieras, kommer textigenkänningsmodellen att visa följande information:
- Resultat: En lista med rader som har extraherats från den inmatade texten.
- Text: Strängar som innehåller textraden som identifierades.
- BoundingBox: Fyra värden som motsvarar avgränsningsrutan, där de övre och vänstra positionerna samt bredd och höjd beskrivs.
Gränser
Åtgärd | Gräns | Förnyelseperiod |
---|---|---|
Textidentifieringssamtal (per miljö) | 480 | 60 sekunder |