Dela via


Inbyggd modell för textidentifiering

Den inbyggda textigenkänningsmodellen kan extrahera identifierade ord från dokument och bilder till maskinläsbara teckenströmmar. Den använder OCR (optisk teckenläsning) till att identifiera tryckt och handskriven text i bilder.

Denna modell bearbetar bilder och dokumentfiler för att extrahera rader med tryckt eller handskriven text.

Används i Power Apps

Den fördefinierade textigenkänningsmodellen är tillgänglig i Power Apps via textigenkänningskomponenten. Mer information: Använda textigenkänningskomponenten i Power Apps

Används i Power Automate

Information om hur du använder den här modellen i Power Automate finns i Använda den fördefinierade modellen för textidentifiering i Power Automate.

Språk, format och storlek som stöds

De filer som du kan skanna med textigenkänningsmodellen måste ha följande egenskaper:

  • Språk för tryck text: Afrikaans, albanska, angika (devanagiri), arabiska, asturianska, awadhi-hindi (devanagiri), azerbajdzjanska (latin), bagheli, baskiska, vitryska (kyrilliska), vitryska (latin), bhojpuri-hindi (devanagiri), bislama, devanagiri , bosniska (latin), brajbha, bretonska, bulgariska, bundeli, buryat (kyrilliska), katalanska, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kinesiska (förenklad), kinesiska (traditionell), korniska, korsikanska, krimtatariska (latinska), kroatiska, tjeckiska, danska, dari, dhimal (devanagiri), dogri (devanagiri), holländska, engelska, erzya (kyrilliska), estniska, färöiska, fijianska, filippinska, finska, franska, friuliska, gagauz (latin), galiciska, tyska, gilbertesiska, gondi (devanagiri), grönländska, gurung (devanagiri), haitisk kreol, halbi (devanagiri), hani, haryanvi, hawaiiska, hindi, hmong daw (latin), ho (devanagiri), ungerska, isländska, enaresamiska, indonesiska, interlingua, inuktitut (latin), irländska, italienska, japanska, jaunsari (devanagiri), javanesiska, kabuverdianu, kachin (latin), kangri (devanagiri), karachay-balkar, kara-kalpak (kyrilliska), kara-kalpak (latin), kashubian, kazakh (kyrilliska), kazakh (latin), khaling, khasi, k'iche ', korean, korku, koryak, kosraisk, kumyk (kyrilliska), kurdiska (arabiska), kurdiska (latinska), kurukh (devanagiri), kirgiziska (kyrilliska), lakota, latinska, litauiska, lägre, lulesamiska, luxemburgska, mahasu pahari (devanagiri), malajiska ( latinska), maltesiska, malto (devanagiri), manx, maori, marathi, mongoliska (kyrilliska), montenegrinska (kyrilliska), montenegrinska (latinska), napolitanska, nepalesiska, niueanska, nogayiska, nordsamiska (latinska), norska, occitanska, ossetiska, pashto, persiska, polska, portugisiska, punjabi (arabiska), ripuariska, rumänska, romanska, ryska, sadri(devanagiri), samoanska (latin), sanskrit (devanagari), santali (devanagiri), lågskotska, skotsk gäliska, serbiska (latin), sherpa (devanagiri), sirmauri (devanagiri), skoltsamiska, slovakiska, slovenska, somaliska (arabiska), sydsamiska, spanska, swahili (latin), svenska, tadzjikiska (kyrilliska), tatariska (latinska), tetum, thangmi, tonganska, turkiska, turkmeniska (latinska), tuvanska, övre, urdu, uiguriska (arabiska), uzbekiska (arabiska), uzbekiska (kyrilliska), uzbekiska (latin), volapük, walsertyska, walesiska, västfrisiska, yukatek, zhuang, zulu
  • Språk för handskriven text: engelska, kinesiska (förenklad), franska, tyska, italienska, japanska, koreanska, portugisiska, spanska
  • Format:
    • JPG
    • PNG
    • BMP
    • PDF
  • Storlek: 20 MB maximalt
  • För PDF-dokument bearbetas endast de första 2,000 sidorna.

Modell-utdata

Om ett dokument identifieras, kommer textigenkänningsmodellen att visa följande information:

  • Resultat: En lista med rader som har extraherats från den inmatade texten.
  • Text: Strängar som innehåller textraden som identifierades.
  • BoundingBox: Fyra värden som motsvarar avgränsningsrutan, där de övre och vänstra positionerna samt bredd och höjd beskrivs.

Gränser

Åtgärd Gräns Förnyelseperiod
Textidentifieringssamtal (per miljö) 480 60 sekunder

Se även

Utbildning: Identifiera text med AI Builder (modul)