Share via


Sprachunterstützung: benutzerdefinierte Modelle

Dieser Inhalt gilt für:Häkchenv4.0 (Vorschau) | Vorherige Versionen:Blaues Häkchenv3.1 (GA)Blaues Häkchenv3.0 (GA)Blaues Häkchenv2.1 (GA)

Dieser Inhalt gilt für:Häkchenv3.1 (GA) | Aktuelle Version:Lila Häkchenv4.0 (Vorschau) | Vorherige Versionen:Blaues Häkchenv3.0Blaues Häkchenv2.1

Dieser Inhalt gilt für:Häkchenv3.0 (GA) | Aktuelle Versionen:Lila Häkchenv4.0 (Vorschau)Lila Häkchenv3.1 | Vorherige Version:Blaues Häkchenv2.1

Dieser Inhalt gilt für:Häkchenv2.1 | Neueste Version:Blaues Häkchenv4.0 (Vorschau)

Azure KI Dokument Intelligenz-Modelle bieten Unterstützung für mehrsprachige Dokumentverarbeitung. Unsere Sprachunterstützungsfunktionen ermöglichen es Ihren Benutzern, auf natürliche Weise mit Ihren Anwendungen zu kommunizieren und die globale Reichweite zu erhöhen. Benutzerdefinierte Modelle werden mithilfe Ihrer beschrifteten Datasets trainiert, um unterschiedliche Daten aus strukturierten, halbstrukturierten und unstrukturierten Formularen und Dokumenten zu extrahieren, die für Ihre Anwendungsfälle spezifisch sind. Eigenständige benutzerdefinierte Modelle können kombiniert werden, um zusammengestellte Modelle zu erstellen. Die folgenden Tabellen enthalten die verfügbare Sprach- und Gebietsschemaunterstützung nach Modell und Feature:

Benutzerdefinierter Klassifizierer

Sprache – Gebietsschemacode Standard
Englisch (USA) – en-US Englisch (USA) – en-US
Sprache Code (optional)
Afrikaans af
Albanisch sq
Arabisch ar
Bulgarisch bg
Chinesisch (Han (vereinfachte Variante)) zh-Hans
Chinesisch (Han (traditionelle Variante)) zh-Hant
Kroatisch hr
Tschechisch cs
Dänisch da
Niederländisch nl
Estnisch et
Finnisch fi
Französisch fr
Deutsch de
Hebräisch he
Hindi hi
Ungarisch hu
Indonesisch id
Italienisch it
Japanisch ja
Koreanisch ko
Lettisch lv
Litauisch lt
Mazedonisch mk
Marathi mr
Neugriechisch (1453-) el
Nepali (Makrosprache) ne
Norwegisch no
Panjabi pa
Persisch fa
Polnisch pl
Portugiesisch pt
Rumänisch rm
Russisch ru
Slowakisch sk
Slowenisch sl
Somali (Arabisch) so
Somali (Lateinische Schrift) so-latn
Spanisch es
Swahili (Makrosprache) sw
Schwedisch sv
Tamilisch ta
Thailändisch th
Türkisch tr
Ukrainisch uk
Urdu ur
Vietnamesisch vi

Benutzerdefiniertes neuronales Modell

In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.

Sprache Code (optional)
Afrikaans af
Albanisch sq
Arabisch ar
Bulgarisch bg
Chinesisch (vereinfacht) zh-Hans
Chinesisch (traditionell) zh-Hant
Kroatisch hr
Tschechisch cs
Dänisch da
Niederländisch nl
Estnisch et
Finnisch fi
Französisch fr
Deutsch de
Hebräisch he
Hindi hi
Ungarisch hu
Indonesisch id
Italienisch it
Japanisch ja
Koreanisch ko
Lettisch lv
Litauisch lt
Mazedonisch mk
Marathi mr
Neugriechisch (1453-) el
Nepali (Makrosprache) ne
Norwegisch no
Panjabi pa
Persisch fa
Polnisch pl
Portugiesisch pt
Rumänisch rm
Russisch ru
Slowakisch sk
Slowenisch sl
Somali (Arabisch) so
Somali (Lateinische Schrift) so-latn
Spanisch es
Swahili (Makrosprache) sw
Schwedisch sv
Tamilisch ta
Thailändisch th
Türkisch tr
Ukrainisch uk
Urdu ur
Vietnamesisch vi

Neuronale Modelle unterstützen hinzugefügte Sprachen in v3.1 und späteren APIs.

Sprachen API-Version
Englisch v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA), v3.0:2022-08-31 (GA)
Deutsch v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Italienisch v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Französisch v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Spanisch v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Niederländisch v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)

Benutzerdefiniertes Vorlagenmodell

In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.

Sprache Code (optional)
Abasisch abq
Abchasische Sprache ab
Achinesisch ace
Acholi ach
Adangme ada
Adygeisch ady
Afar aa
Afrikaans af
Akan ak
Albanisch sq
Algonkin alq
Angika (Devanagari) anp
Arabisch ar
Asturisch ast
Asu (Tansania) asa
Avar av
Awadhi-Hindi (Devanagari) awa
Aymara ay
Aserbaidschanisch (Lateinisch) az
Bafia ksf
Bagheli bfy
Bambara bm
Baschkirisch ba
Baskisch eu
Belarussisch (Kyrillisch) be, be-cyrl
Belarussisch (Lateinisch) be, be-latn
Bemba (Sambia) bem
Bena (Tansania) bez
Bhojpuri-Hindi (Devanagari) bho
Bikol bik
Bini bin
Bislama bi
Bodo (Devanagari) brx
Bosnisch (Lateinisch) bs
Brajbha bra
Bretonisch br
Bulgarisch bg
Bundeli bns
Burjatisch (Kyrillisch) bua
Katalanisch ca
Cebuano ceb
Chamling rab
Chamorro ch
Tschetschenisch ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Chinesisch (vereinfacht) zh-Hans
Chinesisch (traditionell) zh-Hant
Choctaw cho
Chukot ckt
Tschuwaschische cv
Kornisch kw
Korsisch co
Cree cr
Creek mus
Krimtatarisch (Lateinisch) crh
Kroatisch Std.
Crow cro
Tschechisch cs
Dänisch da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) doi
Duala dua
Dunganisch dng
Niederländisch nl
Efik efi
English en
Ersjanisch (Kyrillisch) myv
Estnisch et
Färöisch fo
Fidschi fj
Filipino fil
Finnisch fi
Sprache Code (optional)
Fon fon
Französisch fr
Friaulisch fur
Ga gaa
Gagausisch (Lateinisch) gag
Galicisch gl
Ganda lg
Gayo gay
Deutsch de
Gilbertese gil
Gondi (Devanagari) gon
Griechisch el
Grönländisch kl
Guaraní gn
Gurung (Devanagari) gvr
Gusii guz
Haitianisches Kreolisch ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Hawaiianisch haw
Hebräisch er
Herero hz
Hiligaynon hil
Hindi hi
Hmong Daw (Lateinisch) mww
Ho (Devanagiri) hoc
Ungarisch hu
Iban iba
Isländisch stimmt
Igbo ig
Iloko ilo
Inari-Samisch smn
Indonesisch id
Inguschisch inh
Interlingual ia
Inuktitut (Lateinisch) iu
Irisch ga
Italienisch it
Japanisch ja
Jaunsari (Devanagari) Jns
Javanisch jv
Jola-Fonyi dyo
Kabardinisch kbd
Kabuverdianu kea
Kachin (Lateinisch) kac
Kalenjin kln
Kalmückisch xal
Kangri (Devanagari) xnr
Kanuri kr
Karatschai-Balkarisch krc
Karakalpakisch (Kyrillisch) kaa-cyrl
Karakalpakisch (Lateinisch) kaa
Kaschubisch csb
Kasachisch (Kyrillisch) kk-cyrl
Kasachisch (Lateinisch) kk-latn
Chakassisch kjh
Khaling klr
Khasi kha
K'iche' quc
Kikuyu ki
Kildinsamisch sjd
Kinyarwanda rw
Komi kv
Kikongo kg
Koreanisch ko
Korku kfq
Korjakisch kpy
Kosraeanisch kos
Kpelle kpe
Kuanyama kj
Kumykisch (Kyrillisch) kum
Kurdisch (arabisch) ku-arab
Kurdisch (lateinisch) ku-latn
Kurukh (Devanagari) kru
Kirgisisch (Kyrillisch) ky
Lak lbe
Lakota lkt
Sprache Code (optional)
Lateinisch la
Lettisch lv
Lezghian lex
Lingala ln
Litauisch lt
Niedersorbisch dsb
Lozi loz
Lule-Samisch smj
Luo (Kenia und Tansania) luo
Luxemburgisch lb
Luhyia luy
Mazedonisch mk
Machame jmc
Maduresisch mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto mgh
Makonde kde
Madagassisch mg
Malaiisch (Lateinisch) ms
Maltesisch Mt
Malto (Devanagari) kmj
Mandinka mnk
Manx gv
Maori mi
Mapudungun arn
Marathi mr
Mari (Russland) chm
Maa mas
Mende (Sierra Leone) men (Männer)
Meru mer
Meta' mgo
Minangkabau Min
Mohawk moh
Mongolisch (Kyrillisch) mn
Mongondow mog
Montenegrinisch (Kyrillisch) cnr-cyrl
Montenegrinisch (Lateinisch) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl nah
Navajo nv
Ndonga ng
Neapolitanisch nap
Nepalesisch ne
Ngomba jgo
Niue niu
Nogaisch nog
Nord-Ndebele nd
Nordsamisch (Lateinisch) sme
Norwegisch Nein
Nyanja ny
Nkore nyn
Nzima nzi
Okzitanisch oc
Ojibwa oj
Oromo om
Ossetisch os
Pampanga pam
Pangasinensisch pag
Papiamento pap
Paschtu ps
Pedi nso
Persisch fa
Polnisch pl
Portugiesisch (Portugal) pt
Punjabi (Arabisch) pa
Quechua qu
Ripuarisch ksh
Rumänisch ro
Rätoromanisch rm
Rundi rn
Russisch ru
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
Samoanisch (Lateinisch) sm
Sango sg
Sprache Code (optional)
Sangu (Gabun) snq
Sanskrit (Devanagari) sa
Santali (Devanagiri) sat
Schotten sco
Schottisch-Gälisch gd
Sena seh
Serbisch (Kyrillisch) sr-cyrl
Serbisch (Lateinisch) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) srx
Skolt-Samisch sms
Slowakisch sk
Slowenisch sl
Soga xog
Somali (Arabisch) SO
Somali (Lateinische Schrift) so-latn
Songhai son
Süd-Ndebele nr
Südliches Altaisch alt
Südsamisch sma
Südliches Sotho st
Spanisch es
Sundanesisch su
Suaheli (Lateinisch) sw
Siswati ss
Schwedisch sv
Tabassaran Tabulatorzeichen
Taschelhit shi
Tahitisch ty
Taita dav
Tadschikisch (Kyrillisch) tg
Tamilisch ta
Tatar (Kyrillisch) tt-cyrl
Tatarisch (Lateinisch) tt
Teso teo
Tetum tet
Thailändisch th
Thangmi thf
Tok Pisin tpi
Tongaisch Bis
Xitsonga ts
Setswana tn
Türkisch tr
Turkmenisch (Lateinisch) tk
Tuwinisch tyv
Udmurtisch udm
Uigurisch (Kyrillisch) ug-cyrl
Ukrainisch uk
Obersorbisch hsb
Urdu ur
Uigurisch (Arabisch) ug
Usbekisch (Arabisch) uz-arab
Usbekisch (kyrillisch) uz-cyrl
Usbekisch (Lateinisch) uz
Vietnamesisch vi
Volapük vo
Vunjo vun
Walser wae
Walisisch cy
Westfriesisch fy
Wolof wo
Xhosa xh
Yukatekisches Maya yua
Zapotekisch zap
Djerma dje
Zhuang za
Zulu zu