Sprachunterstützung: benutzerdefinierte Modelle
Dieser Inhalt gilt für: Version 4.0 (Vorschau) | Vorherige Versionen: Version 3.1 (GA) Version 3.0 (GA) Version 2.1 (GA)
Dieser Inhalt gilt für: Version 3.1 (GA) | Aktuelle Version: Version 4.0 (Vorschau) | Vorherige Versionen: Version 3.0 Version 2.1
Dieser Inhalt gilt für: Version 3.0 (GA) | Aktuelle Versionen: Version 4.0 (Vorschau) Version 3.1 | Vorherige Version: Version 2.1
Dieser Inhalt gilt für: Version 2.1 | Neueste Version: Version 4.0 (Vorschau)
Azure KI Dokument Intelligenz-Modelle bieten Unterstützung für mehrsprachige Dokumentverarbeitung. Unsere Sprachunterstützungsfunktionen ermöglichen es Ihren Benutzern, auf natürliche Weise mit Ihren Anwendungen zu kommunizieren und die globale Reichweite zu erhöhen. Benutzerdefinierte Modelle werden mithilfe Ihrer beschrifteten Datasets trainiert, um unterschiedliche Daten aus strukturierten, halbstrukturierten und unstrukturierten Formularen und Dokumenten zu extrahieren, die für Ihre Anwendungsfälle spezifisch sind. Eigenständige benutzerdefinierte Modelle können kombiniert werden, um zusammengestellte Modelle zu erstellen. Die folgenden Tabellen enthalten die verfügbare Sprach- und Gebietsschemaunterstützung nach Modell und Feature:
Benutzerdefinierter Klassifizierer
Sprache – Gebietsschemacode | Standard |
---|---|
Englisch (USA) – en-US | Englisch (USA) – en-US |
Sprache | Code (optional) |
---|---|
Afrikaans | af |
Albanisch | sq |
Arabisch | ar |
Bulgarisch | bg |
Chinesisch (Han (vereinfachte Variante)) | zh-Hans |
Chinesisch (Han (traditionelle Variante)) | zh-Hant |
Kroatisch | hr |
Tschechisch | cs |
Dänisch | da |
Niederländisch | nl |
Estnisch | et |
Finnisch | fi |
Französisch | fr |
Deutsch | de |
Hebräisch | he |
Hindi | hi |
Ungarisch | hu |
Indonesisch | id |
Italienisch | it |
Japanisch | ja |
Koreanisch | ko |
Lettisch | lv |
Litauisch | lt |
Mazedonisch | mk |
Marathi | mr |
Neugriechisch (1453-) | el |
Nepali (Makrosprache) | ne |
Norwegisch | no |
Panjabi | pa |
Persisch | fa |
Polnisch | pl |
Portugiesisch | pt |
Rumänisch | rm |
Russisch | ru |
Slowakisch | sk |
Slowenisch | sl |
Somali (Arabisch) | so |
Somali (Lateinische Schrift) | so-latn |
Spanisch | es |
Swahili (Makrosprache) | sw |
Schwedisch | sv |
Tamilisch | ta |
Thailändisch | th |
Türkisch | tr |
Ukrainisch | uk |
Urdu | ur |
Vietnamesisch | vi |
Benutzerdefiniertes neuronales Modell
In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.
Sprache | Code (optional) |
---|---|
Afrikaans | af |
Albanisch | sq |
Arabisch | ar |
Bulgarisch | bg |
Chinesisch (vereinfacht) | zh-Hans |
Chinesisch (traditionell) | zh-Hant |
Kroatisch | hr |
Tschechisch | cs |
Dänisch | da |
Niederländisch | nl |
Estnisch | et |
Finnisch | fi |
Französisch | fr |
Deutsch | de |
Hebräisch | he |
Hindi | hi |
Ungarisch | hu |
Indonesisch | id |
Italienisch | it |
Japanisch | ja |
Koreanisch | ko |
Lettisch | lv |
Litauisch | lt |
Mazedonisch | mk |
Marathi | mr |
Neugriechisch (1453-) | el |
Nepali (Makrosprache) | ne |
Norwegisch | no |
Panjabi | pa |
Persisch | fa |
Polnisch | pl |
Portugiesisch | pt |
Rumänisch | rm |
Russisch | ru |
Slowakisch | sk |
Slowenisch | sl |
Somali (Arabisch) | so |
Somali (Lateinische Schrift) | so-latn |
Spanisch | es |
Swahili (Makrosprache) | sw |
Schwedisch | sv |
Tamilisch | ta |
Thailändisch | th |
Türkisch | tr |
Ukrainisch | uk |
Urdu | ur |
Vietnamesisch | vi |
Neuronale Modelle unterstützen hinzugefügte Sprachen in v3.1
und späteren APIs.
Sprachen | API-Version |
---|---|
Englisch | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) , v3.0:2022-08-31 (GA) |
Deutsch | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Italienisch | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Französisch | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Spanisch | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Niederländisch | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Benutzerdefiniertes Vorlagenmodell
In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.
Sprache | Code (optional) |
---|---|
Abasisch | abq |
Abchasische Sprache | ab |
Achinesisch | ace |
Acholi | ach |
Adangme | ada |
Adygeisch | ady |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanisch | sq |
Algonkin | alq |
Angika (Devanagari) | anp |
Arabisch | ar |
Asturisch | ast |
Asu (Tansania) | asa |
Avar | av |
Awadhi-Hindi (Devanagari) | awa |
Aymara | ay |
Aserbaidschanisch (Lateinisch) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Baschkirisch | ba |
Baskisch | eu |
Belarussisch (Kyrillisch) | be, be-cyrl |
Belarussisch (Lateinisch) | be, be-latn |
Bemba (Sambia) | bem |
Bena (Tansania) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bosnisch (Lateinisch) | bs |
Brajbha | bra |
Bretonisch | br |
Bulgarisch | bg |
Bundeli | bns |
Burjatisch (Kyrillisch) | bua |
Katalanisch | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Tschetschenisch | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Chinesisch (vereinfacht) | zh-Hans |
Chinesisch (traditionell) | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Tschuwaschische | cv |
Kornisch | kw |
Korsisch | co |
Cree | cr |
Creek | mus |
Krimtatarisch (Lateinisch) | crh |
Kroatisch | Std. |
Crow | cro |
Tschechisch | cs |
Dänisch | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dunganisch | dng |
Niederländisch | nl |
Efik | efi |
English | en |
Ersjanisch (Kyrillisch) | myv |
Estnisch | et |
Färöisch | fo |
Fidschi | fj |
Filipino | fil |
Finnisch | fi |
Sprache | Code (optional) |
---|---|
Fon | fon |
Französisch | fr |
Friaulisch | fur |
Ga | gaa |
Gagausisch (Lateinisch) | gag |
Galicisch | gl |
Ganda | lg |
Gayo | gay |
Deutsch | de |
Gilbertese | gil |
Gondi (Devanagari) | gon |
Griechisch | el |
Grönländisch | kl |
Guaraní | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Haitianisches Kreolisch | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Hawaiianisch | haw |
Hebräisch | er |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (Lateinisch) | mww |
Ho (Devanagiri) | hoc |
Ungarisch | hu |
Iban | iba |
Isländisch | stimmt |
Igbo | ig |
Iloko | ilo |
Inari-Samisch | smn |
Indonesisch | id |
Inguschisch | inh |
Interlingual | ia |
Inuktitut (Lateinisch) | iu |
Irisch | ga |
Italienisch | it |
Japanisch | ja |
Jaunsari (Devanagari) | Jns |
Javanisch | jv |
Jola-Fonyi | dyo |
Kabardinisch | kbd |
Kabuverdianu | kea |
Kachin (Lateinisch) | kac |
Kalenjin | kln |
Kalmückisch | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karatschai-Balkarisch | krc |
Karakalpakisch (Kyrillisch) | kaa-cyrl |
Karakalpakisch (Lateinisch) | kaa |
Kaschubisch | csb |
Kasachisch (Kyrillisch) | kk-cyrl |
Kasachisch (Lateinisch) | kk-latn |
Chakassisch | kjh |
Khaling | klr |
Khasi | kha |
K'iche' | quc |
Kikuyu | ki |
Kildinsamisch | sjd |
Kinyarwanda | rw |
Komi | kv |
Kikongo | kg |
Koreanisch | ko |
Korku | kfq |
Korjakisch | kpy |
Kosraeanisch | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumykisch (Kyrillisch) | kum |
Kurdisch (arabisch) | ku-arab |
Kurdisch (lateinisch) | ku-latn |
Kurukh (Devanagari) | kru |
Kirgisisch (Kyrillisch) | ky |
Lak | lbe |
Lakota | lkt |
Sprache | Code (optional) |
---|---|
Lateinisch | la |
Lettisch | lv |
Lezghian | lex |
Lingala | ln |
Litauisch | lt |
Niedersorbisch | dsb |
Lozi | loz |
Lule-Samisch | smj |
Luo (Kenia und Tansania) | luo |
Luxemburgisch | lb |
Luhyia | luy |
Mazedonisch | mk |
Machame | jmc |
Maduresisch | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Madagassisch | mg |
Malaiisch (Lateinisch) | ms |
Maltesisch | Mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | mi |
Mapudungun | arn |
Marathi | mr |
Mari (Russland) | chm |
Maa | mas |
Mende (Sierra Leone) | men (Männer) |
Meru | mer |
Meta' | mgo |
Minangkabau | Min |
Mohawk | moh |
Mongolisch (Kyrillisch) | mn |
Mongondow | mog |
Montenegrinisch (Kyrillisch) | cnr-cyrl |
Montenegrinisch (Lateinisch) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Neapolitanisch | nap |
Nepalesisch | ne |
Ngomba | jgo |
Niue | niu |
Nogaisch | nog |
Nord-Ndebele | nd |
Nordsamisch (Lateinisch) | sme |
Norwegisch | Nein |
Nyanja | ny |
Nkore | nyn |
Nzima | nzi |
Okzitanisch | oc |
Ojibwa | oj |
Oromo | om |
Ossetisch | os |
Pampanga | pam |
Pangasinensisch | pag |
Papiamento | pap |
Paschtu | ps |
Pedi | nso |
Persisch | fa |
Polnisch | pl |
Portugiesisch (Portugal) | pt |
Punjabi (Arabisch) | pa |
Quechua | qu |
Ripuarisch | ksh |
Rumänisch | ro |
Rätoromanisch | rm |
Rundi | rn |
Russisch | ru |
Rwa | rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoanisch (Lateinisch) | sm |
Sango | sg |
Sprache | Code (optional) |
---|---|
Sangu (Gabun) | snq |
Sanskrit (Devanagari) | sa |
Santali (Devanagiri) | sat |
Schotten | sco |
Schottisch-Gälisch | gd |
Sena | seh |
Serbisch (Kyrillisch) | sr-cyrl |
Serbisch (Lateinisch) | sr, sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt-Samisch | sms |
Slowakisch | sk |
Slowenisch | sl |
Soga | xog |
Somali (Arabisch) | SO |
Somali (Lateinische Schrift) | so-latn |
Songhai | son |
Süd-Ndebele | nr |
Südliches Altaisch | alt |
Südsamisch | sma |
Südliches Sotho | st |
Spanisch | es |
Sundanesisch | su |
Suaheli (Lateinisch) | sw |
Siswati | ss |
Schwedisch | sv |
Tabassaran | Tabulatorzeichen |
Taschelhit | shi |
Tahitisch | ty |
Taita | dav |
Tadschikisch (Kyrillisch) | tg |
Tamilisch | ta |
Tatar (Kyrillisch) | tt-cyrl |
Tatarisch (Lateinisch) | tt |
Teso | teo |
Tetum | tet |
Thailändisch | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongaisch | Bis |
Xitsonga | ts |
Setswana | tn |
Türkisch | tr |
Turkmenisch (Lateinisch) | tk |
Tuwinisch | tyv |
Udmurtisch | udm |
Uigurisch (Kyrillisch) | ug-cyrl |
Ukrainisch | uk |
Obersorbisch | hsb |
Urdu | ur |
Uigurisch (Arabisch) | ug |
Usbekisch (Arabisch) | uz-arab |
Usbekisch (kyrillisch) | uz-cyrl |
Usbekisch (Lateinisch) | uz |
Vietnamesisch | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Walisisch | cy |
Westfriesisch | fy |
Wolof | wo |
Xhosa | xh |
Yukatekisches Maya | yua |
Zapotekisch | zap |
Djerma | dje |
Zhuang | za |
Zulu | zu |
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Tickets als Feedbackmechanismus für Inhalte auslaufen lassen und es durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unter:Einreichen und Feedback anzeigen für