Prise en charge linguistique : modèles personnalisés
Ce contenu s’applique à : v3.1 (GA) | Dernière version : v4.0 (préversion) | Versions précédentes : v3.0 v2.1
Ce contenu s’applique à : v3.0 (GA) | Dernières versions : v4.0 (préversion) v3.1 | Version précédente : v2.1
Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (préversion)
Les modèles d’Intelligence documentaire d’Azure AI fournissent une prise en charge multilingue du traitement des documents. Nos fonctionnalités de prise en charge linguistique permettent à vos utilisateurs de communiquer avec vos applications de manière naturelle et renforcent leur portée mondiale. Des modèles personnalisés sont formés à l'aide de vos ensembles de données étiquetés pour extraire des données distinctes à partir de documents structurés, semi-structurés et non structurés, en fonction de vos cas d'utilisation. Ces modèles personnalisés autonomes peuvent être combinés pour créer des modèles composés. Les tableaux suivants répertorient la prise en charge des langues et des paramètres régionaux disponibles par modèle et fonctionnalité :
Classifieur personnalisé
Langue : code de paramètres régionaux | Default |
---|---|
Anglais (États-Unis) : en-US | Anglais (États-Unis) : en-US |
Langage | Code (facultatif) |
---|---|
Afrikaans | af |
Albanais | sq |
Arabe | ar |
Bulgare | bg |
Chinois (Han (variante simplifiée)) | zh-Hans |
Chinois (Han (variante traditionnelle)) | zh-Hant |
Croate | hr |
Tchèque | cs |
Danois | da |
Néerlandais | nl |
Estonien | et |
Finnois | fi |
Français | fr |
Allemand | de |
Hébreu | he |
Hindi | hi |
Hongrois | hu |
Indonésien | id |
Italien | it |
Japonais | ja |
Coréen | ko |
Letton | lv |
Lituanien | lt |
Macédonien | mk |
Marathi | mr |
Grec moderne (1453-) | el |
Népalais (macrolangue) | ne |
Norvégien | no |
Panjabi | pa |
Persan | fa |
Polonais | pl |
Portugais | pt |
Roumain | rm |
Russe | ru |
Slovaque | sk |
Slovène | sl |
Somali (arabe) | so |
Somalien (latin) | so-latn |
Espagnol | es |
Swahili (macrolangue) | sw |
Suédois | sv |
Tamoul | ta |
Thaï | th |
Turc | tr |
Ukrainien | uk |
Ourdou | ur |
Vietnamien | vi |
Générative personnalisée
Générative personnalisée prend uniquement en charge l’anglais en
Neural personnalisé
Le tableau suivant répertorie les langues prises en charge pour le texte imprimé.
Langage | Code (facultatif) |
---|---|
Afrikaans | af |
Albanais | sq |
Arabe | ar |
Bulgare | bg |
Chinois (simplifié) | zh-Hans |
Chinois (traditionnel) | zh-Hant |
Croate | hr |
Tchèque | cs |
Danois | da |
Néerlandais | nl |
Anglais | en |
Estonien | et |
Finnois | fi |
Français | fr |
Allemand | de |
Hébreu | he |
Hindi | hi |
Hongrois | hu |
Indonésien | id |
Italien | it |
Japonais | ja |
Coréen | ko |
Letton | lv |
Lituanien | lt |
Macédonien | mk |
Marathi | mr |
Grec moderne (1453-) | el |
Népalais (macrolangue) | ne |
Norvégien | no |
Panjabi | pa |
Persan | fa |
Polonais | pl |
Portugais | pt |
Roumain | rm |
Russe | ru |
Slovaque | sk |
Slovène | sl |
Somali (arabe) | so |
Somalien (latin) | so-latn |
Espagnol | es |
Swahili (macrolangue) | sw |
Suédois | sv |
Tamoul | ta |
Thaï | th |
Turc | tr |
Ukrainien | uk |
Ourdou | ur |
Vietnamien | vi |
Modèle personnalisé
Le tableau suivant répertorie les langues prises en charge pour le texte imprimé.
Langage | Code (facultatif) |
---|---|
Abaza | abq |
Abkhaze | ab |
Aceh | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanais | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Arabe | ar |
Asturien | ast |
Asu (Tanzanie) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aymara | ay |
Azerbaïdjanais (Latin) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Bashkir | ba |
Basque | eu |
Biélorusse (cyrillique) | be, be-cyrl |
Biélorusse (latin) | be, be-latn |
Bemba (Zambie) | bem |
Bena (Tanzanie) | bez |
Bhojpuri-Hindi (devanagari) | bho |
Bikol | bik |
Bini | bin |
Bichelamar | bi |
Bodo (devanagari) | brx |
Bosniaque (latin) | bs |
Brajbha | bra |
Breton | br |
Bulgare | bg |
Bundeli | bns |
Buryat (cyrillique) | bua |
Catalan | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Tchétchène | ce |
Chhattisgarhi (devanagari) | hne |
Chiga | cgg |
Chinois (simplifié) | zh-Hans |
Chinois traditionnel | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Tchouvache | cv |
Cornique | kw |
Corse | co |
Cris | cr |
Creek | mus |
Tatar de Crimée (latin) | crh |
Croate | hr |
Crow | cro |
Tchèque | cs |
Danois | da |
Dargwa | dar |
Dari | prs |
Dhimal (devanagari) | dhi |
Dogri (devanagari) | doi |
Duala | dua |
Dungan | dng |
Néerlandais | nl |
Efik | efi |
English | en |
Erzya (Cyrillique) | myv |
Estonien | et |
Féroïen | fo |
Fidjien | fj |
Filipino | fil |
Finnois | fi |
Langage | Code (facultatif) |
---|---|
Fon | fon |
Français | fr |
Frioulan | fur |
Ga | gaa |
Gagauz (Latin) | gag |
Galicien | gl |
Ganda | lg |
Gayo | gay |
Allemand | de |
Gilbertin | gil |
Gondi (devanagari) | gon |
Grec | el |
Groenlandais | kl |
Guarani | gn |
Gurung (devanagari) | gvr |
Gusii | guz |
Créole haïtien | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Hawaïen | haw |
Hébreu | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong daw (latin) | mww |
Ho (devanagari) | hoc |
Hongrois | hu |
Iban | iba |
Islandais | is |
Igbo | ig |
Iloko | ilo |
Inari Sami | smn |
Indonésien | id |
Ingush | inh |
Interlingua | ia |
Inuktitut (Latin) | iu |
Irlandais | ga |
Italien | it |
Japonais | ja |
Jaunsari (Devanagari) | Jns |
Javanais | jv |
Jola-Fonyi | dyo |
Kabarde | kbd |
Créole du Cap-Vert | kea |
Kachin (latin) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
Kara-Kalpak (Cyrillique) | kaa-cyrl |
Kara-Kalpak (Latin) | kaa |
Cachoube | csb |
Kazakh (Cyrillique) | kk-cyrl |
Kazakh (Latin) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
Quiché | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Coréen | ko |
Korku | kfq |
Koryak | kpy |
Kosrae | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumyk (Cyrillique) | kum |
Kurde (arabe) | ku-arab |
Kurde (latin) | ku-latn |
Kurukh (devanagari) | kru |
Kirghiz (cyrillique) | ky |
Lak | lbe |
Lakota | lkt |
Langage | Code (facultatif) |
---|---|
Latin | la |
Letton | lv |
Lezghien | lex |
Lingala | ln |
Lituanien | lt |
Bas sorabe | dsb |
Lozi | loz |
Lule Sami | smj |
Luo (Kenya et Tanzanie) | luo |
Luxembourgeois | lb |
Luyia | luy |
Macédonien | mk |
Machame | jmc |
Madurais | mad |
Mahasu Pahari (devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makondé | kde |
Malgache | mg |
Malais (latin) | ms |
Maltais | mt |
Malto (devanagari) | kmj |
Mandinka | mnk |
Mannois | gv |
Maori | mi |
Mapuche | arn |
Marathi | mr |
Mari (Russie) | chm |
Masai | mas |
Mende (Sierra Leone) | hommes |
Meru | mer |
Meta’ | mgo |
Minangkabau | min |
Mohawk | moh |
Mongole (cyrillique) | mn |
Mongondow | mog |
Monténégrin (cyrillique) | cnr-cyrl |
Montenegrin (latin) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitain | nap |
Népalais | ne |
Ngomba | jgo |
Niué | niu |
Nogay | nog |
Ndebele nord | nd |
Same du Nord (latin) | sme |
Norvégien | non |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Occitan | oc |
Ojibwa | oj |
Oromo | om |
Ossète | SE |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pachto | ps |
Pedi | nso |
Persan | fa |
Polonais | pl |
Portugais | pt |
Pendjabi (arabe) | pa |
Quechua | qu |
Francique ripuaire | ksh |
Roumain | ro |
Romanche | rm |
Rundi | rn |
Russe | ru |
Rwa | rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoan (latin) | sm |
Sango | sg |
Langage | Code (facultatif) |
---|---|
Sangu (Gabon) | snq |
Sanskrit (devanagari) | SA |
Santali (devanagari) | Sam |
Scots | sco |
Gaélique écossais | gd |
Sena | seh |
Serbe (cyrillique) | sr-cyrl |
Serbe (latin) | sr, sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (devanagari) | srx |
Same de Skolt | sms |
Slovaque | sk |
Slovène | sl |
Soga | xog |
Somali (arabe) | SO |
Somalien (latin) | so-latn |
Songhaï | son |
Ndebele sud | nr |
Altai sud | alt |
Same du Sud | sma |
Sotho sud | st |
Espagnol | es |
Soundanais | su |
Swahili (latin) | sw |
Swati | ss |
Suédois | sv |
Tabassaran | tab |
Tachelhit | shi |
Tahitien | ty |
Taita | dav |
Tadjik (cyrillique) | tg |
Tamoul | ta |
Tatar (cyrillique) | tt-cyrl |
Tatar (latin) | tt |
Teso | teo |
Tétoum | tet |
Thaï | th |
Thangmi | thf |
Tok Pisin | tpi |
Tonga | à |
Tsonga | ts |
Tswana | tn |
Turc | tr |
Turkmène (latin) | tk |
Touvain | tyv |
Udmurt | udm |
Ouïghour (cyrillique) | ug-cyrl |
Ukrainien | uk |
Haut sorabe | hsb |
Ourdou | ur |
Ouïgour (arabe) | ug |
Ouzbek (arabe) | uz-arab |
Ouzbek (cyrillique) | uz-cyrl |
Ouzbek (latin) | uz |
Vietnamien | vi |
Volapük | vo |
Vunjo | vun |
Haut-valaisan | wae |
Gallois | cy |
Frison occidental | fy |
Wolof | wo |
Xhosa | xh |
Yucatec Maya | yua |
Zapotèque | zap |
Zarma | dje |
Zhuang | za |
Zoulou | zu |