Prise en charge linguistique : modèles personnalisés
Ce contenu s’applique à : v3.1 (GA) | Dernière version : v4.0 (préversion) | Versions précédentes : v3.0 v2.1
Ce contenu s’applique à : v3.0 (GA) | Dernières versions : v4.0 (préversion) v3.1 | Dernière version : v2.1
Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (préversion)
Les modèles d’Intelligence documentaire d’Azure AI fournissent une prise en charge multilingue du traitement des documents. Nos fonctionnalités de prise en charge linguistique permettent à vos utilisateurs de communiquer avec vos applications de manière naturelle et renforcent leur portée mondiale. Des modèles personnalisés sont formés à l'aide de vos ensembles de données étiquetés pour extraire des données distinctes à partir de documents structurés, semi-structurés et non structurés, en fonction de vos cas d'utilisation. Ces modèles personnalisés autonomes peuvent être combinés pour créer des modèles composés. Les tableaux suivants répertorient la prise en charge des langues et des paramètres régionaux disponibles par modèle et fonctionnalité :
Classifieur personnalisé
Langue : code de paramètres régionaux | Default |
---|---|
Anglais (États-Unis) : en-US | Anglais (États-Unis) : en-US |
Langage | Code (facultatif) |
---|---|
Afrikaans | af |
Albanais | sq |
Arabe | ar |
Bulgare | bg |
Chinois (Han (variante simplifiée)) | zh-Hans |
Chinois (Han (variante traditionnelle)) | zh-Hant |
Croate | hr |
Tchèque | cs |
Danois | da |
Néerlandais | nl |
Estonien | et |
Finnois | fi |
Français | fr |
Allemand | de |
Hébreu | he |
Hindi | hi |
Hongrois | hu |
Indonésien | id |
Italien | it |
Japonais | ja |
Coréen | ko |
Letton | lv |
Lituanien | lt |
Macédonien | mk |
Marathi | mr |
Grec moderne (1453-) | el |
Népalais (macrolangue) | ne |
Norvégien | no |
Panjabi | pa |
Persan | fa |
Polonais | pl |
Portugais | pt |
Roumain | rm |
Russe | ru |
Slovaque | sk |
Slovène | sl |
Somali (arabe) | so |
Somalien (latin) | so-latn |
Espagnol | es |
Swahili (macrolangue) | sw |
Suédois | sv |
Tamoul | ta |
Thaï | th |
Turc | tr |
Ukrainien | uk |
Ourdou | ur |
Vietnamien | vi |
Neural personnalisé
Le tableau suivant répertorie les langues prises en charge pour le texte imprimé.
Langage | Code (facultatif) |
---|---|
Afrikaans | af |
Albanais | sq |
Arabe | ar |
Bulgare | bg |
Chinois (simplifié) | zh-Hans |
Chinois (traditionnel) | zh-Hant |
Croate | hr |
Tchèque | cs |
Danois | da |
Néerlandais | nl |
Estonien | et |
Finnois | fi |
Français | fr |
Allemand | de |
Hébreu | he |
Hindi | hi |
Hongrois | hu |
Indonésien | id |
Italien | it |
Japonais | ja |
Coréen | ko |
Letton | lv |
Lituanien | lt |
Macédonien | mk |
Marathi | mr |
Grec moderne (1453-) | el |
Népalais (macrolangue) | ne |
Norvégien | no |
Panjabi | pa |
Persan | fa |
Polonais | pl |
Portugais | pt |
Roumain | rm |
Russe | ru |
Slovaque | sk |
Slovène | sl |
Somali (arabe) | so |
Somalien (latin) | so-latn |
Espagnol | es |
Swahili (macrolangue) | sw |
Suédois | sv |
Tamoul | ta |
Thaï | th |
Turc | tr |
Ukrainien | uk |
Ourdou | ur |
Vietnamien | vi |
Les modèles neuraux prennent en charge les langues ajoutées pour v3.1
et les API ultérieures.
Langages | Version de l'API |
---|---|
Anglais | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) , v3.0:2022-08-31 (GA) |
Allemand | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Italien | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Français | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Espagnol | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Néerlandais | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Modèle personnalisé
Le tableau suivant répertorie les langues prises en charge pour le texte imprimé.
Langage | Code (facultatif) |
---|---|
Abaza | abq |
Abkhaze | ab |
Aceh | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanais | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Arabe | ar |
Asturien | ast |
Asu (Tanzanie) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aymara | ay |
Azerbaïdjanais (Latin) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Bashkir | ba |
Basque | eu |
Biélorusse (cyrillique) | be, be-cyrl |
Biélorusse (latin) | be, be-latn |
Bemba (Zambie) | bem |
Bena (Tanzanie) | bez |
Bhojpuri-Hindi (devanagari) | bho |
Bikol | bik |
Bini | bin |
Bichelamar | bi |
Bodo (devanagari) | brx |
Bosniaque (latin) | bs |
Brajbha | bra |
Breton | br |
Bulgare | bg |
Bundeli | bns |
Buryat (cyrillique) | bua |
Catalan | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Tchétchène | ce |
Chhattisgarhi (devanagari) | hne |
Chiga | cgg |
Chinois (simplifié) | zh-Hans |
Chinois traditionnel | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Tchouvache | cv |
Cornique | kw |
Corse | co |
Cris | cr |
Creek | mus |
Tatar de Crimée (latin) | crh |
Croate | hr |
Crow | cro |
Tchèque | cs |
Danois | da |
Dargwa | dar |
Dari | prs |
Dhimal (devanagari) | dhi |
Dogri (devanagari) | doi |
Duala | dua |
Dungan | dng |
Néerlandais | nl |
Efik | efi |
English | en |
Erzya (Cyrillique) | myv |
Estonien | et |
Féroïen | fo |
Fidjien | fj |
Filipino | fil |
Finnois | fi |
Langage | Code (facultatif) |
---|---|
Fon | fon |
Français | fr |
Frioulan | fur |
Ga | gaa |
Gagauz (Latin) | gag |
Galicien | gl |
Ganda | lg |
Gayo | gay |
Allemand | de |
Gilbertin | gil |
Gondi (devanagari) | gon |
Grec | el |
Groenlandais | kl |
Guarani | gn |
Gurung (devanagari) | gvr |
Gusii | guz |
Créole haïtien | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Hawaïen | haw |
Hébreu | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong daw (latin) | mww |
Ho (devanagari) | hoc |
Hongrois | hu |
Iban | iba |
Islandais | is |
Igbo | ig |
Iloko | ilo |
Inari Sami | smn |
Indonésien | id |
Ingush | inh |
Interlingua | ia |
Inuktitut (Latin) | iu |
Irlandais | ga |
Italien | it |
Japonais | ja |
Jaunsari (Devanagari) | Jns |
Javanais | jv |
Jola-Fonyi | dyo |
Kabarde | kbd |
Créole du Cap-Vert | kea |
Kachin (latin) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
Kara-Kalpak (Cyrillique) | kaa-cyrl |
Kara-Kalpak (Latin) | kaa |
Cachoube | csb |
Kazakh (Cyrillique) | kk-cyrl |
Kazakh (Latin) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
Quiché | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Coréen | ko |
Korku | kfq |
Koryak | kpy |
Kosrae | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumyk (Cyrillique) | kum |
Kurde (arabe) | ku-arab |
Kurde (latin) | ku-latn |
Kurukh (devanagari) | kru |
Kirghiz (cyrillique) | ky |
Lak | lbe |
Lakota | lkt |
Langage | Code (facultatif) |
---|---|
Latin | la |
Letton | lv |
Lezghien | lex |
Lingala | ln |
Lituanien | lt |
Bas sorabe | dsb |
Lozi | loz |
Lule Sami | smj |
Luo (Kenya et Tanzanie) | luo |
Luxembourgeois | lb |
Luyia | luy |
Macédonien | mk |
Machame | jmc |
Madurais | mad |
Mahasu Pahari (devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makondé | kde |
Malgache | mg |
Malais (latin) | ms |
Maltais | mt |
Malto (devanagari) | kmj |
Mandinka | mnk |
Mannois | gv |
Maori | mi |
Mapuche | arn |
Marathi | mr |
Mari (Russie) | chm |
Masai | mas |
Mende (Sierra Leone) | hommes |
Meru | mer |
Meta’ | mgo |
Minangkabau | min |
Mohawk | moh |
Mongole (cyrillique) | mn |
Mongondow | mog |
Monténégrin (cyrillique) | cnr-cyrl |
Montenegrin (latin) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitain | nap |
Népalais | ne |
Ngomba | jgo |
Niué | niu |
Nogay | nog |
Ndebele nord | nd |
Same du Nord (latin) | sme |
Norvégien | non |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Occitan | oc |
Ojibwa | oj |
Oromo | om |
Ossète | SE |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pachto | ps |
Pedi | nso |
Persan | fa |
Polonais | pl |
Portugais | pt |
Pendjabi (arabe) | pa |
Quechua | qu |
Francique ripuaire | ksh |
Roumain | ro |
Romanche | rm |
Rundi | rn |
Russe | ru |
Rwa | rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoan (latin) | sm |
Sango | sg |
Langage | Code (facultatif) |
---|---|
Sangu (Gabon) | snq |
Sanskrit (devanagari) | SA |
Santali (devanagari) | Sam |
Scots | sco |
Gaélique écossais | gd |
Sena | seh |
Serbe (cyrillique) | sr-cyrl |
Serbe (latin) | sr, sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (devanagari) | srx |
Same de Skolt | sms |
Slovaque | sk |
Slovène | sl |
Soga | xog |
Somali (arabe) | SO |
Somalien (latin) | so-latn |
Songhaï | son |
Ndebele sud | nr |
Altai sud | alt |
Same du Sud | sma |
Sotho sud | st |
Espagnol | es |
Soundanais | su |
Swahili (latin) | sw |
Swati | ss |
Suédois | sv |
Tabassaran | tab |
Tachelhit | shi |
Tahitien | ty |
Taita | dav |
Tadjik (cyrillique) | tg |
Tamoul | ta |
Tatar (cyrillique) | tt-cyrl |
Tatar (latin) | tt |
Teso | teo |
Tétoum | tet |
Thaï | th |
Thangmi | thf |
Tok Pisin | tpi |
Tonga | à |
Tsonga | ts |
Tswana | tn |
Turc | tr |
Turkmène (latin) | tk |
Touvain | tyv |
Udmurt | udm |
Ouïghour (cyrillique) | ug-cyrl |
Ukrainien | uk |
Haut sorabe | hsb |
Ourdou | ur |
Ouïgour (arabe) | ug |
Ouzbek (arabe) | uz-arab |
Ouzbek (cyrillique) | uz-cyrl |
Ouzbek (latin) | uz |
Vietnamien | vi |
Volapük | vo |
Vunjo | vun |
Haut-valaisan | wae |
Gallois | cy |
Frison occidental | fy |
Wolof | wo |
Xhosa | xh |
Yucatec Maya | yua |
Zapotèque | zap |
Zarma | dje |
Zhuang | za |
Zoulou | zu |
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour