Obsługa języka: modele niestandardowe
Ta zawartość dotyczy:v4.0 (wersja zapoznawcza) | Poprzednie wersje:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Ta zawartość dotyczy:v3.1 (GA)Najnowsza wersja:v4.0 (wersja zapoznawcza) | | Poprzednie wersje:v3.0v2.1
Ta zawartość dotyczy:v3.0 (GA) | Najnowsze wersje:v4.0 (wersja zapoznawcza)v3.1 | Poprzednia wersja:v2.1
Ta zawartość dotyczy:v2.1 Najnowsza wersja:v4.0 (wersja zapoznawcza) |
Modele analizy dokumentów usługi Azure AI zapewniają obsługę wielojęzycznego przetwarzania dokumentów. Nasze możliwości obsługi języka umożliwiają użytkownikom komunikowanie się z aplikacjami w naturalny sposób i zwiększanie poziomu globalnego wsparcia. Modele niestandardowe są trenowane przy użyciu oznaczonych zestawów danych w celu wyodrębniania odrębnych danych ze strukturą, częściowo ustrukturyzowanych i nieustrukturyzowanych dokumentów specyficznych dla przypadków użycia. Autonomiczne modele niestandardowe można łączyć w celu utworzenia złożonych modeli. W poniższych tabelach wymieniono dostępny język i ustawienia regionalne obsługiwane przez model i funkcję:
Klasyfikator niestandardowy
Język — kod ustawień regionalnych | Wartość domyślna |
---|---|
Angielski (Stany Zjednoczone)— en-US | Angielski (Stany Zjednoczone)— en-US |
Język | Kod (opcjonalnie) |
---|---|
Afrikaans | af |
Albański | sq |
arabski | ar |
Bułgarski | bg |
Chiński (Han (wariant uproszczony)) | zh-Hans |
Chiński (Han (tradycyjny wariant)) | zh-Hant |
Chorwacki | hr |
Czeski | cs |
Duński | da |
niderlandzki | nl |
estoński | et |
Fiński | fi |
Francuski | fr |
Niemiecki | de |
Hebrajski | he |
Hindi | hi |
węgierski, | hu |
Indonezyjski | id |
Włoski | it |
japoński | ja |
koreański. | ko |
Łotewski | lv |
Litewski | lt |
Macedoński | mk |
Marathi | mr |
Nowoczesny grecki (1453-) | el |
Nepalski (makrojęzyczny) | ne |
Norweski | no |
Panjabi | pa |
Perski | fa |
Polski | pl |
portugalski | pt |
Rumuński | rm |
Rosyjski | ru |
Słowacki | sk |
Słoweński | sl |
Somalia (arabski) | so |
Somalijski (łaciński) | so-latn |
Hiszpański | es |
Swahili (macrolanguage) | sw |
Szwedzki | sv |
Tamilski | ta |
Tajlandzki | th |
Turecki | tr |
ukraiński | uk |
Urdu | ur |
Wietnamski | vi |
Niestandardowe neuronowe
W poniższej tabeli wymieniono obsługiwane języki dla tekstu drukowanego.
Język | Kod (opcjonalnie) |
---|---|
Afrikaans | af |
Albański | sq |
arabski | ar |
Bułgarski | bg |
Chiński uproszczony | zh-Hans |
Chiński tradycyjny | zh-Hant |
Chorwacki | hr |
Czeski | cs |
Duński | da |
niderlandzki | nl |
estoński | et |
Fiński | fi |
Francuski | fr |
Niemiecki | de |
Hebrajski | he |
Hindi | hi |
węgierski, | hu |
Indonezyjski | id |
Włoski | it |
japoński | ja |
koreański. | ko |
Łotewski | lv |
Litewski | lt |
Macedoński | mk |
Marathi | mr |
Nowoczesny grecki (1453-) | el |
Nepalski (makrojęzyczny) | ne |
Norweski | no |
Panjabi | pa |
Perski | fa |
Polski | pl |
portugalski | pt |
Rumuński | rm |
Rosyjski | ru |
Słowacki | sk |
Słoweński | sl |
Somalia (arabski) | so |
Somalijski (łaciński) | so-latn |
Hiszpański | es |
Swahili (macrolanguage) | sw |
Szwedzki | sv |
Tamilski | ta |
Tajlandzki | th |
Turecki | tr |
ukraiński | uk |
Urdu | ur |
Wietnamski | vi |
Modele neuronowe obsługują dodane języki dla v3.1
interfejsów API i nowszych.
Języki | Wersja interfejsu API |
---|---|
angielski | v4.0:2024-02-29-preview, 2023-10-31-preview , , v3.1:2023-07-31 (GA) v3.0:2022-08-31 (GA) |
Niemiecki | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Włoski | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Francuski | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Hiszpański | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Niderlandzki | v4.0:2024-02-29-preview, 2023-10-31-preview , v3.1:2023-07-31 (GA) |
Szablon niestandardowy
W poniższej tabeli wymieniono obsługiwane języki dla tekstu drukowanego .
Język | Kod (opcjonalnie) |
---|---|
Abaza | Abq |
Abchazja | ab |
Achinese | Ace |
Acoli | ach |
Adangme | Ada |
Adyghe | Ady |
Daleka | aa |
Afrikaans | af |
Akan | Ak |
Albański | sq |
Algonquin | alq |
Angika (Devanagari) | Anp |
Arabski | ar |
Asturian | Ast |
Asu (Tanzania) | Asa |
Avaric | Av |
Awadhi-Hindi (Devanagari) | Awa |
Ajmara | Ay |
Azerbejdżan (łaciński) | Az |
Bafia | Ksf |
Bagheli | bfy |
Bambara | Bm |
Baszkirski | ba |
Baskijski | eu |
Białorusin (cyrylica) | be, be-cyrl |
Białorusi (łaciński) | be, be-latn |
Bemba (Zambia) | Bem |
Bena (Tanzania) | bez |
Bhojpuri-Hindi (Devanagari) | Bho |
Bikol | Bik |
Bini | pojemnik |
Bislama | Bi |
Bodo (Devanagari) | Brx |
Bośniacki (łaciński) | B |
Brajbha | Biustonosz |
Breton | Br |
bułgarski | bg |
Bundeli | Bns |
Buryat (Cyrylica) | Bua |
kataloński | ca |
Cebuano | Ceb |
Chamling | Rab |
Chamorro | Ch |
Czeczeński | ce |
Chhattisgarhi (Devanagari) | Hne |
Chiga | cgg |
Chiński uproszczony | zh-Hans |
Chiński tradycyjny | zh-Hant |
Choctaw | Cho |
Chukot | Ckt |
Chuvash | Cv |
Cornish | Kw |
Korsykański | co |
Cree | Cr |
Creek | Mus |
Tatar krymski (łaciński) | Crh |
chorwacki | go |
Crow | Cro |
Czeski | cs |
Duński | da |
Dargwa | Dar |
Dari | Prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | Doi |
Duala | Dua |
Dungan | Dng |
niderlandzki | nl |
Efik | Efi |
angielski | en |
Erzya (cyrylica) | Myv |
estoński | et |
Farerski | fo |
Fidżijski | Fj |
Filipino | Fil |
Fiński | fi |
Język | Kod (opcjonalnie) |
---|---|
Fon | Fon |
Francuski | fr |
Friulian | Futro |
Ga | Gaa |
Gagauz (łaciński) | Gag |
galicyjski | gl |
Ganda | Lg |
Gayo | gej |
Niemiecki | de |
Gilbertese | Gil |
Gondi (Devanagari) | Gon |
Grecki | el |
Grenlandzkiego | Kl |
Guarani | Gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Kreolski haitański | Ht |
Halbi (Devanagari) | Hlb |
Hani | hni |
Haryanvi | Bgc |
Hawajski | Haw |
Hebrajski | he |
Herero | Hz |
Hiligaynon | Hil |
hindi | hi |
Hmong Daw (łaciński) | mww |
Ho(Devanagiri) | Hoc |
Węgierski | hu |
Iban | Iba |
Islandzki | is |
Igbo | Ig |
Iloko | Mop |
Inari Sami | Smn |
Indonezyjski | identyfikator |
Ingush | Inh |
Interlingua | Ia |
Inuktitut (łaciński) | J.m |
Irlandzki | Ga |
Włoski | it |
japoński | ja |
Jaunsari (Devanagari) | Jns |
Jawajski | Jv |
Jola-Fonyi | Dyo |
Kabardian | Kbd |
Kabuverdianu | Kea |
Kachin (łaciński) | Kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | Kr |
Karachay-Balkar | Krc |
Kara-Kalpak (cyrylica) | kaa-cyrl |
Kara-Kalpak (łaciński) | Kaa |
Kaszubski | Csb |
Kazachski (cyrylica) | kk-cyrl |
Kazachski (łaciński) | kk-latn |
Khakas | kjh |
Khaling | Klr |
Khasi | Kha |
K'iche' | quc |
Kikuyu | Ki |
Kildin Sami | Sjd |
Kinyarwanda | Rw |
Komi | Kv |
Kongo | Kg |
Koreański | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | Kos |
Kpelle | kpe |
Kuanyama | Kj |
Kumyk (Cyrylica) | Kum |
Kurdyjski (arabski) | ku-arab |
Kurdyjski (łaciński) | ku-latn |
Kurukh (Devanagari) | Kru |
Kyrgyz (Cyrylica) | Ky |
Lak | Lbe |
Lakota | Lkt |
Język | Kod (opcjonalnie) |
---|---|
Łacińskiej | la |
łotewski | lv |
Lezghian | Lex |
Lingala | Ln |
litewski | lt |
Dolny Łużycki | Dsb |
Lozi | Loz |
Lule Sami | Smj |
Luo (Kenia i Tanzania) | Luo |
Luksemburski | Funtów |
Luyia | Luy |
Macedoński | mk |
Machame | Jmc |
Madurese | Mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | Mgh |
Makonde | Kde |
Malgaski | Mg |
Malajski (łaciński) | ms |
Maltański | mt |
Malto (Devanagari) | kmj |
Mandinka | Mnk |
Manx | Gv |
Maoryski | Mi |
Mapudungun | Arn |
Marathi | Pan |
Mari (Rosja) | Chm |
Masai | Mas |
Mende (Sierra Leone) | Mężczyzn |
Meru | Mer |
Meta" | Mgo |
Minangkabau | min |
Mohawk | Moh |
Mongolski (cyrylica) | Mn |
Mongondow | Mog |
Czarnogóra (cyrylica) | cnr-cyrl |
Czarnogóra (łacińska) | cnr-latn |
Morisyen | Mfe |
Mundang | Mua |
Nahuatl | Nr |
Navajo | Nv |
Ndonga | Ng |
Neapolitański | Nap |
Nepalski | ne |
Ngomba | jgo |
Niuean | Niu |
Nogay | Nog |
North Ndebele | nd |
Północny Sami (łaciński) | Mśp |
Norweski | nie |
Nyanja | Ny |
Nyankole | nyn |
Nzima | nzi |
Occitan | Oc |
Ojibwa | Dz.u |
Oromo | om |
Ossetic | Os |
Pampanga | Pam |
Pangasinan | Pag |
Papiamento | pap |
Paszto | Ps |
Pedi | Nso |
Perski | fa |
Polski | pl |
Portugalski | pt |
Punjabi (arabski) | Pa |
Keczua | Qu |
Ripuarian | ksh |
rumuński | ro |
Retoromański | Rm |
Rundi | Rn |
Rosyjski | ru |
Rwa | rwk |
Sadri (Devanagari) | Sck |
Sakha | Sah |
Samburu | saq |
Samoan (łaciński) | sm |
Sango | Sg |
Język | Kod (opcjonalnie) |
---|---|
Sangu (Gabon) | snq |
Sanskrit (Devanagari) | Sa |
Santali (Devanagiri) | Sat |
Szkoci | sco |
Szkocki gaelicki | Gd |
Sena | Ona |
Serbski (cyrylica) | sr-cyrl |
Serbski (łaciński) | sr, sr-latn |
Shambala | Ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | Srx |
Skolt Sami | sms |
słowacki | sk |
słoweński | sl |
Soga | xog |
Somalia (arabski) | so |
Somalijski (łaciński) | so-latn |
Songhai | son |
South Ndebele | nr |
Południowy Ałtaj | Alt |
Południowy Sami | Sma |
Południowy Sotho | XXI w. |
Hiszpański | es |
Sundanese | Su |
Swahili (łaciński) | sw |
Swati | ss |
Szwedzki | sv |
Tabassaran | Zakładka |
Tachelhit | Shi |
Tahitański | ty |
Taita | Dav |
Tadżyk (cyrylica) | Tg |
Tamilski | ta |
Tatar (Cyrylica) | tt-cyrl |
Tatar (łaciński) | TT |
Teso | Teo |
Tetum | Tet |
tajski | th |
Thangmi | Thf |
Tok Pisin | Tpi |
Tonga | na wartość |
Tsonga | Ts |
Tswana | tn |
Turecki | tr |
Turkmen (łaciński) | Tk |
Tuvan | tyv |
Udmurt | Udm |
Ujgur (cyrylica) | ug-cyrl |
ukraiński | uk |
Górnołużycki | Hsb |
Urdu | ur |
Uygur (arabski) | Ug |
Uzbek (arabski) | uz-arab |
Uzbecki (Cyrylica) | uz-cyrl |
Uzbek (łaciński) | Uz |
Wietnamski | vi |
Volapük | Vo |
Vunjo | Vun |
Walser | wae |
Walijski | Cy |
Zachodni Fryzyjscy | Fy |
Wolof | Wo |
Xhosa | xh |
Maya | yua |
Zapotec | Zap |
Zarma | dje |
Zhuang | za |
Zulu | zu |