Obsługa języka: modele niestandardowe
Ta zawartość dotyczy: v4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja: v4.0 (wersja zapoznawcza) | | Poprzednie wersje: v3.0 v2.1
Ta zawartość dotyczy: wersja 3.0 (GA) | Najnowsze wersje: wersja 4.0 (wersja zapoznawcza) 3.1 | Poprzednia wersja: wersja 2.1
Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)
Modele analizy dokumentów usługi Azure AI zapewniają obsługę wielojęzycznego przetwarzania dokumentów. Nasze możliwości obsługi języka umożliwiają użytkownikom komunikowanie się z aplikacjami w naturalny sposób i zwiększanie poziomu globalnego wsparcia. Modele niestandardowe są trenowane przy użyciu oznaczonych zestawów danych w celu wyodrębniania odrębnych danych ze strukturą, częściowo ustrukturyzowanych i nieustrukturyzowanych dokumentów specyficznych dla przypadków użycia. Autonomiczne modele niestandardowe można łączyć w celu utworzenia złożonych modeli. W poniższych tabelach wymieniono dostępny język i ustawienia regionalne obsługiwane przez model i funkcję:
Klasyfikator niestandardowy
Język — kod ustawień regionalnych | Wartość domyślna |
---|---|
Angielski (Stany Zjednoczone)— en-US | Angielski (Stany Zjednoczone)— en-US |
Język | Kod (opcjonalnie) |
---|---|
Afrikaans | af |
Albański | sq |
arabski | ar |
Bułgarski | bg |
Chiński (Han (wariant uproszczony)) | zh-Hans |
Chiński (Han (tradycyjny wariant)) | zh-Hant |
Chorwacki | hr |
Czeski | cs |
Duński | da |
niderlandzki | nl |
estoński | et |
Fiński | fi |
Francuski | fr |
Niemiecki | de |
Hebrajski | he |
Hindi | hi |
węgierski, | hu |
Indonezyjski | id |
Włoski | it |
japoński | ja |
koreański. | ko |
Łotewski | lv |
Litewski | lt |
Macedoński | mk |
Marathi | mr |
Nowoczesny grecki (1453-) | el |
Nepalski (makrojęzyczny) | ne |
Norweski | no |
Panjabi | pa |
Perski | fa |
Polski | pl |
portugalski | pt |
Rumuński | rm |
Rosyjski | ru |
Słowacki | sk |
Słoweński | sl |
Somalia (arabski) | so |
Somalijski (łaciński) | so-latn |
Hiszpański | es |
Swahili (macrolanguage) | sw |
Szwedzki | sv |
Tamilski | ta |
Tajlandzki | th |
Turecki | tr |
ukraiński | uk |
Urdu | ur |
Wietnamski | vi |
Generowanie niestandardowe
Funkcja generowania niestandardowego obsługuje tylko język angielski en
Niestandardowe neuronowe
W poniższej tabeli wymieniono obsługiwane języki dla tekstu drukowanego.
Język | Kod (opcjonalnie) |
---|---|
Afrikaans | af |
Albański | sq |
arabski | ar |
Bułgarski | bg |
Chiński uproszczony | zh-Hans |
Chiński tradycyjny | zh-Hant |
Chorwacki | hr |
Czeski | cs |
Duński | da |
niderlandzki | nl |
angielski | en |
estoński | et |
Fiński | fi |
Francuski | fr |
Niemiecki | de |
Hebrajski | he |
Hindi | hi |
węgierski, | hu |
Indonezyjski | id |
Włoski | it |
japoński | ja |
koreański. | ko |
Łotewski | lv |
Litewski | lt |
Macedoński | mk |
Marathi | mr |
Nowoczesny grecki (1453-) | el |
Nepalski (makrojęzyczny) | ne |
Norweski | no |
Panjabi | pa |
Perski | fa |
Polski | pl |
portugalski | pt |
Rumuński | rm |
Rosyjski | ru |
Słowacki | sk |
Słoweński | sl |
Somalia (arabski) | so |
Somalijski (łaciński) | so-latn |
Hiszpański | es |
Swahili (macrolanguage) | sw |
Szwedzki | sv |
Tamilski | ta |
Tajlandzki | th |
Turecki | tr |
ukraiński | uk |
Urdu | ur |
Wietnamski | vi |
Szablon niestandardowy
W poniższej tabeli wymieniono obsługiwane języki dla tekstu drukowanego .
Język | Kod (opcjonalnie) |
---|---|
Abaza | abq |
Abchaski | ab |
Achinese | as |
Acoli | ach |
Adangme | Ada |
Adyghe | Ady |
Afar | aa |
Afrikaans | af |
Akan | Ak |
Albański | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Arabski | ar |
Asturyjski | Ast |
Asu (Tanzania) | Asa |
Avaric | Av |
Awadhi-Hindi (Devanagari) | Awa |
Ajmara | Ay |
Azerbejdżan (łaciński) | Az |
Bafia | Ksf |
Bagheli | bfy |
Bambara | Bm |
Baszkirski | ba |
Baskijski | eu |
Białorusin (cyrylica) | be, be-cyrl |
Białorusi (łaciński) | be, be-latn |
Bemba (Zambia) | Bem |
Bena (Tanzania) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | Bik |
Bini | pojemnik |
Bislama | bi |
Bodo (Devanagari) | brx |
Bośniacki (łaciński) | B |
Brajbha | biustonosz |
Bretoński | Br |
bułgarski | bg |
Bundeli | Bns |
Buryat (Cyrylica) | bua |
kataloński | ca |
Cebuano | Ceb |
Chamling | Rab |
Chamorro | Ch |
Czeczeński | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Chiński uproszczony | zh-Hans |
Chiński tradycyjny | zh-Hant |
Choctaw | Cho |
Czukotka | ckt |
Czuwaski | CV |
Kornwalijski | kW |
Korsykański | co |
Cree | Cr |
Potok | Mus |
Tatar krymski (łaciński) | crh |
chorwacki | go |
Wrona | Cro |
Czeski | cs |
Duński | da |
Dargwa | Dar |
Dari | Prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | Doi |
Duala | Dua |
Dungan | dng |
niderlandzki | nl |
Efik | Efi |
angielski | en |
Erzya (cyrylica) | myv |
estoński | et |
Farerski | fo |
Fidżijski | fj |
Filipino | Fil |
Fiński | fi |
Język | Kod (opcjonalnie) |
---|---|
Fon | Fon |
Francuski | fr |
Friulian | futro |
Ga | gaa |
Gagauz (łaciński) | knebel |
galicyjski | gl |
Ganda | Lg |
Gayo | Gej |
Niemiecki | de |
Gilbertese | Gil |
Gondi (Devanagari) | Gon |
Grecki | el |
Grenlandzki | Kl |
Guarani | Gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Kreolski haitański | Ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Hawajski | Haw |
Hebrajski | he |
Herero | Hz |
Hiligaynon | hil |
hindi | hi |
Hmong Daw (łaciński) | mww |
Ho(Devanagiri) | Hoc |
Węgierski | hu |
Iban | IBA |
Islandzki | is |
Igbo | Ig |
Iloko | ILO |
Inari Sami | smn |
Indonezyjski | identyfikator |
Ingush | Inh |
Interlingua | Ia |
Inuktitut (łaciński) | J.m. |
Irlandzki | Ga |
Włoski | it |
japoński | ja |
Jaunsari (Devanagari) | Jns |
Jawajski | Jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | Kea |
Kachin (łaciński) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | Kr |
Karachay-Balkar | krc |
Kara-Kalpak (cyrylica) | kaa-cyrl |
Kara-Kalpak (łaciński) | kaa |
Kaszubski | Csb |
Kazachski (cyrylica) | kk-cyrl |
Kazachski (łaciński) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | Kha |
K'iche' | quc |
Kikuyu | Ki |
Kildin Sami | Sjd |
Kinyarwanda | Rw |
Komi | kv |
Kongo | Kg |
Koreański | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | Kos |
Kpelle | kpe |
Kuanyama | Kj |
Kumyk (Cyrylica) | Kum |
Kurdyjski (arabski) | ku-arab |
Kurdyjski (łaciński) | ku-latn |
Kurukh (Devanagari) | Kru |
Kyrgyz (Cyrylica) | Ky |
Lak | lbe |
Lakota | lkt |
Język | Kod (opcjonalnie) |
---|---|
Łacina | la |
łotewski | lv |
Lezghian | Lex |
Lingala | Ln |
litewski | lt |
Dolnołużycki | dsb |
Lozi | Loz |
Lule Sami | smj |
Luo (Kenia i Tanzania) | Luo |
Luksemburski | funt |
Luyia | luy |
Macedoński | mk |
Machame | jmc |
Madurese | obłąkany |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | Mgh |
Makonde | kde |
Malgaski | Mg |
Malajski (łaciński) | ms |
Maltański | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manx | Gv |
Maoryski | mi |
Mapudungun | Arn |
Marathi | pan |
Mari (Rosja) | Chm |
Masai | Mas |
Mende (Sierra Leone) | Mężczyzn |
Meru | Mer |
Meta" | mgo |
Minangkabau | min |
Mohawk | Moh |
Mongolski (cyrylica) | Mn |
Mongondow | Mog |
Czarnogóra (cyrylica) | cnr-cyrl |
Czarnogóra (łacińska) | cnr-latn |
Morisyen | mfe |
Mundang | Mua |
Język nahuatl | Nie |
Nawaho | Nv |
Ndonga | Ng |
Neapolitański | drzemka |
Nepalski | ne |
Ngomba | jgo |
Niuean | Niu |
Nogay | Nog |
North Ndebele | nd |
Północny Sami (łaciński) | MŚP |
Norweski | nie |
Nyanja | Ny |
Nyankole | nyn |
Nzima | nzi |
Occitan | Oc |
Ojibwa | oj |
Oromo | om |
Ossetic | system operacyjny |
Pampanga | Pam |
Pangasinan | Pag |
Papiamento | pap |
Paszto | PS |
Pedi | Nso |
Perski | fa |
Polski | pl |
Portugalski | pt |
Punjabi (arabski) | tatuś |
Keczua | Qu |
Ripuarian | ksh |
rumuński | ro |
Retoromański | Rm |
Rundi | Rn |
Rosyjski | ru |
Rwa | rwk |
Sadri (Devanagari) | sck |
Republika Sacha | Sah |
Samburu | saq |
Samoan (łaciński) | sm |
Sango | Sg |
Język | Kod (opcjonalnie) |
---|---|
Sangu (Gabon) | snq |
Sanskrit (Devanagari) | skojarzenie zabezpieczeń |
Santali (Devanagiri) | sobota |
Szkoci | sco |
Język szkocki gaelicki | Gd |
Sena | ona |
Serbski (cyrylica) | sr-cyrl |
Serbski (łaciński) | sr, sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt Sami | sms |
słowacki | sk |
słoweński | sl |
Soga | xog |
Somalia (arabski) | so |
Somalijski (łaciński) | so-latn |
Songhai | son |
South Ndebele | nr |
Południowy Ałtaj | Alt |
Południowy Sami | Sma |
Południowy Sotho | XXI w. |
Hiszpański | es |
Sundanese | Su |
Swahili (łaciński) | sw |
Swati | ss |
Szwedzki | sv |
Tabassaran | zakładka |
Tachelhit | Shi |
Tahitański | ty |
Taita | Dav |
Tadżyk (cyrylica) | Tg |
Tamilski | ta |
Tatar (Cyrylica) | tt-cyrl |
Tatar (łaciński) | TT |
Teso | teo |
Tetum | Tet |
tajski | th |
Thangmi | thf |
Tok Pisin | Tpi |
Tonga | na wartość |
Tsonga | Ts |
Tswana | tn |
Turecki | tr |
Turkmen (łaciński) | Tk |
Tuvan | tyv |
Udmurt | udm |
Ujgur (cyrylica) | ug-cyrl |
ukraiński | uk |
Górnołużycki | Hsb |
Urdu | ur |
Uygur (arabski) | Ug |
Uzbek (arabski) | uz-arab |
Uzbecki (Cyrylica) | uz-cyrl |
Uzbek (łaciński) | uz |
Wietnamski | vi |
Volapük | Vo |
Vunjo | vun |
Walser | wae |
Walijski | Cy |
Zachodni Fryzyjscy | Fy |
Wolof | Wo |
Xhosa | xh |
Maya | yua |
Zapotec | Zap |
Zarma | dje |
Zhen | za |
Zulu | zu |