Udostępnij za pośrednictwem


Obsługa języka: modele niestandardowe

Ta zawartość dotyczy:v4.0 (wersja zapoznawcza) | Poprzednie wersje:niebieski znacznik wyboruZnacznikv3.1 (GA)v3.0 (GA)niebieski znacznik wyboruniebieski znacznik wyboruv2.1 (GA)

Ta zawartość dotyczy:v3.1 (GA)Najnowsza wersja:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza) | | Poprzednie wersje:niebieski znacznik wyboruv3.0niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:v3.0 (GA) | Najnowsze wersje:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza)purpurowy znacznik wyboruv3.1 | Poprzednia wersja:niebieski znacznik wyboruv2.1

Ta zawartość dotyczy:v2.1 Najnowsza wersja:Znacznikniebieski znacznik wyboruv4.0 (wersja zapoznawcza) |

Modele analizy dokumentów usługi Azure AI zapewniają obsługę wielojęzycznego przetwarzania dokumentów. Nasze możliwości obsługi języka umożliwiają użytkownikom komunikowanie się z aplikacjami w naturalny sposób i zwiększanie poziomu globalnego wsparcia. Modele niestandardowe są trenowane przy użyciu oznaczonych zestawów danych w celu wyodrębniania odrębnych danych ze strukturą, częściowo ustrukturyzowanych i nieustrukturyzowanych dokumentów specyficznych dla przypadków użycia. Autonomiczne modele niestandardowe można łączyć w celu utworzenia złożonych modeli. W poniższych tabelach wymieniono dostępny język i ustawienia regionalne obsługiwane przez model i funkcję:

Klasyfikator niestandardowy

Język — kod ustawień regionalnych Wartość domyślna
Angielski (Stany Zjednoczone)— en-US Angielski (Stany Zjednoczone)— en-US
Język Kod (opcjonalnie)
Afrikaans af
Albański sq
arabski ar
Bułgarski bg
Chiński (Han (wariant uproszczony)) zh-Hans
Chiński (Han (tradycyjny wariant)) zh-Hant
Chorwacki hr
Czeski cs
Duński da
niderlandzki nl
estoński et
Fiński fi
Francuski fr
Niemiecki de
Hebrajski he
Hindi hi
węgierski, hu
Indonezyjski id
Włoski it
japoński ja
koreański. ko
Łotewski lv
Litewski lt
Macedoński mk
Marathi mr
Nowoczesny grecki (1453-) el
Nepalski (makrojęzyczny) ne
Norweski no
Panjabi pa
Perski fa
Polski pl
portugalski pt
Rumuński rm
Rosyjski ru
Słowacki sk
Słoweński sl
Somalia (arabski) so
Somalijski (łaciński) so-latn
Hiszpański es
Swahili (macrolanguage) sw
Szwedzki sv
Tamilski ta
Tajlandzki th
Turecki tr
ukraiński uk
Urdu ur
Wietnamski vi

Niestandardowe neuronowe

W poniższej tabeli wymieniono obsługiwane języki dla tekstu drukowanego.

Język Kod (opcjonalnie)
Afrikaans af
Albański sq
arabski ar
Bułgarski bg
Chiński uproszczony zh-Hans
Chiński tradycyjny zh-Hant
Chorwacki hr
Czeski cs
Duński da
niderlandzki nl
estoński et
Fiński fi
Francuski fr
Niemiecki de
Hebrajski he
Hindi hi
węgierski, hu
Indonezyjski id
Włoski it
japoński ja
koreański. ko
Łotewski lv
Litewski lt
Macedoński mk
Marathi mr
Nowoczesny grecki (1453-) el
Nepalski (makrojęzyczny) ne
Norweski no
Panjabi pa
Perski fa
Polski pl
portugalski pt
Rumuński rm
Rosyjski ru
Słowacki sk
Słoweński sl
Somalia (arabski) so
Somalijski (łaciński) so-latn
Hiszpański es
Swahili (macrolanguage) sw
Szwedzki sv
Tamilski ta
Tajlandzki th
Turecki tr
ukraiński uk
Urdu ur
Wietnamski vi

Modele neuronowe obsługują dodane języki dla v3.1 interfejsów API i nowszych.

Języki Wersja interfejsu API
angielski v4.0:2024-02-29-preview, 2023-10-31-preview, , v3.1:2023-07-31 (GA)v3.0:2022-08-31 (GA)
Niemiecki v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Włoski v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Francuski v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Hiszpański v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Niderlandzki v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)

Szablon niestandardowy

W poniższej tabeli wymieniono obsługiwane języki dla tekstu drukowanego .

Język Kod (opcjonalnie)
Abaza Abq
Abchazja ab
Achinese Ace
Acoli ach
Adangme Ada
Adyghe Ady
Daleka aa
Afrikaans af
Akan Ak
Albański sq
Algonquin alq
Angika (Devanagari) Anp
Arabski ar
Asturian Ast
Asu (Tanzania) Asa
Avaric Av
Awadhi-Hindi (Devanagari) Awa
Ajmara Ay
Azerbejdżan (łaciński) Az
Bafia Ksf
Bagheli bfy
Bambara Bm
Baszkirski ba
Baskijski eu
Białorusin (cyrylica) be, be-cyrl
Białorusi (łaciński) be, be-latn
Bemba (Zambia) Bem
Bena (Tanzania) bez
Bhojpuri-Hindi (Devanagari) Bho
Bikol Bik
Bini pojemnik
Bislama Bi
Bodo (Devanagari) Brx
Bośniacki (łaciński) B
Brajbha Biustonosz
Breton Br
bułgarski bg
Bundeli Bns
Buryat (Cyrylica) Bua
kataloński ca
Cebuano Ceb
Chamling Rab
Chamorro Ch
Czeczeński ce
Chhattisgarhi (Devanagari) Hne
Chiga cgg
Chiński uproszczony zh-Hans
Chiński tradycyjny zh-Hant
Choctaw Cho
Chukot Ckt
Chuvash Cv
Cornish Kw
Korsykański co
Cree Cr
Creek Mus
Tatar krymski (łaciński) Crh
chorwacki go
Crow Cro
Czeski cs
Duński da
Dargwa Dar
Dari Prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) Doi
Duala Dua
Dungan Dng
niderlandzki nl
Efik Efi
angielski en
Erzya (cyrylica) Myv
estoński et
Farerski fo
Fidżijski Fj
Filipino Fil
Fiński fi
Język Kod (opcjonalnie)
Fon Fon
Francuski fr
Friulian Futro
Ga Gaa
Gagauz (łaciński) Gag
galicyjski gl
Ganda Lg
Gayo gej
Niemiecki de
Gilbertese Gil
Gondi (Devanagari) Gon
Grecki el
Grenlandzkiego Kl
Guarani Gn
Gurung (Devanagari) gvr
Gusii guz
Kreolski haitański Ht
Halbi (Devanagari) Hlb
Hani hni
Haryanvi Bgc
Hawajski Haw
Hebrajski he
Herero Hz
Hiligaynon Hil
hindi hi
Hmong Daw (łaciński) mww
Ho(Devanagiri) Hoc
Węgierski hu
Iban Iba
Islandzki is
Igbo Ig
Iloko Mop
Inari Sami Smn
Indonezyjski identyfikator
Ingush Inh
Interlingua Ia
Inuktitut (łaciński) J.m
Irlandzki Ga
Włoski it
japoński ja
Jaunsari (Devanagari) Jns
Jawajski Jv
Jola-Fonyi Dyo
Kabardian Kbd
Kabuverdianu Kea
Kachin (łaciński) Kac
Kalenjin kln
Kalmyk xal
Kangri (Devanagari) xnr
Kanuri Kr
Karachay-Balkar Krc
Kara-Kalpak (cyrylica) kaa-cyrl
Kara-Kalpak (łaciński) Kaa
Kaszubski Csb
Kazachski (cyrylica) kk-cyrl
Kazachski (łaciński) kk-latn
Khakas kjh
Khaling Klr
Khasi Kha
K'iche' quc
Kikuyu Ki
Kildin Sami Sjd
Kinyarwanda Rw
Komi Kv
Kongo Kg
Koreański ko
Korku kfq
Koryak kpy
Kosraean Kos
Kpelle kpe
Kuanyama Kj
Kumyk (Cyrylica) Kum
Kurdyjski (arabski) ku-arab
Kurdyjski (łaciński) ku-latn
Kurukh (Devanagari) Kru
Kyrgyz (Cyrylica) Ky
Lak Lbe
Lakota Lkt
Język Kod (opcjonalnie)
Łacińskiej la
łotewski lv
Lezghian Lex
Lingala Ln
litewski lt
Dolny Łużycki Dsb
Lozi Loz
Lule Sami Smj
Luo (Kenia i Tanzania) Luo
Luksemburski Funtów
Luyia Luy
Macedoński mk
Machame Jmc
Madurese Mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto Mgh
Makonde Kde
Malgaski Mg
Malajski (łaciński) ms
Maltański mt
Malto (Devanagari) kmj
Mandinka Mnk
Manx Gv
Maoryski Mi
Mapudungun Arn
Marathi Pan
Mari (Rosja) Chm
Masai Mas
Mende (Sierra Leone) Mężczyzn
Meru Mer
Meta" Mgo
Minangkabau min
Mohawk Moh
Mongolski (cyrylica) Mn
Mongondow Mog
Czarnogóra (cyrylica) cnr-cyrl
Czarnogóra (łacińska) cnr-latn
Morisyen Mfe
Mundang Mua
Nahuatl Nr
Navajo Nv
Ndonga Ng
Neapolitański Nap
Nepalski ne
Ngomba jgo
Niuean Niu
Nogay Nog
North Ndebele nd
Północny Sami (łaciński) Mśp
Norweski nie
Nyanja Ny
Nyankole nyn
Nzima nzi
Occitan Oc
Ojibwa Dz.u
Oromo om
Ossetic Os
Pampanga Pam
Pangasinan Pag
Papiamento pap
Paszto Ps
Pedi Nso
Perski fa
Polski pl
Portugalski pt
Punjabi (arabski) Pa
Keczua Qu
Ripuarian ksh
rumuński ro
Retoromański Rm
Rundi Rn
Rosyjski ru
Rwa rwk
Sadri (Devanagari) Sck
Sakha Sah
Samburu saq
Samoan (łaciński) sm
Sango Sg
Język Kod (opcjonalnie)
Sangu (Gabon) snq
Sanskrit (Devanagari) Sa
Santali (Devanagiri) Sat
Szkoci sco
Szkocki gaelicki Gd
Sena Ona
Serbski (cyrylica) sr-cyrl
Serbski (łaciński) sr, sr-latn
Shambala Ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) Srx
Skolt Sami sms
słowacki sk
słoweński sl
Soga xog
Somalia (arabski) so
Somalijski (łaciński) so-latn
Songhai son
South Ndebele nr
Południowy Ałtaj Alt
Południowy Sami Sma
Południowy Sotho XXI w.
Hiszpański es
Sundanese Su
Swahili (łaciński) sw
Swati ss
Szwedzki sv
Tabassaran Zakładka
Tachelhit Shi
Tahitański ty
Taita Dav
Tadżyk (cyrylica) Tg
Tamilski ta
Tatar (Cyrylica) tt-cyrl
Tatar (łaciński) TT
Teso Teo
Tetum Tet
tajski th
Thangmi Thf
Tok Pisin Tpi
Tonga na wartość
Tsonga Ts
Tswana tn
Turecki tr
Turkmen (łaciński) Tk
Tuvan tyv
Udmurt Udm
Ujgur (cyrylica) ug-cyrl
ukraiński uk
Górnołużycki Hsb
Urdu ur
Uygur (arabski) Ug
Uzbek (arabski) uz-arab
Uzbecki (Cyrylica) uz-cyrl
Uzbek (łaciński) Uz
Wietnamski vi
Volapük Vo
Vunjo Vun
Walser wae
Walijski Cy
Zachodni Fryzyjscy Fy
Wolof Wo
Xhosa xh
Maya yua
Zapotec Zap
Zarma dje
Zhuang za
Zulu zu