Obsługa języka dla usługi Azure AI Vision

Niektóre możliwości usługi Azure AI Vision obsługują wiele języków; wszystkie możliwości, o których nie wspomniano tutaj, obsługują tylko język angielski.

Optyczne rozpoznawanie znaków (OCR)

Interfejs API odczytu usługi Azure AI Vision obsługuje wiele języków. Interfejs Read API może wyodrębnić tekst z obrazów i dokumentów z językami mieszanymi, w tym z tego samego wiersza tekstu, bez konieczności używania parametru języka. Zobacz How to specify the model to use the Read new languages (Jak określić model do używania nowych języków).

Uwaga

Kod języka opcjonalny

Read Oparte na uczeniu głębokim modele uniwersalne wyodrębniają cały tekst wielojęzyczny w dokumentach, w tym wiersze tekstu z językami mieszanymi i nie wymagają określenia kodu językowego. Nie należy podawać kodu języka jako parametru, chyba że masz pewność co do języka i chcesz wymusić zastosowanie tylko odpowiedniego modelu. W przeciwnym razie usługa może zwrócić niekompletny i niepoprawny tekst.

Tekst odręczny

W poniższej tabeli wymieniono języki obsługiwane przez funkcję OCR dla tekstu odręcznego według najnowszego Read modelu ogólnie dostępnego.

Język Kod języka (opcjonalnie) Język Kod języka (opcjonalnie)
Angielski en Japoński ja
Chiński uproszczony zh-Hans Koreański ko
Francuski fr Portugalski pt
Niemiecki de Hiszpański es
Włoski it

W poniższej tabeli wymieniono języki obsługiwane przez funkcję OCR do drukowania tekstu według najnowszego Read modelu ogólnie dostępnego.

Język Kod (opcjonalnie) Język Kod (opcjonalnie)
Afrikaans af Khasi kha
Albański sq K'iche' quc
Angika (Devanagiri) anp Koreański ko
Arabski ar Korku kfq
Asturian ast Koryak kpy
Awadhi-Hindi (Devanagiri) awa Kosraean kos
Azerbejdżan (łaciński) az Kumyk (Cyrylica) kum
Bagheli bfy Kurdyjski (arabski) ku-arab
Baskijski eu Kurdyjski (łaciński) ku-latn
Białorusin (cyrylica) be, be-cyrl Kurukh (Devanagiri) kru
Białorusi (łaciński) be, be-latn Kyrgyz (Cyrylica) ky
Bhojpuri-Hindi (Devanagiri) bho Lakota lkt
Bislama bi Łacińskiej la
Bodo (Devanagiri) brx Litewski lt
Bośniacki (łaciński) bs Dolny Łużycki dsb
Brajbha bra Lule Sami smj
Breton br Luksemburski lb
Bułgarski bg Mahasu Pahari (Devanagiri) bfz
Bundeli bns Malajski (łaciński) ms
Buryat (Cyrylica) bua Maltański mt
Kataloński ca Malto (Devanagiri) kmj
Cebuano ceb Manx gv
Chamling rab Maoryski mi
Chamorro ch Marathi mr
Chhattisgarhi (Devanagiri) hne Mongolski (cyrylica) mn
Chiński uproszczony zh-Hans Czarnogóra (cyrylica) cnr-cyrl
Chiński tradycyjny zh-Hant Czarnogóra (łacińska) cnr-latn
Cornish kw Neapolitański nap
Korsykański co Nepalski ne
Tatar krymski (łaciński) crh Niuean niu
Chorwacki hr Nogay nog
Czeski cs Północny Sami (łaciński) sme
Duński da Norweski no
Dari prs Occitan oc
Dhimal (Devanagiri) dhi Ossetic os
Dogri (Devanagiri) doi Paszto ps
Niderlandzki nl Perski fa
angielski en Polski pl
Erzya (cyrylica) myv Portugalski pt
Estoński et Punjabi (arabski) pa
Farerski fo Ripuarian ksh
Fidżijski fj Rumuński ro
Filipino fil Retoromański rm
Fiński fi Rosyjski ru
Francuski fr Sadri (Devanagiri) sck
Friulian fur Samoan (łaciński) sm
Gagauz (łaciński) gag Sanskrit (Devanagari) sa
Galicyjski gl Santali (Devanagiri) sat
Niemiecki de Szkoci sco
Gilbertese gil Szkocki gaelicki gd
Gondi (Devanagiri) gon Serbski (łaciński) sr, sr-latn
Grenlandzkiego kl Sherpa (Devanagiri) xsr
Gurung (Devanagiri) gvr Sirmauri (Devanagiri) srx
Kreolski haitański ht Skolt Sami sms
Halbi (Devanagiri) hlb Słowacki sk
Hani hni Słoweński sl
Haryanvi bgc Somalia (arabski) so
Hawajski haw Południowy Sami sma
Hindi hi Hiszpański es
Hmong Daw (łaciński) mww Swahili (łaciński) sw
Ho(Devanagiri) hoc Szwedzki sv
Węgierski hu Tadżyk (cyrylica) tg
Islandzki is Tatar (łaciński) tt
Inari Sami smn Tetum tet
Indonezyjski id Thangmi thf
Interlingua ia Tonga to
Inuktitut (łaciński) iu Turecki tr
Irlandzki ga Turkmen (łaciński) tk
Włoski it Tuvan tyv
japoński ja Górnołużycki hsb
Jaunsari (Devanagiri) Jns Urdu ur
Jawajski jv Uygur (arabski) ug
Kabuverdianu kea Uzbek (arabski) uz-arab
Kachin (łaciński) kac Uzbecki (Cyrylica) uz-cyrl
Kangri (Devanagiri) xnr Uzbek (łaciński) uz
Karachay-Balkar krc Volapük vo
Kara-Kalpak (cyrylica) kaa-cyrl Walser wae
Kara-Kalpak (łaciński) kaa Walijski cy
Kaszubski csb Zachodni Fryzyjscy fy
Kazachski (cyrylica) kk-cyrl Maya yua
Kazachski (łaciński) kk-latn Zhuang za
Khaling klr Zulu zu

Analizuj obraz

Niektóre funkcje interfejsu API analizowania — obraz może zwracać wyniki w innych językach określonych za pomocą parametru language zapytania. Inne akcje zwracają wyniki w języku angielskim niezależnie od tego, jaki język jest określony, a inne zgłaszają wyjątek dla nieobsługiwanych języków. Akcje są określane przy użyciu visualFeatures parametrów zapytania i details . Zobacz Omówienie listy wszystkich akcji, które można wykonać za pomocą interfejsu API analizy, lub postępuj zgodnie z przewodnikiem Instrukcje, aby je wypróbować.

Język Kod języka Kategorie Tagi opis Dorosły, Marki, Kolor, Twarze, ImageType, Obiekty Gwiazdy, punkty orientacyjne Podpisy, gęste podpis
Arabski ar
Azerbejdżański az
Bułgarski bg
Bośniacki łaciński bs
Kataloński ca
Czeski cs
Walijski cy
Duński da
Niemiecki de
Grecki el
angielski en
Hiszpański es
Estoński et
Baskijski eu
Fiński fi
Francuski fr
Irlandzki ga
Galicyjski gl
Hebrajski he
Hindi hi
Chorwacki hr
Węgierski hu
Indonezyjski id
Włoski it
japoński ja
Kazachski kk
Koreański ko
Litewski lt
Łotewski lv
Macedoński mk
Malajska Malezja ms
Norweski (Bokmal) nb
Niderlandzki nl
Polski pl
Dari prs
Portugalski — Brazylia pt-BR
Portugalski — Portugalia pt
Portugalski — Portugalia pt-PT
Rumuński ro
Rosyjski ru
Słowacki sk
Słoweński sl
Serbski — cyrylica RS sr-Cryl
Serbski — łaciński RS sr-Latn
Szwedzki sv
Tajlandzki th
Turecki tr
ukraiński uk
wietnamski vi
Chiński uproszczony zh
Chiński uproszczony zh-Hans
Chiński tradycyjny zh-Hant

Osadzanie wielomodalne

Najnowszy model osadzania wielomodalnego obsługuje wyszukiwanie wektorów w wielu językach. Oryginalny model obsługuje tylko angielski. Obrazy wektoryzowane w modelu tylko w języku angielskim nie są zgodne z wyszukiwaniem tekstu w modelu wielojęzycznym.

Język Kod języka 2023-04-15 model 2022-04-11 model
Akrikaans af
Amharski am
Arabski ar
Ormiański hy
Asamski as
Asturian ast
Azerbejdżański az
Białoruski be
Bengalski bn
Bośniacki bs
Bułgarski bg
Birmański my
Kataloński ca
Cebuano ceb
Chińskiimpl zho
Chiński trad zho
Chorwacki hr
Czeski cs
Duński da
niderlandzki nl
angielski en
estoński et
Filipino (Tagalog) tl
Fiński fi
Francuski fr
Fulah ff
Galicyjski gl
Ganda lg
Gruziński ka
Niemiecki de
Grecki el
Gudżarati gu
Hausa ha
Hebrajski he
Hindi hi
węgierski, hu
Islandzki is
Igbo ig
Indonezyjski id
Irlandzki ga
Włoski it
japoński ja
Jawajski jv
Kabuverdianu kea
Kamba kam
Kannada kn
Kazachski kk
Khmer km
Koreański ko
Kirgiski ky
Lao lo
Łotewski lv
Lingala ln
Litewski lt
Luo luo
Luksemburski lb
Macedoński mk
Malajski ms
Malayalam ml
Maltański mt
Maoryski mi
Marathi mr
Mongolski mn
Nepalski ne
Soto Północne ns
Norweski no
Nyanja ny
Occitan oc
Orija or
Oromo om
Paszto ps
Perski fa
polski pl
portugalski (Brazylia) pt
Pendżabski pa
Rumuński ro
Rosyjski ru
Serbski sr
Shona sn
Sindhi sd
Słowacki sk
Słoweński sl
Somalii so
Sorani Kurdyjski ku
Hiszpański (Ameryka Łacińska) es
Suahili sw
Szwedzki sv
Tadżycki tg
Tamilski ta
Telugu te
Tajlandzki th
Turecki tr
ukraiński uk
Umbundu umb
Urdu ur
Uzbecki uz
Wietnamski vi
Walijski cy
Wolof wo
Xhosa xh
Joruba yo
Zulu zu