Az Azure AI Vision nyelvi támogatása
Az Azure AI Vision egyes képességei több nyelvet is támogatnak; az itt nem említett képességek csak az angol nyelvet támogatják.
Optikai karakterfelismerés (OCR)
Az Azure AI Vision Read API számos nyelvet támogat. Az Read
API képes szöveget kinyerni képekből és dokumentumokból vegyes nyelvekkel, például ugyanabból a szövegsorból anélkül, hogy nyelvi paramétert kellene megadnia. Lásd : Hogyan adhatja meg az Read
új nyelveket használó modellt .
Feljegyzés
Nyelvi kód megadása nem kötelező
Read
Az OCR mélytanuláson alapuló univerzális modelljei kinyerik a dokumentumok összes többnyelvű szövegét, beleértve a vegyes nyelveket tartalmazó szövegsorokat is, és nem igényelnek nyelvi kód megadását. Ne adja meg a nyelvi kódot paraméterként, hacsak nem biztos a nyelvben, és csak a megfelelő modell alkalmazására szeretné kényszeríteni a szolgáltatást. Ellenkező esetben előfordulhat, hogy a szolgáltatás hiányos és helytelen szöveget ad vissza.
Kézzel írt szöveg
Az alábbi táblázat felsorolja a legutóbb Read
használt GA-modell által kézzel írt szövegek OCR által támogatott nyelveket.
Nyelv | Nyelvi kód (nem kötelező) | Nyelv | Nyelvi kód (nem kötelező) |
---|---|---|---|
Angol | en |
Japán | ja |
kínai (egyszerűsített) | zh-Hans |
Koreai | ko |
Francia | fr |
Portugál | pt |
Német | de |
Spanyol | es |
Olasz | it |
Szöveg nyomtatása
Az alábbi táblázat felsorolja az OCR által támogatott nyelveket a legutóbbi Read
GA-modell által támogatott nyomtatási szövegekhez.
Nyelv | Kód (nem kötelező) | Nyelv | Kód (nem kötelező) |
---|---|---|---|
Búr | af |
Khasi | kha |
Albán | sq |
K'iche' | quc |
Angika (Devanagiri) | anp |
Koreai | ko |
Arab | ar |
Korku | kfq |
Asztúriai | ast |
Koryak | kpy |
Awadhi-Hindi (Devanagiri) | awa |
Kosraean | kos |
Azerbajdzsáni (latin) | az |
Kumyk (cirill betűs) | kum |
Bagheli | bfy |
Kurd (arab) | ku-arab |
Baszk | eu |
Kurd (latin) | ku-latn |
Fehérorosz (cirill betűs) | be , be-cyrl |
Kurukh (Devanagiri) | kru |
Fehérorosz (latin) | be , be-latn |
Kirgiz (cirill betűs) | ky |
Bhojpuri-Hindi (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Latin | la |
Bodo (Devanagiri) | brx |
Litván | lt |
Bosnyák (latin betűs) | bs |
Alsó sorbián | dsb |
Brajbha | bra |
Lule Sami | smj |
Breton | br |
Luxemburgi | lb |
Bolgár | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Maláj (latin) | ms |
Buryat (cirill betűs) | bua |
Máltai | mt |
Katalán | ca |
Malto (Devanagiri) | kmj |
Cebuano | ceb |
Man-szigeti macska | gv |
Letörés | rab |
Maori | mi |
Chamorro | ch |
Marathi | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongol (cirill betűs) | mn |
kínai (egyszerűsített) | zh-Hans |
Montenegró (cirill betűs) | cnr-cyrl |
Kínai (hagyományos) | zh-Hant |
Montenegró (latin) | cnr-latn |
Cornwalli | kw |
Nápolyi | nap |
Korzikai | co |
Nepáli | ne |
Krími tatár (latin) | crh |
Niuean | niu |
Horvát | hr |
Nogay | nog |
Cseh | cs |
Északi számi (latin) | sme |
Dán | da |
Norvég | no |
Dari | prs |
Okcitán | oc |
Dhimal (Devanagiri) | dhi |
Oszét | os |
Dogri (Devanagiri) | doi |
Pastu | ps |
Holland | nl |
Perzsa | fa |
Angol | en |
Lengyel | pl |
Erzya (cirill betűs) | myv |
Portugál | pt |
Észt | et |
Punjabi (arab) | pa |
Feröer-szigeteki | fo |
Ripuarian | ksh |
Fidzsi | fj |
Román | ro |
Filipino | fil |
Romansh | rm |
finn | fi |
Orosz | ru |
Francia | fr |
Sadri (Devanagiri) | sck |
Friuli | fur |
Szamoán (latin) | sm |
Gagauz (latin) | gag |
Szanszkrit (Devanagari) | sa |
Gallego | gl |
Santali (Devanagiri) | sat |
Német | de |
Skót | sco |
Gilbertese | gil |
Skót gael | gd |
Gondi (Devanagiri) | gon |
Szerb (latin betűs) | sr , sr-latn |
Grönlandi | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Haitii kreol | ht |
Skolt Sami | sms |
Halbi (Devanagiri) | hlb |
Szlovák | sk |
Hani | hni |
Szlovén | sl |
Haryanvi | bgc |
Szomáliai (arab) | so |
Hawaii | haw |
Dél-Szami | sma |
Hindi | hi |
Spanyol | es |
Hmong Daw (latin) | mww |
Szuahéli (latin) | sw |
Ho(Devanagiri) | hoc |
svéd | sv |
Magyar | hu |
Tajik (cirill betűs) | tg |
Izlandi | is |
Tatár (latin) | tt |
Inari Sami | smn |
Tetum | tet |
Indonéz | id |
Thangmi | thf |
Interlingva | ia |
Tongai | to |
Inuktitut (latin) | iu |
Török | tr |
Ír | ga |
Türkmének (latin betűs) | tk |
Olasz | it |
Tuvan | tyv |
Japán | ja |
Felső sorbián | hsb |
Jaunsari (Devanagiri) | Jns |
urdu | ur |
Jávai | jv |
Ujgur (arab) | ug |
Kabuverdianu | kea |
Üzbég (arab) | uz-arab |
Kachin (latin) | kac |
Üzbég (cirill betűs) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Üzbég (latin) | uz |
Karachay-Balkar | krc |
Volapük | vo |
Kara-Kalpak (cirill betűs) | kaa-cyrl |
Walser | wae |
Kara-Kalpak (latin) | kaa |
Walesi | cy |
Kashubian | csb |
Nyugati fríz | fy |
Kazak (cirill betűs) | kk-cyrl |
Yucatec Maya | yua |
Kazak (latin) | kk-latn |
Zhuang | za |
Khaling | klr |
Zulu | zu |
Képelemzés
Az Elemzés – Kép API egyes funkciói a lekérdezési paraméterrel megadott más nyelveken is visszaadhatják az language
eredményeket. Más funkciók az angol nyelvű eredményeket adják vissza, függetlenül attól, hogy milyen nyelv van megadva, és mások kivételt képeznek a nem támogatott nyelvek esetében. A funkciók meg vannak adva a és details
a visualFeatures
lekérdezési paraméterekkel; tekintse meg az Elemzés – Kép API-val elvégezhető műveletek áttekintését, vagy az útmutatót követve próbálja ki őket.
Nyelv | Nyelvkód | Kategóriák | Címkék | Leírás | Felnőtt, Márkák, Szín, Arcok, ImageType, Objektumok | Hírességek, nevezetességek | Feliratok, sűrű feliratok |
---|---|---|---|---|---|---|---|
Arab | ar |
✅ | |||||
Azerbajdzsáni | az |
✅ | |||||
Bolgár | bg |
✅ | |||||
Bosnyák latin | bs |
✅ | |||||
Katalán | ca |
✅ | |||||
Cseh | cs |
✅ | |||||
Walesi | cy |
✅ | |||||
Dán | da |
✅ | |||||
Német | de |
✅ | |||||
Görög | el |
✅ | |||||
Angol | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Spanyol | es |
✅ | ✅ | ✅ | ✅ | ||
Észt | et |
✅ | |||||
Baszk | eu |
✅ | |||||
finn | fi |
✅ | |||||
Francia | fr |
✅ | |||||
Ír | ga |
✅ | |||||
Gallego | gl |
✅ | |||||
héber | he |
✅ | |||||
Hindi | hi |
✅ | |||||
Horvát | hr |
✅ | |||||
Magyar | hu |
✅ | |||||
Indonéz | id |
✅ | |||||
Olasz | it |
✅ | |||||
Japán | ja |
✅ | ✅ | ✅ | ✅ | ||
Kazak | kk |
✅ | |||||
Koreai | ko |
✅ | |||||
Litván | lt |
✅ | |||||
Lett | lv |
✅ | |||||
Macedón | mk |
✅ | |||||
Maláj Malajzia | ms |
✅ | |||||
Norvég (Bokmal) | nb |
✅ | |||||
Holland | nl |
✅ | |||||
Lengyel | pl |
✅ | |||||
Dari | prs |
✅ | |||||
portugál-Brazília | pt-BR |
✅ | |||||
portugál-Portugália | pt |
✅ | ✅ | ✅ | ✅ | ||
portugál-Portugália | pt-PT |
✅ | |||||
Román | ro |
✅ | |||||
Orosz | ru |
✅ | |||||
Szlovák | sk |
✅ | |||||
Szlovén | sl |
✅ | |||||
Szerb - Cirill RS | sr-Cryl |
✅ | |||||
Szerb - Latin RS | sr-Latn |
✅ | |||||
Svéd | sv |
✅ | |||||
Thai | th |
✅ | |||||
Török | tr |
✅ | |||||
Ukrán | uk |
✅ | |||||
Vietnámi | vi |
✅ | |||||
kínai (egyszerűsített) | zh |
✅ | ✅ | ✅ | ✅ | ||
kínai (egyszerűsített) | zh-Hans |
✅ | |||||
Kínai (hagyományos) | zh-Hant |
✅ |
Multimodális beágyazások
A legújabb multimodális beágyazási modell számos nyelven támogatja a vektorkeresést. Az eredeti modell csak az angol nyelvet támogatja. Az angol nyelvű modellben vektorizált képek nem kompatibilisek a többnyelvű modell szöveges kereséseivel.
Nyelv | Nyelvkód | 2023-04-15 modell |
2022-04-11 modell |
---|---|---|---|
Akrikaans | af |
✅ | |
Amhara | am |
✅ | |
Arab | ar |
✅ | |
Örmény | hy |
✅ | |
asszámi | as |
✅ | |
Asztúriai | ast |
✅ | |
Azerbajdzsáni | az |
✅ | |
Belorusz | be |
✅ | |
Bengáli | bn |
✅ | |
bosnyák | bs |
✅ | |
Bolgár | bg |
✅ | |
Burmai | my |
✅ | |
Katalán | ca |
✅ | |
Cebuano | ceb |
✅ | |
Kínai simpl | zho |
✅ | |
Kínai Trad | zho |
✅ | |
Horvát | hr |
✅ | |
Cseh | cs |
✅ | |
Dán | da |
✅ | |
Holland | nl |
✅ | |
Angol | en |
✅ | ✅ |
Észt | et |
✅ | |
Filipino (Tagalog) | tl |
✅ | |
finn | fi |
✅ | |
Francia | fr |
✅ | |
Fulah | ff |
✅ | |
Gallego | gl |
✅ | |
Ganda | lg |
✅ | |
Grúz | ka |
✅ | |
Német | de |
✅ | |
Görög | el |
✅ | |
Gudzsaráti | gu |
✅ | |
Hausza | ha |
✅ | |
héber | he |
✅ | |
Hindi | hi |
✅ | |
Magyar | hu |
✅ | |
Izlandi | is |
✅ | |
Igbo | ig |
✅ | |
Indonéz | id |
✅ | |
Ír | ga |
✅ | |
Olasz | it |
✅ | |
Japán | ja |
✅ | |
Jávai | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
Kannada | kn |
✅ | |
Kazak | kk |
✅ | |
Khmer | km |
✅ | |
Koreai | ko |
✅ | |
Kirgiz | ky |
✅ | |
Lao | lo |
✅ | |
Lett | lv |
✅ | |
Lingala | ln |
✅ | |
Litván | lt |
✅ | |
Luo | luo |
✅ | |
Luxemburgi | lb |
✅ | |
Macedón | mk |
✅ | |
Maláj | ms |
✅ | |
Malajálam | ml |
✅ | |
Máltai | mt |
✅ | |
Maori | mi |
✅ | |
Marathi | mr |
✅ | |
Mongol | mn |
✅ | |
Nepáli | ne |
✅ | |
Északi szoto | ns |
✅ | |
Norvég | no |
✅ | |
Nyanja | ny |
✅ | |
Okcitán | oc |
✅ | |
Oriya | or |
✅ | |
Oromo | om |
✅ | |
Pastu | ps |
✅ | |
Perzsa | fa |
✅ | |
Lengyel | pl |
✅ | |
Portugál (Brazília) | pt |
✅ | |
Pandzsábi | pa |
✅ | |
Román | ro |
✅ | |
Orosz | ru |
✅ | |
szerb | sr |
✅ | |
Shona | sn |
✅ | |
Szindhi | sd |
✅ | |
Szlovák | sk |
✅ | |
Szlovén | sl |
✅ | |
Szomália | so |
✅ | |
Sorani kurd | ku |
✅ | |
Spanyol (latin-amerikai) | es |
✅ | |
Szuahéli | sw |
✅ | |
svéd | sv |
✅ | |
Tádzsik | tg |
✅ | |
Tamil | ta |
✅ | |
Telugu | te |
✅ | |
Thai | th |
✅ | |
Török | tr |
✅ | |
Ukrán | uk |
✅ | |
Umbundu | umb |
✅ | |
urdu | ur |
✅ | |
Üzbég | uz |
✅ | |
Vietnámi | vi |
✅ | |
Walesi | cy |
✅ | |
Wolof | wo |
✅ | |
Xhosza | xh |
✅ | |
Joruba | yo |
✅ | |
Zulu | zu |
✅ |