Az Azure AI Vision nyelvi támogatása
Az Azure AI Vision egyes képességei több nyelvet is támogatnak; az itt nem említett képességek csak az angol nyelvet támogatják.
Optikai karakterfelismerés (OCR)
Az Azure AI Vision Read API számos nyelvet támogat. Az Read
API képes szöveget kinyerni képekből és dokumentumokból vegyes nyelvekkel, például ugyanabból a szövegsorból anélkül, hogy nyelvi paramétert kellene megadnia. Lásd : Hogyan adhatja meg az Read
új nyelveket használó modellt .
Feljegyzés
Nyelvi kód megadása nem kötelező
Read
Az OCR mélytanuláson alapuló univerzális modelljei kinyerik a dokumentumok összes többnyelvű szövegét, beleértve a vegyes nyelveket tartalmazó szövegsorokat is, és nem igényelnek nyelvi kód megadását. Ne adja meg a nyelvi kódot paraméterként, hacsak nem biztos a nyelvben, és csak a megfelelő modell alkalmazására szeretné kényszeríteni a szolgáltatást. Ellenkező esetben előfordulhat, hogy a szolgáltatás hiányos és helytelen szöveget ad vissza.
Kézzel írt szöveg
Az alábbi táblázat felsorolja a legutóbb Read
használt GA-modell által kézzel írt szövegek OCR által támogatott nyelveket.
Nyelv | Nyelvi kód (nem kötelező) | Nyelv | Nyelvi kód (nem kötelező) |
---|---|---|---|
Angol | en |
Japán | ja |
kínai (egyszerűsített) | zh-Hans |
Koreai | ko |
Francia | fr |
Portugál | pt |
Német | de |
Spanyol | es |
Olasz | it |
Szöveg nyomtatása
Az alábbi táblázat felsorolja az OCR által támogatott nyelveket a legutóbbi Read
GA-modell által támogatott nyomtatási szövegekhez.
Nyelv | Kód (nem kötelező) | Nyelv | Kód (nem kötelező) |
---|---|---|---|
Búr | af |
Khasi | kha |
Albán | sq |
K'iche' | quc |
Angika (Devanagiri) | anp |
Koreai | ko |
Arab | ar |
Korku | kfq |
Asztúriai | ast |
Koryak | kpy |
Awadhi-Hindi (Devanagiri) | awa |
Kosraean | kos |
Azerbajdzsáni (latin) | az |
Kumyk (cirill betűs) | kum |
Bagheli | bfy |
Kurd (arab) | ku-arab |
Baszk | eu |
Kurd (latin) | ku-latn |
Fehérorosz (cirill betűs) | be , be-cyrl |
Kurukh (Devanagiri) | kru |
Fehérorosz (latin) | be , be-latn |
Kirgiz (cirill betűs) | ky |
Bhojpuri-Hindi (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Latin | la |
Bodo (Devanagiri) | brx |
Litván | lt |
Bosnyák (latin betűs) | bs |
Alsó sorbián | dsb |
Brajbha | bra |
Lule Sami | smj |
Breton | br |
Luxemburgi | lb |
Bolgár | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Maláj (latin) | ms |
Buryat (cirill betűs) | bua |
Máltai | mt |
Katalán | ca |
Malto (Devanagiri) | kmj |
Cebui | ceb |
Manx | gv |
Letörés | rab |
Maori | mi |
Chamorro | ch |
Marathi | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongol (cirill betűs) | mn |
kínai (egyszerűsített) | zh-Hans |
Montenegró (cirill betűs) | cnr-cyrl |
Kínai (hagyományos) | zh-Hant |
Montenegró (latin) | cnr-latn |
Korni | kw |
Nápolyi | nap |
Korzikai | co |
Nepáli | ne |
Krími tatár (latin) | crh |
Niuean | niu |
Horvát | hr |
Nogay | nog |
Cseh | cs |
Északi számi (latin) | sme |
Dán | da |
Norvég | no |
Dari | prs |
Okszitán | oc |
Dhimal (Devanagiri) | dhi |
Oszét | os |
Dogri (Devanagiri) | doi |
Pastu | ps |
Holland | nl |
Perzsa | fa |
Angol | en |
Lengyel | pl |
Erzya (cirill betűs) | myv |
Portugál | pt |
Észt | et |
Punjabi (arab) | pa |
Feröer-szigeteki | fo |
Ripuarian | ksh |
Fidzsi | fj |
Román | ro |
Filipino | fil |
Romansh | rm |
finn | fi |
Orosz | ru |
Francia | fr |
Sadri (Devanagiri) | sck |
Friuli | fur |
Szamoán (latin) | sm |
Gagauz (latin) | gag |
Szanszkrit (Devanagari) | sa |
Gallego | gl |
Santali (Devanagiri) | sat |
Német | de |
Skót | sco |
Gilbertese | gil |
Skót gaelic | gd |
Gondi (Devanagiri) | gon |
Szerb (latin betűs) | sr , sr-latn |
Grönlandi | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Haitii kreol | ht |
Skolt Sami | sms |
Halbi (Devanagiri) | hlb |
Szlovák | sk |
Hani | hni |
Szlovén | sl |
Haryanvi | bgc |
Szomáliai (arab) | so |
Hawaii | haw |
Dél-Szami | sma |
Hindi | hi |
Spanyol | es |
Hmong Daw (latin) | mww |
Szuahéli (latin) | sw |
Ho(Devanagiri) | hoc |
Svéd | sv |
Magyar | hu |
Tajik (cirill betűs) | tg |
Izlandi | is |
Tatár (latin) | tt |
Inari Sami | smn |
Tetum | tet |
Indonéz | id |
Thangmi | thf |
Interlingva | ia |
Tongai | to |
Inuktitut (latin) | iu |
Török | tr |
Ír | ga |
Türkmének (latin betűs) | tk |
Olasz | it |
Tuvan | tyv |
Japán | ja |
Felső sorbián | hsb |
Jaunsari (Devanagiri) | Jns |
urdu | ur |
Jávai | jv |
Ujgur (arab) | ug |
Kabuverdianu | kea |
Üzbég (arab) | uz-arab |
Kachin (latin) | kac |
Üzbég (cirill betűs) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Üzbég (latin) | uz |
Karachay-Balkar | krc |
Volapük | vo |
Kara-Kalpak (cirill betűs) | kaa-cyrl |
Walser | wae |
Kara-Kalpak (latin) | kaa |
Walesi | cy |
Kashubian | csb |
Nyugati fríz | fy |
Kazak (cirill betűs) | kk-cyrl |
Yucatec Maya | yua |
Kazak (latin) | kk-latn |
Zhuang | za |
Khaling | klr |
Zulu | zu |
Kép elemzése
Az Elemzés – Kép API egyes funkciói a lekérdezési paraméterrel megadott más nyelveken is visszaadhatják az language
eredményeket. Más műveletek az eredményeket angol nyelven adják vissza, függetlenül attól, hogy milyen nyelv van megadva, mások pedig kivételt képeznek a nem támogatott nyelvek esetében. A műveletek meg vannak adva a és a visualFeatures
lekérdezési paraméterekkel; tekintse meg az Elemzés API-val elvégezhető összes művelet áttekintését, vagy az útmutatót követve próbálja ki details
őket.
Nyelv | Nyelvkód | Kategóriák | Címkék | Leírás | Felnőtt, Márkák, Szín, Arcok, ImageType, Objektumok | Hírességek, nevezetességek | Feliratok, sűrű képaláírás |
---|---|---|---|---|---|---|---|
Arab | ar |
✅ | |||||
Azerbajdzsáni | az |
✅ | |||||
Bolgár | bg |
✅ | |||||
Bosnyák latin | bs |
✅ | |||||
Katalán | ca |
✅ | |||||
Cseh | cs |
✅ | |||||
Walesi | cy |
✅ | |||||
Dán | da |
✅ | |||||
Német | de |
✅ | |||||
Görög | el |
✅ | |||||
Angol | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Spanyol | es |
✅ | ✅ | ✅ | ✅ | ||
Észt | et |
✅ | |||||
Baszk | eu |
✅ | |||||
finn | fi |
✅ | |||||
Francia | fr |
✅ | |||||
Ír | ga |
✅ | |||||
Gallego | gl |
✅ | |||||
héber | he |
✅ | |||||
Hindi | hi |
✅ | |||||
Horvát | hr |
✅ | |||||
Magyar | hu |
✅ | |||||
Indonéz | id |
✅ | |||||
Olasz | it |
✅ | |||||
Japán | ja |
✅ | ✅ | ✅ | ✅ | ||
Kazak | kk |
✅ | |||||
Koreai | ko |
✅ | |||||
Litván | lt |
✅ | |||||
Lett | lv |
✅ | |||||
Macedón | mk |
✅ | |||||
Maláj Malajzia | ms |
✅ | |||||
Norvég (Bokmal) | nb |
✅ | |||||
Holland | nl |
✅ | |||||
Lengyel | pl |
✅ | |||||
Dari | prs |
✅ | |||||
portugál-Brazília | pt-BR |
✅ | |||||
portugál-Portugália | pt |
✅ | ✅ | ✅ | ✅ | ||
portugál-Portugália | pt-PT |
✅ | |||||
Román | ro |
✅ | |||||
Orosz | ru |
✅ | |||||
Szlovák | sk |
✅ | |||||
Szlovén | sl |
✅ | |||||
Szerb - Cirill RS | sr-Cryl |
✅ | |||||
Szerb - Latin RS | sr-Latn |
✅ | |||||
Svéd | sv |
✅ | |||||
Thai | th |
✅ | |||||
Török | tr |
✅ | |||||
Ukrán | uk |
✅ | |||||
Vietnámi | vi |
✅ | |||||
kínai (egyszerűsített) | zh |
✅ | ✅ | ✅ | ✅ | ||
kínai (egyszerűsített) | zh-Hans |
✅ | |||||
Kínai (hagyományos) | zh-Hant |
✅ |
Multimodális beágyazások
A legújabb multimodális beágyazási modell számos nyelven támogatja a vektorkeresést. Az eredeti modell csak az angol nyelvet támogatja. Az angol nyelvű modellben vektorizált képek nem kompatibilisek a többnyelvű modell szöveges kereséseivel.
Nyelv | Nyelvkód | 2023-04-15 modell |
2022-04-11 modell |
---|---|---|---|
Akrikaans | af |
✅ | |
Amhara | am |
✅ | |
Arab | ar |
✅ | |
Örmény | hy |
✅ | |
asszámi | as |
✅ | |
Asztúriai | ast |
✅ | |
Azerbajdzsáni | az |
✅ | |
Belorusz | be |
✅ | |
Bengáli | bn |
✅ | |
bosnyák | bs |
✅ | |
Bolgár | bg |
✅ | |
Burmai | my |
✅ | |
Katalán | ca |
✅ | |
Cebui | ceb |
✅ | |
Kínai simpl | zho |
✅ | |
Kínai Trad | zho |
✅ | |
Horvát | hr |
✅ | |
Cseh | cs |
✅ | |
Dán | da |
✅ | |
Holland | nl |
✅ | |
Angol | en |
✅ | ✅ |
Észt | et |
✅ | |
Filipino (Tagalog) | tl |
✅ | |
finn | fi |
✅ | |
Francia | fr |
✅ | |
Fulah | ff |
✅ | |
Gallego | gl |
✅ | |
Ganda | lg |
✅ | |
Grúz | ka |
✅ | |
Német | de |
✅ | |
Görög | el |
✅ | |
Gudzsaráti | gu |
✅ | |
Hausa | ha |
✅ | |
héber | he |
✅ | |
Hindi | hi |
✅ | |
Magyar | hu |
✅ | |
Izlandi | is |
✅ | |
Igbo | ig |
✅ | |
Indonéz | id |
✅ | |
Ír | ga |
✅ | |
Olasz | it |
✅ | |
Japán | ja |
✅ | |
Jávai | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
Kannada | kn |
✅ | |
Kazak | kk |
✅ | |
Khmer | km |
✅ | |
Koreai | ko |
✅ | |
Kirgiz | ky |
✅ | |
Lao | lo |
✅ | |
Lett | lv |
✅ | |
Lingala | ln |
✅ | |
Litván | lt |
✅ | |
Luo | luo |
✅ | |
Luxemburgi | lb |
✅ | |
Macedón | mk |
✅ | |
Maláj | ms |
✅ | |
Malajálam | ml |
✅ | |
Máltai | mt |
✅ | |
Maori | mi |
✅ | |
Marathi | mr |
✅ | |
Mongol | mn |
✅ | |
Nepáli | ne |
✅ | |
Északi szoto | ns |
✅ | |
Norvég | no |
✅ | |
Nyanja | ny |
✅ | |
Okszitán | oc |
✅ | |
Oriya | or |
✅ | |
Oromo | om |
✅ | |
Pastu | ps |
✅ | |
Perzsa | fa |
✅ | |
Lengyel | pl |
✅ | |
Portugál (Brazília) | pt |
✅ | |
Pandzsábi | pa |
✅ | |
Román | ro |
✅ | |
Orosz | ru |
✅ | |
szerb | sr |
✅ | |
Shona | sn |
✅ | |
Szindi | sd |
✅ | |
Szlovák | sk |
✅ | |
Szlovén | sl |
✅ | |
Szomáli | so |
✅ | |
Sorani kurd | ku |
✅ | |
Spanyol (latin-amerikai) | es |
✅ | |
Szuahéli | sw |
✅ | |
Svéd | sv |
✅ | |
Tádzsik | tg |
✅ | |
Tamil | ta |
✅ | |
Telugu | te |
✅ | |
Thai | th |
✅ | |
Török | tr |
✅ | |
Ukrán | uk |
✅ | |
Umbundu | umb |
✅ | |
urdu | ur |
✅ | |
Üzbég | uz |
✅ | |
Vietnámi | vi |
✅ | |
Walesi | cy |
✅ | |
Wolof | wo |
✅ | |
Xhosza | xh |
✅ | |
Joruba | yo |
✅ | |
Zulu | zu |
✅ |