Språkstöd för Azure AI Vision
Vissa funktioner i Azure AI Vision stöder flera språk. alla funktioner som inte nämns här stöder endast engelska.
Optisk teckenläsning (OCR)
Läs-API:et för Azure AI Vision stöder många språk. API:et Read
kan extrahera text från bilder och dokument med blandade språk, inklusive från samma textrad, utan att det krävs någon språkparameter. Se Så här anger du vilken modell som Read
ska använda de nya språken.
Kommentar
Språkkod valfritt
Read
OCR:s djupinlärningsbaserade universella modeller extraherar all flerspråkig text i dina dokument, inklusive textrader med blandade språk, och kräver inte att du anger någon språkkod. Ange inte språkkoden som parameter om du inte är säker på språket och vill tvinga tjänsten att endast tillämpa den relevanta modellen. Annars kan tjänsten returnera ofullständig och felaktig text.
Handskriven text
I följande tabell visas de OCR-språk som stöds för handskriven text av den senaste Read
GA-modellen.
Språk | Språkkod (valfritt) | Språk | Språkkod (valfritt) |
---|---|---|---|
Engelska | en |
Japanska | ja |
Kinesiska (förenklad) | zh-Hans |
Koreanska | ko |
Franska | fr |
Portugisiska | pt |
Tyska | de |
Spanska | es |
Italienska | it |
Skriv ut text
I följande tabell visas de OCR-språk som stöds för utskrift av text enligt den senaste Read
GA-modellen.
Språk | Kod (valfritt) | Språk | Kod (valfritt) |
---|---|---|---|
Afrikaans | af |
Khasi | kha |
Albanska | sq |
K'iche' | quc |
Angika (Devanagiri) | anp |
Koreanska | ko |
Arabiska | ar |
Korku | kfq |
Asturiska | ast |
Koryak | kpy |
Awadhi-Hindi (Devanagiri) | awa |
Kosraean | kos |
Azerbajdzjanska (latinsk) | az |
Kumyk (kyrillisk) | kum |
Bagheli | bfy |
Kurdiska (arabiska) | ku-arab |
Baskiska | eu |
Kurdiska (latinsk) | ku-latn |
Vitryska (kyrillisk) | be , be-cyrl |
Kurukh (Devanagiri) | kru |
Vitryska (latinsk) | be , be-latn |
Kirgizistan (kyrillisk) | ky |
Bhojpuri-Hindi (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Latin | la |
Bodo (Devanagiri) | brx |
Litauiska | lt |
Bosniska (latinsk) | bs |
Lägre sorbian | dsb |
Brajbha | bra |
Lulesamiska | smj |
Breton | br |
Luxemburgiska | lb |
Bulgariska | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Malay (latinsk) | ms |
Buryat (kyrillisk) | bua |
Maltesiska | mt |
Katalanska | ca |
Malto (Devanagiri) | kmj |
Cebuano | ceb |
Manx | gv |
Chamling | rab |
Maori | mi |
Chamorro | ch |
Marathi | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongoliska (kyrillisk) | mn |
Kinesiska (förenklad) | zh-Hans |
Montenegrin (kyrillisk) | cnr-cyrl |
Kinesiska (traditionell) | zh-Hant |
Montenegrin (latinsk) | cnr-latn |
Cornish | kw |
Napolitanska | nap |
Korsikanska | co |
Nepali | ne |
Krimtatar (latinsk) | crh |
Niuean | niu |
Kroatiska | hr |
Nogay | nog |
Tjeckiska | cs |
Nordsamiska (latinsk) | sme |
Danska | da |
Norska | no |
Dari | prs |
Occitanska | oc |
Dhimal (Devanagiri) | dhi |
Ossetic | os |
Dogri (Devanagiri) | doi |
Pashto | ps |
Nederländska | nl |
Persiska | fa |
Engelska | en |
Polska | pl |
Erzya (kyrillisk) | myv |
Portugisiska | pt |
Estniska | et |
Punjabi (arabiska) | pa |
Färöiska | fo |
Ripuarian | ksh |
Fijianska | fj |
Rumänska | ro |
Filipino | fil |
Rätoromanska | rm |
Finska | fi |
Ryska | ru |
Franska | fr |
Sadri (Devanagiri) | sck |
Friuliska | fur |
Samoanska (latinsk) | sm |
Gagauz (latinsk) | gag |
Sanskrit (Devanagari) | sa |
Galiciska | gl |
Santali(Devanagiri) | sat |
Tyska | de |
Skotsk | sco |
Gilbertese | gil |
Skotsk gaeliska | gd |
Gondi (Devanagiri) | gon |
Serbiska (latinsk) (Serbien) | sr , sr-latn |
Grönländska | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Haitisk kreol | ht |
Skoltsamiska | sms |
Halbi (Devanagiri) | hlb |
Slovakiska | sk |
Hani | hni |
Slovenska | sl |
Haryanvi | bgc |
Somaliska (arabiska) | so |
Hawaiian | haw |
Sydsamiska | sma |
Hindi | hi |
Spanska | es |
Hmong Daw (latinsk) | mww |
Swahili (latinsk) | sw |
Ho(Devanagiri) | hoc |
Svenska | sv |
Ungerska | hu |
Tadzjikiska (kyrillisk) | tg |
Isländska | is |
Tatar (latinsk) | tt |
Inari Sami | smn |
Tetum | tet |
Indonesiska | id |
Thangmi | thf |
Interlingua | ia |
Tonga | to |
Inuktitut (latinsk) | iu |
Turkiska | tr |
Iriska | ga |
Turkmen (latinsk) | tk |
Italienska | it |
Tuvan | tyv |
Japanska | ja |
Högsorbiska | hsb |
Jaunsari (Devanagiri) | Jns |
Urdu | ur |
Javanesiska | jv |
Uiguriska (arabiska) | ug |
Kabuverdianu | kea |
Uzbekiska (arabiska) | uz-arab |
Kachin (latinsk) | kac |
Uzbekiska (kyrillisk) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Uzbekiska (latinsk) | uz |
Karachay-Balkar | krc |
Volapük | vo |
Kara-Kalpak (kyrillisk) | kaa-cyrl |
Walser | wae |
Kara-Kalpak (latinsk) | kaa |
Walesiska | cy |
Kasjubiska | csb |
Västra frisiska | fy |
Kazakiska (kyrilliska) | kk-cyrl |
Yukatekisk maya | yua |
Kazakiska (latinsk) | kk-latn |
Zhuang | za |
Khaling | klr |
Zulu | zu |
Analysera bild
Vissa funktioner i API:et Analysera – bild kan returnera resultat på andra språk, som anges med language
frågeparametern. Andra åtgärder returnerar resultat på engelska oavsett vilket språk som anges, och andra utlöser ett undantag för språk som inte stöds. Åtgärder anges med visualFeatures
frågeparametrarna och details
finns i Översikt för en lista över alla åtgärder som du kan utföra med Analysera API:et, eller följ instruktioner för att prova dem.
Språk | Språkkod | Kategorier | Taggar | beskrivning | Vuxen, Varumärken, Färg, Ansikten, ImageType, Objekt | Kändisar, landmärken | Bildtexter, kompakta bildtext |
---|---|---|---|---|---|---|---|
Arabiska | ar |
✅ | |||||
Azerbajdzjanska | az |
✅ | |||||
Bulgariska | bg |
✅ | |||||
Bosniska latinska | bs |
✅ | |||||
Katalanska | ca |
✅ | |||||
Tjeckiska | cs |
✅ | |||||
Walesiska | cy |
✅ | |||||
Danska | da |
✅ | |||||
Tyska | de |
✅ | |||||
Grekiska | el |
✅ | |||||
Engelska | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Spanska | es |
✅ | ✅ | ✅ | ✅ | ||
Estniska | et |
✅ | |||||
Baskiska | eu |
✅ | |||||
Finska | fi |
✅ | |||||
Franska | fr |
✅ | |||||
Iriska | ga |
✅ | |||||
Galiciska | gl |
✅ | |||||
Hebreiska | he |
✅ | |||||
Hindi | hi |
✅ | |||||
Kroatiska | hr |
✅ | |||||
Ungerska | hu |
✅ | |||||
Indonesiska | id |
✅ | |||||
Italienska | it |
✅ | |||||
Japanska | ja |
✅ | ✅ | ✅ | ✅ | ||
Kazakiska | kk |
✅ | |||||
Koreanska | ko |
✅ | |||||
Litauiska | lt |
✅ | |||||
Lettiska | lv |
✅ | |||||
Makedonska | mk |
✅ | |||||
Malay Malaysia | ms |
✅ | |||||
Norska (Bokmal) | nb |
✅ | |||||
Nederländska | nl |
✅ | |||||
Polska | pl |
✅ | |||||
Dari | prs |
✅ | |||||
Portugisiska (Brasilien) | pt-BR |
✅ | |||||
Portugisiska (Portugal) | pt |
✅ | ✅ | ✅ | ✅ | ||
Portugisiska (Portugal) | pt-PT |
✅ | |||||
Rumänska | ro |
✅ | |||||
Ryska | ru |
✅ | |||||
Slovakiska | sk |
✅ | |||||
Slovenska | sl |
✅ | |||||
Serbiska – kyrillisk RS | sr-Cryl |
✅ | |||||
Serbiska – latinsk RS | sr-Latn |
✅ | |||||
Svenska | sv |
✅ | |||||
Thailändska | th |
✅ | |||||
Turkiska | tr |
✅ | |||||
Ukrainska | uk |
✅ | |||||
Vietnamesiska | vi |
✅ | |||||
Kinesiska (förenklad) | zh |
✅ | ✅ | ✅ | ✅ | ||
Kinesiska (förenklad) | zh-Hans |
✅ | |||||
Kinesiska (traditionell) | zh-Hant |
✅ |
Multimodala inbäddningar
Den senaste multimodala inbäddningsmodellen stöder vektorsökning på många språk. Den ursprungliga modellen stöder endast engelska. Bilder som är vektoriserade i modellen endast på engelska är inte kompatibla med textsökningar i den flerspråkiga modellen.
Språk | Språkkod | 2023-04-15 modell |
2022-04-11 modell |
---|---|---|---|
Akrikaans | af |
✅ | |
Amhariska | am |
✅ | |
Arabiska | ar |
✅ | |
Armeniska | hy |
✅ | |
Assamesiska | as |
✅ | |
Asturiska | ast |
✅ | |
Azerbajdzjanska | az |
✅ | |
Vitryska | be |
✅ | |
Bengali | bn |
✅ | |
Bosnian | bs |
✅ | |
Bulgariska | bg |
✅ | |
Burmesiska | my |
✅ | |
Katalanska | ca |
✅ | |
Cebuano | ceb |
✅ | |
Kinesiska simpl | zho |
✅ | |
Kinesisk trad | zho |
✅ | |
Kroatiska | hr |
✅ | |
Tjeckiska | cs |
✅ | |
Danska | da |
✅ | |
Nederländska | nl |
✅ | |
Engelska | en |
✅ | ✅ |
Estniska | et |
✅ | |
Filippinska (Tagalog) | tl |
✅ | |
Finska | fi |
✅ | |
Franska | fr |
✅ | |
Fulah | ff |
✅ | |
Galiciska | gl |
✅ | |
Luganda | lg |
✅ | |
Georgiska | ka |
✅ | |
Tyska | de |
✅ | |
Grekiska | el |
✅ | |
Gujarati | gu |
✅ | |
Hausa | ha |
✅ | |
Hebreiska | he |
✅ | |
Hindi | hi |
✅ | |
Ungerska | hu |
✅ | |
Isländska | is |
✅ | |
Ibo | ig |
✅ | |
Indonesiska | id |
✅ | |
Iriska | ga |
✅ | |
Italienska | it |
✅ | |
Japanska | ja |
✅ | |
Javanesiska | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
Kannada | kn |
✅ | |
Kazakiska | kk |
✅ | |
Khmer | km |
✅ | |
Koreanska | ko |
✅ | |
Kirgisiska | ky |
✅ | |
Lao | lo |
✅ | |
Lettiska | lv |
✅ | |
Lingala | ln |
✅ | |
Litauiska | lt |
✅ | |
Luo | luo |
✅ | |
Luxemburgiska | lb |
✅ | |
Makedonska | mk |
✅ | |
Malajiska | ms |
✅ | |
Malayalam | ml |
✅ | |
Maltesiska | mt |
✅ | |
Maori | mi |
✅ | |
Marathi | mr |
✅ | |
Mongoliska | mn |
✅ | |
Nepali | ne |
✅ | |
Sepedi | ns |
✅ | |
Norska | no |
✅ | |
Nyanja | ny |
✅ | |
Occitanska | oc |
✅ | |
Oriya | or |
✅ | |
Oromo | om |
✅ | |
Pashto | ps |
✅ | |
Persiska | fa |
✅ | |
Polska | pl |
✅ | |
Portugisiska (Brasilien) | pt |
✅ | |
Punjabi | pa |
✅ | |
Rumänska | ro |
✅ | |
Ryska | ru |
✅ | |
Serbiska | sr |
✅ | |
Shona | sn |
✅ | |
Sindhi | sd |
✅ | |
Slovakiska | sk |
✅ | |
Slovenska | sl |
✅ | |
Somaliska | so |
✅ | |
Sorani kurdiska | ku |
✅ | |
Spanska (latinamerikanska) | es |
✅ | |
Swahili | sw |
✅ | |
Svenska | sv |
✅ | |
Tadzjikiska | tg |
✅ | |
Tamilska | ta |
✅ | |
Telugu | te |
✅ | |
Thailändska | th |
✅ | |
Turkiska | tr |
✅ | |
Ukrainska | uk |
✅ | |
Umbundu | umb |
✅ | |
Urdu | ur |
✅ | |
Uzbekiska | uz |
✅ | |
Vietnamesiska | vi |
✅ | |
Walesiska | cy |
✅ | |
Wolof | wo |
✅ | |
Xhosa | xh |
✅ | |
Yoruba | yo |
✅ | |
Zulu | zu |
✅ |
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för