Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Konten ini berlaku untuk:v2.1 | Versi terbaru:
v4.0 (GA)
Model Kecerdasan Dokumen Azure AI menyediakan dukungan pemrosesan dokumen multibahasa. Kemampuan dukungan bahasa kami memungkinkan pengguna Anda untuk berkomunikasi dengan aplikasi Anda dengan cara alami dan memberdayakan pencapaian global. Model analisis dokumen memungkinkan ekstraksi teks dari formulir dan dokumen dan mengembalikan konten siap bisnis terstruktur yang siap untuk tindakan, penggunaan, atau kemajuan organisasi Anda. Tabel berikut mencantumkan bahasa dan dukungan lokal yang tersedia berdasarkan model dan fitur:
- Baca: Model baca memungkinkan ekstraksi dan analisis teks cetak dan tulisan tangan. Model ini adalah mesin OCR yang mendasari untuk model bawaan Inteligensi Dokumen lainnya seperti tata letak, dokumen umum, faktur, tanda terima, dokumen identitas (ID), kartu asuransi kesehatan, dokumen pajak, dan model kustom. Untuk informasi selengkapnya, lihatGambaran umum model baca
- Tata Letak: Model tata letak memungkinkan ekstraksi dan analisis teks, tabel, struktur dokumen, dan tanda pilihan (seperti tombol radio dan kotak centang) dari formulir dan dokumen.
- Dokumen umum: Model dokumen umum memungkinkan ekstraksi dan analisis teks, struktur dokumen, dan pasangan kunci-nilai. Untuk informasi selengkapnya, lihatGambaran umum model dokumen umum
Catatan
Kode bahasa opsional
Model universal berbasis pembelajaran mendalam Kecerdasan Dokumen mengekstrak semua teks multibahasa dalam dokumen Anda, termasuk baris teks dengan bahasa campuran, dan tidak memerlukan penentuan kode bahasa.
Jangan berikan kode bahasa sebagai parameter kecuali Anda yakin tentang bahasa dan ingin memaksa layanan untuk hanya menerapkan model yang relevan. Jika tidak, layanan dapat mengembalikan teks yang tidak lengkap dan salah.
Selain itu, Tidak perlu menentukan lokal. Ini adalah parameter opsional. Teknologi pembelajaran mendalam Kecerdasan Dokumen akan mendeteksi bahasa teks secara otomatis dalam gambar Anda.
Model Baca
ID Model: prabuilt-read
Tabel berikut mencantumkan dukungan bahasa model baca untuk mengekstrak dan menganalisis teks cetak .
Bahasa | Kode (opsional) |
---|---|
Abaza | abq |
Abkhazia | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Jauh | aa |
Afrika | af |
Akan | ak |
Albania | sq |
Algonquin | alq |
Angika (Dewanagari) | anp |
Arab | ar |
Asturia | ast |
(Tanzania) | asa |
Avaric | av |
Awadhi-Hindi (Dewanagari) | awa |
Aymara | ay |
Bahasa Azerbaijan (Latin) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Bashkir | ba |
Basque | eu |
Bahasa Belarusia (Sirilik) |
be , be-cyrl |
Bahasa Belarusia (Latin) |
be , be-latn |
Bemba (Zambia) | bem |
Bena (Tanzania) | bez |
Bhojpuri-Hindi (Dewanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Dewanagari) | brx |
Bosnia (Latin) | bs |
Brajbha | bra |
Breton | br |
Bulgaria | bg |
Bundeli | bns |
Bahasa Buryat (Sirilik) | bua |
Katalan | ca |
Cebú | ceb |
Chamling | rab |
Chamorro | ch |
Chechnya | ce |
Chhattisgarhi (Dewanagari) | hne |
Chiga | cgg |
Mandarin Sederhana | zh-Hans |
Mandarin Tradisional | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Kernowek | kw |
Korsika | co |
Cree | cr |
Creek | mus |
Tatar Krimea (Latin) | crh |
Kroasia | hr |
Gagak | cro |
Cheska | cs |
Dansk | da |
Dargwa | dar |
Dari | prs |
Dhimal (Dewanagari) | dhi |
Dogri (Dewanagari) | doi |
Duala | dua |
Dungan | dng |
Belanda | nl |
Efik | efi |
Inggris | en |
Bahasa Erzya (Sirilik) | myv |
Esti | et |
Bahasa Faroe | fo |
Fiji | fj |
Filipino | fil |
Suomi | fi |
Bahasa | Kode (opsional) |
---|---|
Fon |
fon |
Prancis | fr |
Friuli | fur |
Ga |
gaa |
Bahasa Gagauz (Latin) | gag |
Galisia | gl |
Ganda | lg |
Gayo | gay |
Jerman | de |
Kiribati | gil |
Gondi (Dewanagari) | gon |
Yunani | el |
Greenland | kl |
Guarani | gn |
Gurung (Dewanagari) | gvr |
Gusii | guz |
Kreol Haiti | ht |
Halbi (Dewanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Bahasa Hawaii | haw |
Ibrani | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (Latin) | mww |
Ho(Dewanagari) | hoc |
Hungaria | hu |
Iban | iba |
Islandia | is |
Igbo | ig |
Iloko | ilo |
Bahasa Inari Sami | smn |
Indonesia | id |
Ingush | inh |
Interlingua | ia |
Inuktitut (Latin) | iu |
Irlandia | ga |
Italia | it |
Jepang | ja |
Jaunsari (Dewanagari) | Jns |
Jawa | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
JIngpho (Latin) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Dewanagari) | xnr |
Kanuri | kr |
Bahasa Karachay-Balkar | krc |
Bahasa Kara-Kalpak (Sirilik) | kaa-cyrl |
Bahasa Kara-Kalpak (Latin) | kaa |
Kasubia | csb |
Bahasa Kazakhstan (Sirilik) | kk-cyrl |
Bahasa Kazakhstan (Latin) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
K'iche' | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Korea | ko |
Korku | kfq |
Bahasa Koryak | kpy |
Bahasa Kosraea | kos |
Kpelle | kpe |
Kuanyama | kj |
Bahasa Kumyk (Sirilik) | kum |
Kurdi (Arab) | ku-arab |
Kurdi (Latin) | ku-latn |
Kurukh (Dewanagari) | kru |
Kirgizstan (Sirilik) | ky |
Lak |
lbe |
Bahasa Lakota | lkt |
Bahasa | Kode (opsional) |
---|---|
Latin | la |
Latvi | lv |
Bahasa Lezghian | lex |
Bahasa Lingala | ln |
Lituavi | lt |
Sorbia Hulu | dsb |
Lozi | loz |
Bahasa Lule Sami | smj |
Luo (Kenya dan Tanzania) | luo |
Luksemburg | lb |
Luyia | luy |
Makedonia | mk |
Machame | jmc |
Orang Madura | mad |
Mahasu Pahari (Dewanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malagasi | mg |
Melayu (Latin) | ms |
Malta | mt |
Malto (Dewanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | mi |
Mapudungun | arn |
Marathi | mr |
Mari (Rusia) | chm |
Masai | mas |
Mende (Sierra Leone) | men |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Mohawk | moh |
Bahasa Mongolia (Sirilik) | mn |
Mongondow | mog |
Bahasa Montenegro (Sirilik) | cnr-cyrl |
Bahasa Montenegro (Latin) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitan | nap |
Nepal | ne |
Ngomba | jgo |
Bahasa Niuean | niu |
Bahasa Nogay | nog |
Ndebele Utara | nd |
Sami Utara (Latin) | sme |
Norwegia | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Oksitan | oc |
Ojibwa | oj |
Oromo | om |
Bahasa Ossetic | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Farsi | fa |
Polski | pl |
Portugis | pt |
Punjabi (Arab) | pa |
Quechua | qu |
Bahasa Ripuaria | ksh |
Rumania | ro |
Romansh | rm |
Rundi | rn |
Rusia | ru |
Rwa |
rwk |
Sadri (Dewanagari) | sck |
Sakha | sah |
Samburu | saq |
Bahasa Samoa (Latin) | sm |
Sango | sg |
Bahasa | Kode (opsional) |
---|---|
Sangu (Gabon) | snq |
Sansekerta (Devanagari) | sa |
Santali(Dewanagari) | sat |
Skotlandia | sco |
Gaelik Skotlandia | gd |
Sena | seh |
Serbia (Sirilik) | sr-cyrl |
Serbia (Latin) |
sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Dewanagari) | srx |
Bahasa Skolt Sami | sms |
Slovak | sk |
Sloven | sl |
Soga | xog |
Somalia (Arab) | so |
Somali (Latin) | so-latn |
Songhai | son |
Ndebele Selatan | nr |
Altai Selatan | alt |
Sami Selatan | sma |
Sotho Selatan | st |
Spanyol | es |
Sunda | su |
Swahili (Latin) | sw |
Swati | ss |
Swedia | sv |
Tabassaran | tab |
Tachelhit | shi |
Tahitian | ty |
Taita | dav |
Tajik (Sirilik) | tg |
Tamil | ta |
Tatar (Sirilik) | tt-cyrl |
Tatar (Latin) | tt |
Teso | teo |
Tetun | tet |
Thailand | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongan | to |
Tsonga | ts |
Tswana | tn |
Turki | tr |
Bahasa Turkmenistan (Latin) | tk |
Bahasa Tuvan | tyv |
Udmurt | udm |
Uighur (Sirilik) | ug-cyrl |
Ukraina | uk |
Sorbia Hulu | hsb |
Urdu | ur |
Uighur (Arab) | ug |
Uzbek (Arab) | uz-arab |
Uzbek (Sirilik) | uz-cyrl |
Uzbek (Latin) | uz |
Vietnam | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Wales | cy |
Frisia Barat | fy |
Wolof | wo |
Xhosa | xh |
Yucatec Maya | yua |
Zapotec | zap |
Zarma | dje |
Zhuang | za |
Zulu | zu |
Tabel berikut mencantumkan dukungan bahasa model baca untuk mengekstrak dan menganalisis teks cetak .
Bahasa | Kode (opsional) |
---|---|
Afrikaans | af |
Angika | anp |
Arab | ar |
Asturia | ast |
Awadhi | awa |
Azerbaijani | az |
Bahasa Belarusia (Sirilik) |
be , be-cyrl |
Bahasa Belarusia (Latin) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Bulgaria | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Breton | br |
Braj | bra |
Bodo | brx |
Bosnia | bs |
Buriat | bua |
Katalan | ca |
Cebú | ceb |
Chamorro | ch |
Bahasa Montenegro (Latin) |
cnr , cnr-latn |
Bahasa Montenegro (Sirilik) | cnr-cyrl |
Korsika | co |
Tatar Krimea | crh |
Cheska | cs |
Kasubia | csb |
Wales | cy |
Dansk | da |
Jerman | de |
Dhimal | dhi |
Dogri | doi |
Sorbia Hulu | dsb |
Inggris | en |
Spanyol | es |
Esti | et |
Basque | eu |
Farsi | fa |
Suomi | fi |
Filipino | fil |
Bahasa | Kode (opsional) |
---|---|
Fiji | fj |
Bahasa Faroe | fo |
Prancis | fr |
Friuli | fur |
Frisia Barat | fy |
Irlandia | ga |
Gagauz | gag |
Gaelik Skotlandia | gd |
Kiribati | gil |
Galisia | gl |
Gondi | gon |
Manx | gv |
Gurung | gvr |
Bahasa Hawaii | haw |
Hindi | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Kroasia | hr |
Sorbia Hulu | hsb |
Haiti | ht |
Hungaria | hu |
Interlingua | ia |
Indonesia | id |
Islandia | is |
Italia | it |
Inuktitut | iu |
Jepang | |
Jaunsari | jns |
Jawa | jv |
Bahasa Kara-Kalpak (Latin) |
kaa , kaa-latn |
Bahasa Kara-Kalpak (Sirilik) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
Bahasa Kazakhstan (Latin) |
kk , kk-latn |
Bahasa Kazakhstan (Sirilik) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Bahasa | Kode (opsional) |
---|---|
Korea | |
Bahasa Kosraea | kos |
Bahasa Koryak | kpy |
Bahasa Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Kurdi (Latin) |
ku , ku-latn |
Kurdi (Arab) | ku-arab |
Kumyk | kum |
Kernowek | kw |
Kirgiz | ky |
Latin | la |
Luksemburg | lb |
Bahasa Lakota | lkt |
Lituavi | lt |
Maori | mi |
Mongolia | mn |
Marathi | mr |
Melayu | ms |
Malta | mt |
Hmong Daw |
mww |
Erzya | myv |
Napolitan | nap |
Nepal | ne |
Bahasa Niuean | niu |
Belanda | nl |
Norwegia | no |
Nogai | nog |
Oksitan | oc |
Bahasa Ossetia | os |
Panjabi | pa |
Polski | pl |
Dari | prs |
Dorong ke | ps |
Portugis | pt |
K'iche' | quc |
Camling | rab |
Romansh | rm |
Rumania | ro |
Rusia | ru |
Sanskrit | sa |
Santali | sat |
Bahasa | Kode (opsional) |
---|---|
Sadri | sck |
Skotlandia | sco |
Slovak | sk |
Sloven | sl |
Samoa | sm |
Sami Selatan | sma |
Sami Utara | sme |
Bahasa Lule Sami | smj |
Bahasa Inari Sami | smn |
Bahasa Skolt Sami | sms |
Somali | so |
Albania | sq |
Serbia (Latin) |
sr , sr-latn |
Sirmauri | srx |
Swedia | sv |
Swahili | sw |
Tetun | tet |
Tajik | tg |
Thangmi | thf |
Turkmen | tk |
Tonga | to |
Turki | tr |
Tatar | tt |
Bahasa Tuvinia | tyv |
Uighur | ug |
Urdu | ur |
Uzbek (Latin) |
uz , uz-latn |
Uzbek (Sirilik) | uz-cyrl |
Uzbek (Arab) | uz-arab |
Volapük | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zhuang | za |
Mandarin (Han (Varian yang disederhanakan)) |
zh , zh-hans |
Mandarin (Han (Varian tradisional)) | zh-hant |
Zulu | zu |
Tata letak
ID Model: tata letak bawaan
Tabel berikut mencantumkan bahasa yang didukung untuk teks cetak:
Bahasa | Kode (opsional) |
---|---|
Abaza | abq |
Abkhazia | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Jauh | aa |
Afrika | af |
Akan | ak |
Albania | sq |
Algonquin | alq |
Angika (Dewanagari) | anp |
Arab | ar |
Asturia | ast |
(Tanzania) | asa |
Avaric | av |
Awadhi-Hindi (Dewanagari) | awa |
Aymara | ay |
Bahasa Azerbaijan (Latin) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Bashkir | ba |
Basque | eu |
Bahasa Belarusia (Sirilik) |
be , be-cyrl |
Bahasa Belarusia (Latin) |
be , be-latn |
Bemba (Zambia) | bem |
Bena (Tanzania) | bez |
Bhojpuri-Hindi (Dewanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Dewanagari) | brx |
Bosnia (Latin) | bs |
Brajbha | bra |
Breton | br |
Bulgaria | bg |
Bundeli | bns |
Bahasa Buryat (Sirilik) | bua |
Katalan | ca |
Cebú | ceb |
Chamling | rab |
Chamorro | ch |
Chechnya | ce |
Chhattisgarhi (Dewanagari) | hne |
Chiga | cgg |
Mandarin Sederhana | zh-Hans |
Mandarin Tradisional | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Kernowek | kw |
Korsika | co |
Cree | cr |
Creek | mus |
Tatar Krimea (Latin) | crh |
Kroasia | hr |
Gagak | cro |
Cheska | cs |
Dansk | da |
Dargwa | dar |
Dari | prs |
Dhimal (Dewanagari) | dhi |
Dogri (Dewanagari) | doi |
Duala | dua |
Dungan | dng |
Belanda | nl |
Efik | efi |
Inggris | en |
Bahasa Erzya (Sirilik) | myv |
Esti | et |
Bahasa Faroe | fo |
Fiji | fj |
Filipino | fil |
Suomi | fi |
Bahasa | Kode (opsional) |
---|---|
Fon |
fon |
Prancis | fr |
Friuli | fur |
Ga |
gaa |
Bahasa Gagauz (Latin) | gag |
Galisia | gl |
Ganda | lg |
Gayo | gay |
Jerman | de |
Kiribati | gil |
Gondi (Dewanagari) | gon |
Yunani | el |
Greenland | kl |
Guarani | gn |
Gurung (Dewanagari) | gvr |
Gusii | guz |
Kreol Haiti | ht |
Halbi (Dewanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Bahasa Hawaii | haw |
Ibrani | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (Latin) | mww |
Ho(Dewanagari) | hoc |
Hungaria | hu |
Iban | iba |
Islandia | is |
Igbo | ig |
Iloko | ilo |
Bahasa Inari Sami | smn |
Indonesia | id |
Ingush | inh |
Interlingua | ia |
Inuktitut (Latin) | iu |
Irlandia | ga |
Italia | it |
Jepang | ja |
Jaunsari (Dewanagari) | Jns |
Jawa | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
JIngpho (Latin) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Dewanagari) | xnr |
Kanuri | kr |
Bahasa Karachay-Balkar | krc |
Bahasa Kara-Kalpak (Sirilik) | kaa-cyrl |
Bahasa Kara-Kalpak (Latin) | kaa |
Kasubia | csb |
Bahasa Kazakhstan (Sirilik) | kk-cyrl |
Bahasa Kazakhstan (Latin) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
K'iche' | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Korea | ko |
Korku | kfq |
Bahasa Koryak | kpy |
Bahasa Kosraea | kos |
Kpelle | kpe |
Kuanyama | kj |
Bahasa Kumyk (Sirilik) | kum |
Kurdi (Arab) | ku-arab |
Kurdi (Latin) | ku-latn |
Bahasa | Kode (opsional) |
---|---|
Kurukh (Dewanagari) | kru |
Kirgizstan (Sirilik) | ky |
Lak |
lbe |
Bahasa Lakota | lkt |
Latin | la |
Latvi | lv |
Bahasa Lezghian | lex |
Bahasa Lingala | ln |
Lituavi | lt |
Sorbia Hulu | dsb |
Lozi | loz |
Bahasa Lule Sami | smj |
Luo (Kenya dan Tanzania) | luo |
Luksemburg | lb |
Luyia | luy |
Makedonia | mk |
Machame | jmc |
Orang Madura | mad |
Mahasu Pahari (Dewanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malagasi | mg |
Melayu (Latin) | ms |
Malta | mt |
Malto (Dewanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | mi |
Mapudungun | arn |
Marathi | mr |
Mari (Rusia) | chm |
Masai | mas |
Mende (Sierra Leone) | men |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Mohawk | moh |
Bahasa Mongolia (Sirilik) | mn |
Mongondow | mog |
Bahasa Montenegro (Sirilik) | cnr-cyrl |
Bahasa Montenegro (Latin) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitan | nap |
Nepal | ne |
Ngomba | jgo |
Bahasa Niuean | niu |
Bahasa Nogay | nog |
Ndebele Utara | nd |
Sami Utara (Latin) | sme |
Norwegia | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Oksitan | oc |
Ojibwa | oj |
Oromo | om |
Bahasa Ossetic | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Farsi | fa |
Polski | pl |
Portugis | pt |
Punjabi (Arab) | pa |
Quechua | qu |
Bahasa Ripuaria | ksh |
Rumania | ro |
Romansh | rm |
Rundi | rn |
Rusia | ru |
Bahasa | Kode (opsional) |
---|---|
Rwa |
rwk |
Sadri (Dewanagari) | sck |
Sakha | sah |
Samburu | saq |
Bahasa Samoa (Latin) | sm |
Sango | sg |
Sangu (Gabon) | snq |
Sansekerta (Devanagari) | sa |
Santali(Dewanagari) | sat |
Skotlandia | sco |
Gaelik Skotlandia | gd |
Sena | seh |
Serbia (Sirilik) | sr-cyrl |
Serbia (Latin) |
sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Dewanagari) | srx |
Bahasa Skolt Sami | sms |
Slovak | sk |
Sloven | sl |
Soga | xog |
Somalia (Arab) | so |
Somali (Latin) | so-latn |
Songhai | son |
Ndebele Selatan | nr |
Altai Selatan | alt |
Sami Selatan | sma |
Sotho Selatan | st |
Spanyol | es |
Sunda | su |
Swahili (Latin) | sw |
Swati | ss |
Swedia | sv |
Tabassaran | tab |
Tachelhit | shi |
Tahitian | ty |
Taita | dav |
Tajik (Sirilik) | tg |
Tamil | ta |
Tatar (Sirilik) | tt-cyrl |
Tatar (Latin) | tt |
Teso | teo |
Tetun | tet |
Thailand | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongan | to |
Tsonga | ts |
Tswana | tn |
Turki | tr |
Bahasa Turkmenistan (Latin) | tk |
Bahasa Tuvan | tyv |
Udmurt | udm |
Uighur (Sirilik) | ug-cyrl |
Ukraina | uk |
Sorbia Hulu | hsb |
Urdu | ur |
Uighur (Arab) | ug |
Uzbek (Arab) | uz-arab |
Uzbek (Sirilik) | uz-cyrl |
Uzbek (Latin) | uz |
Vietnam | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Wales | cy |
Frisia Barat | fy |
Wolof | wo |
Xhosa | xh |
Yucatec Maya | yua |
Zapotec | zap |
Zarma | dje |
Zhuang | za |
Zulu | zu |
Tabel berikut mencantumkan dukungan bahasa model tata letak untuk mengekstrak dan menganalisis teks yang dicetak .
Bahasa | Kode (opsional) |
---|---|
Afrikaans | af |
Angika | anp |
Arab | ar |
Asturia | ast |
Awadhi | awa |
Azerbaijani | az |
Bahasa Belarusia (Sirilik) |
be , be-cyrl |
Bahasa Belarusia (Latin) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Bulgaria | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Breton | br |
Braj | bra |
Bodo | brx |
Bosnia | bs |
Buriat | bua |
Katalan | ca |
Cebú | ceb |
Chamorro | ch |
Bahasa Montenegro (Latin) |
cnr , cnr-latn |
Bahasa Montenegro (Sirilik) | cnr-cyrl |
Korsika | co |
Tatar Krimea | crh |
Cheska | cs |
Kasubia | csb |
Wales | cy |
Dansk | da |
Jerman | de |
Dhimal | dhi |
Dogri | doi |
Sorbia Hulu | dsb |
Inggris | en |
Spanyol | es |
Esti | et |
Basque | eu |
Farsi | fa |
Suomi | fi |
Filipino | fil |
Bahasa | Kode (opsional) |
---|---|
Fiji | fj |
Bahasa Faroe | fo |
Prancis | fr |
Friuli | fur |
Frisia Barat | fy |
Irlandia | ga |
Gagauz | gag |
Gaelik Skotlandia | gd |
Kiribati | gil |
Galisia | gl |
Gondi | gon |
Manx | gv |
Gurung | gvr |
Bahasa Hawaii | haw |
Hindi | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Kroasia | hr |
Sorbia Hulu | hsb |
Haiti | ht |
Hungaria | hu |
Interlingua | ia |
Indonesia | id |
Islandia | is |
Italia | it |
Inuktitut | iu |
Jepang | |
Jaunsari | jns |
Jawa | jv |
Bahasa Kara-Kalpak (Latin) |
kaa , kaa-latn |
Bahasa Kara-Kalpak (Sirilik) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
Bahasa Kazakhstan (Latin) |
kk , kk-latn |
Bahasa Kazakhstan (Sirilik) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Bahasa | Kode (opsional) |
---|---|
Korea | |
Bahasa Kosraea | kos |
Bahasa Koryak | kpy |
Bahasa Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Kurdi (Latin) |
ku , ku-latn |
Kurdi (Arab) | ku-arab |
Kumyk | kum |
Kernowek | kw |
Kirgiz | ky |
Latin | la |
Luksemburg | lb |
Bahasa Lakota | lkt |
Lituavi | lt |
Maori | mi |
Mongolia | mn |
Marathi | mr |
Melayu | ms |
Malta | mt |
Hmong Daw |
mww |
Erzya | myv |
Napolitan | nap |
Nepal | ne |
Bahasa Niuean | niu |
Belanda | nl |
Norwegia | no |
Nogai | nog |
Oksitan | oc |
Bahasa Ossetia | os |
Panjabi | pa |
Polski | pl |
Dari | prs |
Dorong ke | ps |
Portugis | pt |
K'iche' | quc |
Camling | rab |
Romansh | rm |
Rumania | ro |
Rusia | ru |
Sanskrit | sa |
Santali | sat |
Bahasa | Kode (opsional) |
---|---|
Sadri | sck |
Skotlandia | sco |
Slovak | sk |
Sloven | sl |
Samoa | sm |
Sami Selatan | sma |
Sami Utara | sme |
Bahasa Lule Sami | smj |
Bahasa Inari Sami | smn |
Bahasa Skolt Sami | sms |
Somali | so |
Albania | sq |
Serbia (Latin) |
sr , sr-latn |
Sirmauri | srx |
Swedia | sv |
Swahili | sw |
Tetun | tet |
Tajik | tg |
Thangmi | thf |
Turkmen | tk |
Tonga | to |
Turki | tr |
Tatar | tt |
Bahasa Tuvinia | tyv |
Uighur | ug |
Urdu | ur |
Uzbek (Latin) |
uz , uz-latn |
Uzbek (Sirilik) | uz-cyrl |
Uzbek (Arab) | uz-arab |
Volapük | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zhuang | za |
Mandarin (Han (Varian yang disederhanakan)) |
zh , zh-hans |
Mandarin (Han (Varian tradisional)) | zh-hant |
Zulu | zu |
Bahasa | Kode bahasa |
---|---|
Afrika | af |
Albania | sq |
Asturia | ast |
Basque | eu |
Bislama | bi |
Breton | br |
Katalan | ca |
Cebú | ceb |
Chamorro | ch |
Tionghoa (Aksara Sederhana) | zh-Hans |
Tionghoa (Aksara Tradisional) | zh-Hant |
Kernowek | kw |
Korsika | co |
Tatar Krimea (Latin) | crh |
Cheska | cs |
Dansk | da |
Belanda | nl |
Bahasa Inggris (tulisan tangan dan tercetak) | en |
Esti | et |
Fiji | fj |
Filipino | fil |
Suomi | fi |
Prancis | fr |
Friuli | fur |
Galisia | gl |
Jerman | de |
Kiribati | gil |
Greenland | kl |
Kreol Haiti | ht |
Hani | hni |
Hmong Daw (Latin) | mww |
Hungaria | hu |
Indonesia | id |
Interlingua | ia |
Inuktitut (Latin) | iu |
Irlandia | ga |
Bahasa | Kode bahasa |
---|---|
Italia | it |
Jepang | ja |
Jawa | jv |
K'iche' | quc |
Kabuverdianu | kea |
JIngpho (Latin) | kac |
Kara-Kalpak | kaa |
Kasubia | csb |
Khasi | kha |
Korea | ko |
Kurdi (Latin) | kur |
Luksemburg | lb |
Melayu (Latin) | ms |
Manx | gv |
Napolitan | nap |
Norwegia | no |
Oksitan | oc |
Polski | pl |
Portugis | pt |
Romansh | rm |
Skotlandia | sco |
Gaelik Skotlandia | gd |
Sloven | slv |
Spanyol | es |
Swahili (Latin) | sw |
Swedia | sv |
Tatar (Latin) | tat |
Tetun | tet |
Turki | tr |
Sorbia Hulu | hsb |
Uzbek (Latin) | uz |
Volapük | vo |
Walser | wae |
Frisia Barat | fy |
Yucatec Maya | yua |
Zhuang | za |
Zulu | zu |
Dokumen umum
Penting
Dengan Kecerdasan Dokumen v4.0:2024-11-30 (GA), model dokumen umum (dokumen bawaan) ditambahkan ke tata letak (tata letak bawaan). Untuk mengekstrak pasangan kunci-nilai, tanda pilihan, teks, tabel, dan struktur dari dokumen, gunakan model berikut:
Pasangan nilai kunci | version | ID Model |
---|---|---|
Model tata letak dengan string features=keyValuePairs kueri ditentukan. |
• v4:2024-11-30 (GA) • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Model dokumen umum | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
ID Model: dokumen bawaan
Tabel berikut ini mencantumkan dukungan bahasa model dokumen umum.
Pola ID |
Bahasa—Kode lokal | Default |
---|---|---|
dokumen bawaan | Inggris (Amerika Serikat)—en-US |
Inggris (Amerika Serikat)—en-US |