Model Kecerdasan Dokumen Azure AI menyediakan dukungan pemrosesan dokumen multibahasa. Kemampuan dukungan bahasa kami memungkinkan pengguna Anda untuk berkomunikasi dengan aplikasi Anda dengan cara alami dan memberdayakan pencapaian global. Model analisis dokumen memungkinkan ekstraksi teks dari formulir dan dokumen dan mengembalikan konten siap bisnis terstruktur yang siap untuk tindakan, penggunaan, atau kemajuan organisasi Anda. Tabel berikut mencantumkan bahasa dan dukungan lokal yang tersedia berdasarkan model dan fitur:
Baca: Model baca memungkinkan ekstraksi dan analisis teks cetak dan tulisan tangan. Model ini adalah mesin OCR yang mendasari untuk model bawaan Inteligensi Dokumen lainnya seperti tata letak, dokumen umum, faktur, tanda terima, dokumen identitas (ID), kartu asuransi kesehatan, dokumen pajak, dan model kustom. Untuk informasi selengkapnya, lihatGambaran umum model baca
Tata Letak: Model tata letak memungkinkan ekstraksi dan analisis teks, tabel, struktur dokumen, dan tanda pilihan (seperti tombol radio dan kotak centang) dari formulir dan dokumen.
Dokumen umum: Model dokumen umum memungkinkan ekstraksi dan analisis teks, struktur dokumen, dan pasangan kunci-nilai. Untuk informasi selengkapnya, lihatGambaran umum model dokumen umum
Catatan
Kode bahasa opsional
Model universal berbasis pembelajaran mendalam Kecerdasan Dokumen mengekstrak semua teks multibahasa dalam dokumen Anda, termasuk baris teks dengan bahasa campuran, dan tidak memerlukan penentuan kode bahasa.
Jangan berikan kode bahasa sebagai parameter kecuali Anda yakin tentang bahasa dan ingin memaksa layanan untuk hanya menerapkan model yang relevan. Jika tidak, layanan dapat mengembalikan teks yang tidak lengkap dan salah.
Selain itu, Tidak perlu menentukan lokal. Ini adalah parameter opsional. Teknologi pembelajaran mendalam Kecerdasan Dokumen akan mendeteksi bahasa teks secara otomatis dalam gambar Anda.
Tabel berikut mencantumkan dukungan bahasa model baca untuk mengekstrak dan menganalisis teks cetak .
Bahasa
Kode (opsional)
Abaza
abq
Abkhazia
ab
Achinese
ace
Acoli
ach
Adangme
ada
Adyghe
ady
Jauh
aa
Afrika
af
Akan
ak
Albania
sq
Algonquin
alq
Angika (Dewanagari)
anp
Arab
ar
Asturia
ast
(Tanzania)
asa
Avaric
av
Awadhi-Hindi (Dewanagari)
awa
Aymara
ay
Bahasa Azerbaijan (Latin)
az
Bafia
ksf
Bagheli
bfy
Bambara
bm
Bashkir
ba
Basque
eu
Bahasa Belarusia (Sirilik)
be, be-cyrl
Bahasa Belarusia (Latin)
be, be-latn
Bemba (Zambia)
bem
Bena (Tanzania)
bez
Bhojpuri-Hindi (Dewanagari)
bho
Bikol
bik
Bini
bin
Bislama
bi
Bodo (Dewanagari)
brx
Bosnia (Latin)
bs
Brajbha
bra
Breton
br
Bulgaria
bg
Bundeli
bns
Bahasa Buryat (Sirilik)
bua
Katalan
ca
Cebú
ceb
Chamling
rab
Chamorro
ch
Chechnya
ce
Chhattisgarhi (Dewanagari)
hne
Chiga
cgg
Mandarin Sederhana
zh-Hans
Mandarin Tradisional
zh-Hant
Choctaw
cho
Chukot
ckt
Chuvash
cv
Kernowek
kw
Korsika
co
Cree
cr
Creek
mus
Tatar Krimea (Latin)
crh
Kroasia
hr
Gagak
cro
Cheska
cs
Dansk
da
Dargwa
dar
Dari
prs
Dhimal (Dewanagari)
dhi
Dogri (Dewanagari)
doi
Duala
dua
Dungan
dng
Belanda
nl
Efik
efi
Inggris
en
Bahasa Erzya (Sirilik)
myv
Esti
et
Bahasa Faroe
fo
Fiji
fj
Filipino
fil
Suomi
fi
Bahasa
Kode (opsional)
Fon
fon
Prancis
fr
Friuli
fur
Ga
gaa
Bahasa Gagauz (Latin)
gag
Galisia
gl
Ganda
lg
Gayo
gay
Jerman
de
Kiribati
gil
Gondi (Dewanagari)
gon
Yunani
el
Greenland
kl
Guarani
gn
Gurung (Dewanagari)
gvr
Gusii
guz
Kreol Haiti
ht
Halbi (Dewanagari)
hlb
Hani
hni
Haryanvi
bgc
Bahasa Hawaii
haw
Ibrani
he
Herero
hz
Hiligaynon
hil
Hindi
hi
Hmong Daw (Latin)
mww
Ho(Dewanagari)
hoc
Hungaria
hu
Iban
iba
Islandia
is
Igbo
ig
Iloko
ilo
Bahasa Inari Sami
smn
Indonesia
id
Ingush
inh
Interlingua
ia
Inuktitut (Latin)
iu
Irlandia
ga
Italia
it
Jepang
ja
Jaunsari (Dewanagari)
Jns
Jawa
jv
Jola-Fonyi
dyo
Kabardian
kbd
Kabuverdianu
kea
JIngpho (Latin)
kac
Kalenjin
kln
Kalmyk
xal
Kangri (Dewanagari)
xnr
Kanuri
kr
Bahasa Karachay-Balkar
krc
Bahasa Kara-Kalpak (Sirilik)
kaa-cyrl
Bahasa Kara-Kalpak (Latin)
kaa
Kasubia
csb
Bahasa Kazakhstan (Sirilik)
kk-cyrl
Bahasa Kazakhstan (Latin)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
kha
K'iche'
quc
Kikuyu
ki
Kildin Sami
sjd
Kinyarwanda
rw
Komi
kv
Kongo
kg
Korea
ko
Korku
kfq
Bahasa Koryak
kpy
Bahasa Kosraea
kos
Kpelle
kpe
Kuanyama
kj
Bahasa Kumyk (Sirilik)
kum
Kurdi (Arab)
ku-arab
Kurdi (Latin)
ku-latn
Kurukh (Dewanagari)
kru
Kirgizstan (Sirilik)
ky
Lak
lbe
Bahasa Lakota
lkt
Bahasa
Kode (opsional)
Latin
la
Latvi
lv
Bahasa Lezghian
lex
Bahasa Lingala
ln
Lituavi
lt
Sorbia Hulu
dsb
Lozi
loz
Bahasa Lule Sami
smj
Luo (Kenya dan Tanzania)
luo
Luksemburg
lb
Luyia
luy
Makedonia
mk
Machame
jmc
Orang Madura
mad
Mahasu Pahari (Dewanagari)
bfz
Makhuwa-Meetto
mgh
Makonde
kde
Malagasi
mg
Melayu (Latin)
ms
Malta
mt
Malto (Dewanagari)
kmj
Mandinka
mnk
Manx
gv
Maori
mi
Mapudungun
arn
Marathi
mr
Mari (Rusia)
chm
Masai
mas
Mende (Sierra Leone)
men
Meru
mer
Meta'
mgo
Minangkabau
min
Mohawk
moh
Bahasa Mongolia (Sirilik)
mn
Mongondow
mog
Bahasa Montenegro (Sirilik)
cnr-cyrl
Bahasa Montenegro (Latin)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
nah
Navajo
nv
Ndonga
ng
Napolitan
nap
Nepal
ne
Ngomba
jgo
Bahasa Niuean
niu
Bahasa Nogay
nog
Ndebele Utara
nd
Sami Utara (Latin)
sme
Norwegia
no
Nyanja
ny
Nyankole
nyn
Nzima
nzi
Oksitan
oc
Ojibwa
oj
Oromo
om
Bahasa Ossetic
os
Pampanga
pam
Pangasinan
pag
Papiamento
pap
Pashto
ps
Pedi
nso
Farsi
fa
Polski
pl
Portugis
pt
Punjabi (Arab)
pa
Quechua
qu
Bahasa Ripuaria
ksh
Rumania
ro
Romansh
rm
Rundi
rn
Rusia
ru
Rwa
rwk
Sadri (Dewanagari)
sck
Sakha
sah
Samburu
saq
Bahasa Samoa (Latin)
sm
Sango
sg
Bahasa
Kode (opsional)
Sangu (Gabon)
snq
Sansekerta (Devanagari)
sa
Santali(Dewanagari)
sat
Skotlandia
sco
Gaelik Skotlandia
gd
Sena
seh
Serbia (Sirilik)
sr-cyrl
Serbia (Latin)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (Dewanagari)
srx
Bahasa Skolt Sami
sms
Slovak
sk
Sloven
sl
Soga
xog
Somalia (Arab)
so
Somali (Latin)
so-latn
Songhai
son
Ndebele Selatan
nr
Altai Selatan
alt
Sami Selatan
sma
Sotho Selatan
st
Spanyol
es
Sunda
su
Swahili (Latin)
sw
Swati
ss
Swedia
sv
Tabassaran
tab
Tachelhit
shi
Tahitian
ty
Taita
dav
Tajik (Sirilik)
tg
Tamil
ta
Tatar (Sirilik)
tt-cyrl
Tatar (Latin)
tt
Teso
teo
Tetun
tet
Thailand
th
Thangmi
thf
Tok Pisin
tpi
Tongan
to
Tsonga
ts
Tswana
tn
Turki
tr
Bahasa Turkmenistan (Latin)
tk
Bahasa Tuvan
tyv
Udmurt
udm
Uighur (Sirilik)
ug-cyrl
Ukraina
uk
Sorbia Hulu
hsb
Urdu
ur
Uighur (Arab)
ug
Uzbek (Arab)
uz-arab
Uzbek (Sirilik)
uz-cyrl
Uzbek (Latin)
uz
Vietnam
vi
Volapük
vo
Vunjo
vun
Walser
wae
Wales
cy
Frisia Barat
fy
Wolof
wo
Xhosa
xh
Yucatec Maya
yua
Zapotec
zap
Zarma
dje
Zhuang
za
Zulu
zu
Tabel berikut mencantumkan dukungan bahasa model baca untuk mengekstrak dan menganalisis teks cetak .
Bahasa
Kode (opsional)
Afrikaans
af
Angika
anp
Arab
ar
Asturia
ast
Awadhi
awa
Azerbaijani
az
Bahasa Belarusia (Sirilik)
be, be-cyrl
Bahasa Belarusia (Latin)
be-latn
Bagheli
bfy
Mahasu Pahari
bfz
Bulgaria
bg
Haryanvi
bgc
Bhojpuri
bho
Bislama
bi
Bundeli
bns
Breton
br
Braj
bra
Bodo
brx
Bosnia
bs
Buriat
bua
Katalan
ca
Cebú
ceb
Chamorro
ch
Bahasa Montenegro (Latin)
cnr, cnr-latn
Bahasa Montenegro (Sirilik)
cnr-cyrl
Korsika
co
Tatar Krimea
crh
Cheska
cs
Kasubia
csb
Wales
cy
Dansk
da
Jerman
de
Dhimal
dhi
Dogri
doi
Sorbia Hulu
dsb
Inggris
en
Spanyol
es
Esti
et
Basque
eu
Farsi
fa
Suomi
fi
Filipino
fil
Bahasa
Kode (opsional)
Fiji
fj
Bahasa Faroe
fo
Prancis
fr
Friuli
fur
Frisia Barat
fy
Irlandia
ga
Gagauz
gag
Gaelik Skotlandia
gd
Kiribati
gil
Galisia
gl
Gondi
gon
Manx
gv
Gurung
gvr
Bahasa Hawaii
haw
Hindi
hi
Halbi
hlb
Chhattisgarhi
hne
Hani
hni
Ho
hoc
Kroasia
hr
Sorbia Hulu
hsb
Haiti
ht
Hungaria
hu
Interlingua
ia
Indonesia
id
Islandia
is
Italia
it
Inuktitut
iu
Jepang
Jaunsari
jns
Jawa
jv
Bahasa Kara-Kalpak (Latin)
kaa, kaa-latn
Bahasa Kara-Kalpak (Sirilik)
kaa-cyrl
Kachin
kac
Kabuverdianu
kea
Korku
kfq
Khasi
kha
Bahasa Kazakhstan (Latin)
kk, kk-latn
Bahasa Kazakhstan (Sirilik)
kk-cyrl
Kalaallisut
kl
Khaling
klr
Malto
kmj
Bahasa
Kode (opsional)
Korea
Bahasa Kosraea
kos
Bahasa Koryak
kpy
Bahasa Karachay-Balkar
krc
Kurukh
kru
Kölsch
ksh
Kurdi (Latin)
ku, ku-latn
Kurdi (Arab)
ku-arab
Kumyk
kum
Kernowek
kw
Kirgiz
ky
Latin
la
Luksemburg
lb
Bahasa Lakota
lkt
Lituavi
lt
Maori
mi
Mongolia
mn
Marathi
mr
Melayu
ms
Malta
mt
Hmong Daw
mww
Erzya
myv
Napolitan
nap
Nepal
ne
Bahasa Niuean
niu
Belanda
nl
Norwegia
no
Nogai
nog
Oksitan
oc
Bahasa Ossetia
os
Panjabi
pa
Polski
pl
Dari
prs
Dorong ke
ps
Portugis
pt
K'iche'
quc
Camling
rab
Romansh
rm
Rumania
ro
Rusia
ru
Sanskrit
sa
Santali
sat
Bahasa
Kode (opsional)
Sadri
sck
Skotlandia
sco
Slovak
sk
Sloven
sl
Samoa
sm
Sami Selatan
sma
Sami Utara
sme
Bahasa Lule Sami
smj
Bahasa Inari Sami
smn
Bahasa Skolt Sami
sms
Somali
so
Albania
sq
Serbia (Latin)
sr, sr-latn
Sirmauri
srx
Swedia
sv
Swahili
sw
Tetun
tet
Tajik
tg
Thangmi
thf
Turkmen
tk
Tonga
to
Turki
tr
Tatar
tt
Bahasa Tuvinia
tyv
Uighur
ug
Urdu
ur
Uzbek (Latin)
uz, uz-latn
Uzbek (Sirilik)
uz-cyrl
Uzbek (Arab)
uz-arab
Volapük
vo
Walser
wae
Kangri
xnr
Yucateco
yua
Zhuang
za
Mandarin (Han (Varian yang disederhanakan))
zh, zh-hans
Mandarin (Han (Varian tradisional))
zh-hant
Zulu
zu
Tabel berikut mencantumkan dukungan bahasa model baca untuk mengekstrak dan menganalisis teks tulisan tangan.
Bahasa
Kode bahasa (opsional)
Bahasa
Kode bahasa (opsional)
Inggris
en
Jepang
ja
Mandarin Sederhana
zh-Hans
Korea
ko
Prancis
fr
Portugis
pt
Jerman
de
Spanyol
es
Italia
it
Rusia (pratinjau)
ru
Thai (pratinjau)
th
Arab (pratinjau)
ar
Tabel berikut mencantumkan dukungan bahasa model baca untuk mengekstrak dan menganalisis teks tulisan tangan.
Bahasa
Kode bahasa (opsional)
Bahasa
Kode bahasa (opsional)
Inggris
en
Jepang
ja
Mandarin Sederhana
zh-Hans
Korea
ko
Prancis
fr
Portugis
pt
Jerman
de
Spanyol
es
Italia
it
Tabel berikut mencantumkan dukungan bahasa model baca untuk mengekstrak dan menganalisis teks tulisan tangan.
Bahasa
Kode bahasa (opsional)
Bahasa
Kode bahasa (opsional)
Inggris
en
Jepang
ja
Mandarin Sederhana
zh-Hans
Korea
ko
Prancis
fr
Portugis
pt
Jerman
de
Spanyol
es
Italia
it
API Model baca mendukung deteksi bahasa untuk bahasa berikut di dokumen Anda. Daftar ini dapat mencakup bahasa yang saat ini tidak didukung untuk ekstraksi teks.
Penting
Deteksi bahasa
Model baca Kecerdasan Dokumen dapat mendeteksi keberadaan bahasa dan mengembalikan kode bahasa untuk bahasa yang terdeteksi.
Bahasa yang terdeteksi vs bahasa yang diekstrak
Bagian ini mencantumkan bahasa yang dapat kita deteksi dari dokumen menggunakan model Baca, jika ada.
Harap dicatat bahwa daftar ini berbeda dari daftar bahasa yang kami dukung untuk mengekstrak teks, yang ditentukan dalam bagian di atas untuk setiap model.
Tabel berikut mencantumkan bahasa yang didukung untuk teks cetak:
Bahasa
Kode (opsional)
Abaza
abq
Abkhazia
ab
Achinese
ace
Acoli
ach
Adangme
ada
Adyghe
ady
Jauh
aa
Afrika
af
Akan
ak
Albania
sq
Algonquin
alq
Angika (Dewanagari)
anp
Arab
ar
Asturia
ast
(Tanzania)
asa
Avaric
av
Awadhi-Hindi (Dewanagari)
awa
Aymara
ay
Bahasa Azerbaijan (Latin)
az
Bafia
ksf
Bagheli
bfy
Bambara
bm
Bashkir
ba
Basque
eu
Bahasa Belarusia (Sirilik)
be, be-cyrl
Bahasa Belarusia (Latin)
be, be-latn
Bemba (Zambia)
bem
Bena (Tanzania)
bez
Bhojpuri-Hindi (Dewanagari)
bho
Bikol
bik
Bini
bin
Bislama
bi
Bodo (Dewanagari)
brx
Bosnia (Latin)
bs
Brajbha
bra
Breton
br
Bulgaria
bg
Bundeli
bns
Bahasa Buryat (Sirilik)
bua
Katalan
ca
Cebú
ceb
Chamling
rab
Chamorro
ch
Chechnya
ce
Chhattisgarhi (Dewanagari)
hne
Chiga
cgg
Mandarin Sederhana
zh-Hans
Mandarin Tradisional
zh-Hant
Choctaw
cho
Chukot
ckt
Chuvash
cv
Kernowek
kw
Korsika
co
Cree
cr
Creek
mus
Tatar Krimea (Latin)
crh
Kroasia
hr
Gagak
cro
Cheska
cs
Dansk
da
Dargwa
dar
Dari
prs
Dhimal (Dewanagari)
dhi
Dogri (Dewanagari)
doi
Duala
dua
Dungan
dng
Belanda
nl
Efik
efi
Inggris
en
Bahasa Erzya (Sirilik)
myv
Esti
et
Bahasa Faroe
fo
Fiji
fj
Filipino
fil
Suomi
fi
Bahasa
Kode (opsional)
Fon
fon
Prancis
fr
Friuli
fur
Ga
gaa
Bahasa Gagauz (Latin)
gag
Galisia
gl
Ganda
lg
Gayo
gay
Jerman
de
Kiribati
gil
Gondi (Dewanagari)
gon
Yunani
el
Greenland
kl
Guarani
gn
Gurung (Dewanagari)
gvr
Gusii
guz
Kreol Haiti
ht
Halbi (Dewanagari)
hlb
Hani
hni
Haryanvi
bgc
Bahasa Hawaii
haw
Ibrani
he
Herero
hz
Hiligaynon
hil
Hindi
hi
Hmong Daw (Latin)
mww
Ho(Dewanagari)
hoc
Hungaria
hu
Iban
iba
Islandia
is
Igbo
ig
Iloko
ilo
Bahasa Inari Sami
smn
Indonesia
id
Ingush
inh
Interlingua
ia
Inuktitut (Latin)
iu
Irlandia
ga
Italia
it
Jepang
ja
Jaunsari (Dewanagari)
Jns
Jawa
jv
Jola-Fonyi
dyo
Kabardian
kbd
Kabuverdianu
kea
JIngpho (Latin)
kac
Kalenjin
kln
Kalmyk
xal
Kangri (Dewanagari)
xnr
Kanuri
kr
Bahasa Karachay-Balkar
krc
Bahasa Kara-Kalpak (Sirilik)
kaa-cyrl
Bahasa Kara-Kalpak (Latin)
kaa
Kasubia
csb
Bahasa Kazakhstan (Sirilik)
kk-cyrl
Bahasa Kazakhstan (Latin)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
kha
K'iche'
quc
Kikuyu
ki
Kildin Sami
sjd
Kinyarwanda
rw
Komi
kv
Kongo
kg
Korea
ko
Korku
kfq
Bahasa Koryak
kpy
Bahasa Kosraea
kos
Kpelle
kpe
Kuanyama
kj
Bahasa Kumyk (Sirilik)
kum
Kurdi (Arab)
ku-arab
Kurdi (Latin)
ku-latn
Bahasa
Kode (opsional)
Kurukh (Dewanagari)
kru
Kirgizstan (Sirilik)
ky
Lak
lbe
Bahasa Lakota
lkt
Latin
la
Latvi
lv
Bahasa Lezghian
lex
Bahasa Lingala
ln
Lituavi
lt
Sorbia Hulu
dsb
Lozi
loz
Bahasa Lule Sami
smj
Luo (Kenya dan Tanzania)
luo
Luksemburg
lb
Luyia
luy
Makedonia
mk
Machame
jmc
Orang Madura
mad
Mahasu Pahari (Dewanagari)
bfz
Makhuwa-Meetto
mgh
Makonde
kde
Malagasi
mg
Melayu (Latin)
ms
Malta
mt
Malto (Dewanagari)
kmj
Mandinka
mnk
Manx
gv
Maori
mi
Mapudungun
arn
Marathi
mr
Mari (Rusia)
chm
Masai
mas
Mende (Sierra Leone)
men
Meru
mer
Meta'
mgo
Minangkabau
min
Mohawk
moh
Bahasa Mongolia (Sirilik)
mn
Mongondow
mog
Bahasa Montenegro (Sirilik)
cnr-cyrl
Bahasa Montenegro (Latin)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
nah
Navajo
nv
Ndonga
ng
Napolitan
nap
Nepal
ne
Ngomba
jgo
Bahasa Niuean
niu
Bahasa Nogay
nog
Ndebele Utara
nd
Sami Utara (Latin)
sme
Norwegia
no
Nyanja
ny
Nyankole
nyn
Nzima
nzi
Oksitan
oc
Ojibwa
oj
Oromo
om
Bahasa Ossetic
os
Pampanga
pam
Pangasinan
pag
Papiamento
pap
Pashto
ps
Pedi
nso
Farsi
fa
Polski
pl
Portugis
pt
Punjabi (Arab)
pa
Quechua
qu
Bahasa Ripuaria
ksh
Rumania
ro
Romansh
rm
Rundi
rn
Rusia
ru
Bahasa
Kode (opsional)
Rwa
rwk
Sadri (Dewanagari)
sck
Sakha
sah
Samburu
saq
Bahasa Samoa (Latin)
sm
Sango
sg
Sangu (Gabon)
snq
Sansekerta (Devanagari)
sa
Santali(Dewanagari)
sat
Skotlandia
sco
Gaelik Skotlandia
gd
Sena
seh
Serbia (Sirilik)
sr-cyrl
Serbia (Latin)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (Dewanagari)
srx
Bahasa Skolt Sami
sms
Slovak
sk
Sloven
sl
Soga
xog
Somalia (Arab)
so
Somali (Latin)
so-latn
Songhai
son
Ndebele Selatan
nr
Altai Selatan
alt
Sami Selatan
sma
Sotho Selatan
st
Spanyol
es
Sunda
su
Swahili (Latin)
sw
Swati
ss
Swedia
sv
Tabassaran
tab
Tachelhit
shi
Tahitian
ty
Taita
dav
Tajik (Sirilik)
tg
Tamil
ta
Tatar (Sirilik)
tt-cyrl
Tatar (Latin)
tt
Teso
teo
Tetun
tet
Thailand
th
Thangmi
thf
Tok Pisin
tpi
Tongan
to
Tsonga
ts
Tswana
tn
Turki
tr
Bahasa Turkmenistan (Latin)
tk
Bahasa Tuvan
tyv
Udmurt
udm
Uighur (Sirilik)
ug-cyrl
Ukraina
uk
Sorbia Hulu
hsb
Urdu
ur
Uighur (Arab)
ug
Uzbek (Arab)
uz-arab
Uzbek (Sirilik)
uz-cyrl
Uzbek (Latin)
uz
Vietnam
vi
Volapük
vo
Vunjo
vun
Walser
wae
Wales
cy
Frisia Barat
fy
Wolof
wo
Xhosa
xh
Yucatec Maya
yua
Zapotec
zap
Zarma
dje
Zhuang
za
Zulu
zu
Tabel berikut mencantumkan dukungan bahasa model tata letak untuk mengekstrak dan menganalisis teks yang dicetak .
Bahasa
Kode (opsional)
Afrikaans
af
Angika
anp
Arab
ar
Asturia
ast
Awadhi
awa
Azerbaijani
az
Bahasa Belarusia (Sirilik)
be, be-cyrl
Bahasa Belarusia (Latin)
be-latn
Bagheli
bfy
Mahasu Pahari
bfz
Bulgaria
bg
Haryanvi
bgc
Bhojpuri
bho
Bislama
bi
Bundeli
bns
Breton
br
Braj
bra
Bodo
brx
Bosnia
bs
Buriat
bua
Katalan
ca
Cebú
ceb
Chamorro
ch
Bahasa Montenegro (Latin)
cnr, cnr-latn
Bahasa Montenegro (Sirilik)
cnr-cyrl
Korsika
co
Tatar Krimea
crh
Cheska
cs
Kasubia
csb
Wales
cy
Dansk
da
Jerman
de
Dhimal
dhi
Dogri
doi
Sorbia Hulu
dsb
Inggris
en
Spanyol
es
Esti
et
Basque
eu
Farsi
fa
Suomi
fi
Filipino
fil
Bahasa
Kode (opsional)
Fiji
fj
Bahasa Faroe
fo
Prancis
fr
Friuli
fur
Frisia Barat
fy
Irlandia
ga
Gagauz
gag
Gaelik Skotlandia
gd
Kiribati
gil
Galisia
gl
Gondi
gon
Manx
gv
Gurung
gvr
Bahasa Hawaii
haw
Hindi
hi
Halbi
hlb
Chhattisgarhi
hne
Hani
hni
Ho
hoc
Kroasia
hr
Sorbia Hulu
hsb
Haiti
ht
Hungaria
hu
Interlingua
ia
Indonesia
id
Islandia
is
Italia
it
Inuktitut
iu
Jepang
Jaunsari
jns
Jawa
jv
Bahasa Kara-Kalpak (Latin)
kaa, kaa-latn
Bahasa Kara-Kalpak (Sirilik)
kaa-cyrl
Kachin
kac
Kabuverdianu
kea
Korku
kfq
Khasi
kha
Bahasa Kazakhstan (Latin)
kk, kk-latn
Bahasa Kazakhstan (Sirilik)
kk-cyrl
Kalaallisut
kl
Khaling
klr
Malto
kmj
Bahasa
Kode (opsional)
Korea
Bahasa Kosraea
kos
Bahasa Koryak
kpy
Bahasa Karachay-Balkar
krc
Kurukh
kru
Kölsch
ksh
Kurdi (Latin)
ku, ku-latn
Kurdi (Arab)
ku-arab
Kumyk
kum
Kernowek
kw
Kirgiz
ky
Latin
la
Luksemburg
lb
Bahasa Lakota
lkt
Lituavi
lt
Maori
mi
Mongolia
mn
Marathi
mr
Melayu
ms
Malta
mt
Hmong Daw
mww
Erzya
myv
Napolitan
nap
Nepal
ne
Bahasa Niuean
niu
Belanda
nl
Norwegia
no
Nogai
nog
Oksitan
oc
Bahasa Ossetia
os
Panjabi
pa
Polski
pl
Dari
prs
Dorong ke
ps
Portugis
pt
K'iche'
quc
Camling
rab
Romansh
rm
Rumania
ro
Rusia
ru
Sanskrit
sa
Santali
sat
Bahasa
Kode (opsional)
Sadri
sck
Skotlandia
sco
Slovak
sk
Sloven
sl
Samoa
sm
Sami Selatan
sma
Sami Utara
sme
Bahasa Lule Sami
smj
Bahasa Inari Sami
smn
Bahasa Skolt Sami
sms
Somali
so
Albania
sq
Serbia (Latin)
sr, sr-latn
Sirmauri
srx
Swedia
sv
Swahili
sw
Tetun
tet
Tajik
tg
Thangmi
thf
Turkmen
tk
Tonga
to
Turki
tr
Tatar
tt
Bahasa Tuvinia
tyv
Uighur
ug
Urdu
ur
Uzbek (Latin)
uz, uz-latn
Uzbek (Sirilik)
uz-cyrl
Uzbek (Arab)
uz-arab
Volapük
vo
Walser
wae
Kangri
xnr
Yucateco
yua
Zhuang
za
Mandarin (Han (Varian yang disederhanakan))
zh, zh-hans
Mandarin (Han (Varian tradisional))
zh-hant
Zulu
zu
Bahasa
Kode bahasa
Afrika
af
Albania
sq
Asturia
ast
Basque
eu
Bislama
bi
Breton
br
Katalan
ca
Cebú
ceb
Chamorro
ch
Tionghoa (Aksara Sederhana)
zh-Hans
Tionghoa (Aksara Tradisional)
zh-Hant
Kernowek
kw
Korsika
co
Tatar Krimea (Latin)
crh
Cheska
cs
Dansk
da
Belanda
nl
Bahasa Inggris (tulisan tangan dan tercetak)
en
Esti
et
Fiji
fj
Filipino
fil
Suomi
fi
Prancis
fr
Friuli
fur
Galisia
gl
Jerman
de
Kiribati
gil
Greenland
kl
Kreol Haiti
ht
Hani
hni
Hmong Daw (Latin)
mww
Hungaria
hu
Indonesia
id
Interlingua
ia
Inuktitut (Latin)
iu
Irlandia
ga
Bahasa
Kode bahasa
Italia
it
Jepang
ja
Jawa
jv
K'iche'
quc
Kabuverdianu
kea
JIngpho (Latin)
kac
Kara-Kalpak
kaa
Kasubia
csb
Khasi
kha
Korea
ko
Kurdi (Latin)
kur
Luksemburg
lb
Melayu (Latin)
ms
Manx
gv
Napolitan
nap
Norwegia
no
Oksitan
oc
Polski
pl
Portugis
pt
Romansh
rm
Skotlandia
sco
Gaelik Skotlandia
gd
Sloven
slv
Spanyol
es
Swahili (Latin)
sw
Swedia
sv
Tatar (Latin)
tat
Tetun
tet
Turki
tr
Sorbia Hulu
hsb
Uzbek (Latin)
uz
Volapük
vo
Walser
wae
Frisia Barat
fy
Yucatec Maya
yua
Zhuang
za
Zulu
zu
Tabel berikut mencantumkan dukungan bahasa model tata letak untuk mengekstrak dan menganalisis teks tulisan tangan.
Bahasa
Kode bahasa (opsional)
Bahasa
Kode bahasa (opsional)
Inggris
en
Jepang
ja
Mandarin Sederhana
zh-Hans
Korea
ko
Prancis
fr
Portugis
pt
Jerman
de
Spanyol
es
Italia
it
Rusia (pratinjau)
ru
Thai (pratinjau)
th
Arab (pratinjau)
ar
ID Model: tata letak bawaan
Tabel berikut mencantumkan dukungan bahasa model tata letak untuk mengekstrak dan menganalisis teks tulisan tangan.
Bahasa
Kode bahasa (opsional)
Bahasa
Kode bahasa (opsional)
Inggris
en
Jepang
ja
Mandarin Sederhana
zh-Hans
Korea
ko
Prancis
fr
Portugis
pt
Jerman
de
Spanyol
es
Italia
it
Catatan
Kecerdasan Dokumen v2.1 tidak mendukung ekstraksi teks tulisan tangan.
Tabel berikut mencantumkan dukungan bahasa model tata letak untuk mengekstrak dan menganalisis teks tulisan tangan.
Bahasa
Kode bahasa (opsional)
Bahasa
Kode bahasa (opsional)
Inggris
en
Jepang
ja
Mandarin Sederhana
zh-Hans
Korea
ko
Prancis
fr
Portugis
pt
Jerman
de
Spanyol
es
Italia
it
Rusia (pratinjau)
ru
Thai (pratinjau)
th
Arab (pratinjau)
ar
Dokumen umum
Penting
Dengan Kecerdasan Dokumen v4.0:2024-07-31-preview, pratinjau 2023-10-31 dan ke depannya, model dokumen umum (dokumen bawaan) ditambahkan ke tata letak (tata letak bawaan). Untuk mengekstrak pasangan kunci-nilai, tanda pilihan, teks, tabel, dan struktur dari dokumen, gunakan model berikut:
Pasangan nilai kunci
version
ID Model
Model tata letak dengan string features=keyValuePairs kueri ditentukan.