Azure AI 문서 인텔리전스 모델은 다국어 문서 처리 지원을 제공합니다. 언어 지원 기능을 사용하면 사용자가 자연스럽게 애플리케이션과 통신하고 글로벌 지원에 힘을 실어줄 수 있습니다. 문서 분석 모델을 사용하면 양식 및 문서에서 텍스트를 추출하고 조직의 작업, 사용 또는 진행 상황에 맞는 구조화된 비즈니스 지원 콘텐츠를 반환할 수 있습니다. 다음 표에는 모델 및 기능별 사용 가능한 언어 및 로캘 지원이 나와 있습니다.
읽기: 읽기 모델을 사용하면 인쇄 및 필기 텍스트를 추출하고 분석할 수 있습니다. 이 모델은 사용자 지정 모델 외에도 레이아웃, 일반 문서, 청구서, 영수증, ID 문서, 건강보험증, 세금 문서 및 사용자 지정 모델과 같은 다른 문서 인텔리전스 미리 빌드된 모델에 대한 기본 OCR 엔진입니다. 자세한 내용은 읽기 모델 개요를 참조하세요.
레이아웃: 레이아웃 모델을 사용하면 양식 및 문서에서 텍스트, 표, 문서 구조 및 선택 표시(예: 라디오 단추 및 확인란)를 추출하고 분석할 수 있습니다.
일반 문서: 일반 문서 모델을 사용하면 텍스트, 문서 구조 및 키-값 쌍을 추출하고 분석할 수 있습니다. 자세한 내용은 일반 문서 모델 개요를 참조하세요.
참고 항목
언어 코드(선택 사항)
문서 인텔리전스의 딥 러닝 기반 유니버설 모델은 혼합된 언어가 있는 텍스트 줄을 포함하여 문서의 다국어 텍스트를 모두 추출하며 언어 코드를 지정할 필요가 없습니다.
언어에 대해 잘 모르는 경우에는 언어 코드를 매개 변수로 제공하지 말고 서비스에서 관련 모델만 강제로 적용하도록 합니다. 그렇지 않으면 서비스에서 불완전하고 잘못된 텍스트를 반환할 수 있습니다.
로캘을 지정할 필요도 없습니다. 이것은 선택적 매개 변수입니다. 문서 인텔리전스 딥 러닝 기술은 이미지에 있는 텍스트의 언어를 자동으로 감지합니다.
다음 표에서는 인쇄된 텍스트를 추출하고 분석하기 위한 레이아웃 모델 언어 지원을 나열합니다.
언어
코드(선택 사항)
아프리칸스어
af
앙기카어
anp
아랍어
ar
아스투리아스어
ast
아와디어
awa
아제르바이잔어
az
벨로루시어(키릴 자모)
be: be-cyrl
벨로루시어(라틴어)
be-latn
Bagheli
bfy
마하수 파하리
bfz
불가리아어
bg
Haryanvi
bgc
보지푸리
bho
비슬라마어
bi
Bundeli
bns
브르타뉴어
br
브라즈어
bra
보도어
brx
보스니아 헤르체고비나어
bs
부랴트어
bua
카탈로니아어
ca
세부아노어
ceb
차모로어
ch
몬테네그린어(라틴어)
cnr: cnr-latn
몬테네그린어(키릴 자모)
cnr-cyrl
코르시카어
co
크림 타타르어
crh
체코어
cs
카슈비아어
csb
웨일스어
cy
덴마크어
da
독일어
de
드히말어
dhi
도그리어
doi
저지 소르브어
dsb
영어
en
스페인어
es
에스토니아어
et
바스크어
eu
페르시아어
fa
핀란드어
fi
필리핀어
fil
언어
코드(선택 사항)
피지어
fj
페로어
fo
프랑스어
fr
프리울리안어
fur
서 프리지아어
fy
아일랜드어
ga
가고즈어
gag
스코틀랜드 게일어
gd
길버트어
gil
갈리시아어
gl
곤디어
gon
맹크스어
gv
구룽어
gvr
하와이어
haw
힌디어
hi
할비어
hlb
차티스가르어
hne
하니어
hni
Ho
hoc
크로아티아어
hr
북부 슬라브어
hsb
아이티어
ht
헝가리어
hu
국제어
ia
인도네시아어
id
아이슬란드어
is
이탈리아어
it
이누크티투트어
iu
일본어
자운사리어
jns
자바어
jv
카라칼파크어(라틴어)
kaa: kaa-latn
카라칼파크어(키릴 자모)
kaa-cyrl
카친어
kac
Kabuverdianu
kea
Korku
kfq
카시어
kha
카자흐어(라틴어)
kk: kk-latn
카자흐어(키릴 자모)
kk-cyrl
칼랄리수트어
kl
칼링
klr
말토어
kmj
언어
코드(선택 사항)
한국어
코스라에어
kos
코랴크어
kpy
카라차이발카르어
krc
쿠루흐어
kru
쾰슈어
ksh
쿠르드어(라틴 문자)
ku: ku-latn
쿠르드어(아랍어)
ku-arab
쿠미크어
kum
콘월어
kw
키르기스어
ky
라틴어
la
룩셈부르크어
lb
라코타어
lkt
리투아니아어
lt
마오리어
mi
몽골어
mn
마라티어
mr
말레이어
ms
몰타어
mt
몽어Daw
mww
에르자어
myv
나폴리어
nap
네팔어
ne
니우에안어
niu
네덜란드어
nl
노르웨이어
no
노가이어
nog
오크어
oc
오세트어
os
펀자브어
pa
폴란드어
pl
다리어
prs
파슈토어
ps
포르투갈어
pt
키체어
quc
캠링어
rab
로망슈어
rm
루마니아어
ro
러시아어
ru
산스크리트어
sa
산탈어
sat
언어
코드(선택 사항)
사드리어
sck
스코틀랜드어
sco
슬로바키아어
sk
슬로베니아어
sl
사모아어
sm
남부 사미어
sma
북부 사미어
sme
룰레 사미어
smj
이나리 사미어
smn
스콜트 사미어
sms
소말리아어
so
알바니아어
sq
세르비아어(라틴 문자)
sr: sr-latn
시르마우리어
srx
스웨덴어
sv
스와힐리어
sw
테툼어
tet
타지키스탄어
tg
탕미
thf
투르크멘어
tk
통가
to
터키어
tr
타타르어
tt
투비니안어
tyv
위구르어
ug
우르두어
ur
우즈베크어(라틴 문자)
uz: uz-latn
우즈베크어(키릴 자모)
uz-cyrl
우즈베키스탄어(아랍어)
uz-arab
볼라퓌크어
vo
Walser
wae
캉리어
xnr
유카테코어
yua
장족어
za
중국어(한자(간체 변형))
zh: zh-hans
중국어(한자(번체 변형))
zh-hant
줄루어
zu
언어
언어 코드
아프리칸스어
af
알바니아어
sq
아스투리아스어
ast
바스크어
eu
비슬라마어
bi
브르타뉴어
br
카탈로니아어
ca
세부아노어
ceb
차모로어
ch
중국어(간체)
zh-Hans
중국어(번체)
zh-Hant
콘월어
kw
코르시카어
co
크림 타타르어(라틴어)
crh
체코어
cs
덴마크어
da
네덜란드어
nl
영어(인쇄 및 필기)
en
에스토니아어
et
피지어
fj
필리핀어
fil
핀란드어
fi
프랑스어/French
fr
프리울리안어
fur
갈리시아어
gl
독일어
de
길버트어
gil
그린란드어
kl
아이티어
ht
하니어
hni
몽 다오어(라틴어)
mww
헝가리어
hu
인도네시아어
id
국제어
ia
이누크티투트어 (라틴어)
iu
아일랜드어
ga
언어
언어 코드
이탈리아어
it
일본어
ja
자바어
jv
키체어
quc
Kabuverdianu
kea
카친어(라틴어)
kac
카라칼파크어
kaa
카슈비아어
csb
카시어
kha
한국어
ko
쿠르드어(라틴어)
kur
룩셈부르크어
lb
말레이어(라틴 문자)
ms
맹크스어
gv
나폴리어
nap
노르웨이어
no
오크어
oc
폴란드어
pl
포르투갈어
pt
로망슈어
rm
스코틀랜드어
sco
스코틀랜드 게일어
gd
슬로베니아어
slv
스페인어
es
스와힐리어(라틴어)
sw
스웨덴어
sv
타타르어 (라틴어)
tat
테툼어
tet
터키어
tr
북부 슬라브어
hsb
우즈베크어(라틴 문자)
uz
볼라퓌크어
vo
Walser
wae
서 프리지아어
fy
유카텍 마야어
yua
장족어
za
줄루어
zu
다음 표에서는 필기 텍스트를 추출하고 분석하기 위한 레이아웃 모델 언어 지원을 나열합니다.
언어
언어 코드(선택 사항)
언어
언어 코드(선택 사항)
영어
en
일본어
ja
중국어 간체
zh-Hans
한국어
ko
프랑스어/French
fr
포르투갈어
pt
독일어
de
스페인어
es
이탈리아어
it
러시아어(미리 보기)
ru
태국어(미리 보기)
th
아랍어(미리 보기)
ar
모델 ID: prebuilt-layout
다음 표에서는 필기 텍스트를 추출하고 분석하기 위한 레이아웃 모델 언어 지원을 나열합니다.
언어
언어 코드(선택 사항)
언어
언어 코드(선택 사항)
영어
en
일본어
ja
중국어 간체
zh-Hans
한국어
ko
프랑스어/French
fr
포르투갈어
pt
독일어
de
스페인어
es
이탈리아어
it
참고 항목
Document Intelligence v2.1은 필기 텍스트 추출을 지원하지 않습니다.
다음 표에서는 필기 텍스트를 추출하고 분석하기 위한 레이아웃 모델 언어 지원을 나열합니다.
언어
언어 코드(선택 사항)
언어
언어 코드(선택 사항)
영어
en
일본어
ja
중국어 간체
zh-Hans
한국어
ko
프랑스어/French
fr
포르투갈어
pt
독일어
de
스페인어
es
이탈리아어
it
러시아어(미리 보기)
ru
태국어(미리 보기)
th
아랍어(미리 보기)
ar
일반 문서
Important
문서 인텔리전스 v4.0:2024-07-31-preview, 2023-10-31-preview 및 진행하면서 일반 문서 모델(미리 빌드된 문서)이 레이아웃(미리 빌드된 레이아웃)에 추가됩니다. 키-값 쌍, 선택 표시, 텍스트, 테이블 및 구조를 추출하려면 다음 모델을 사용하세요.
키 값 쌍
version
Model ID
쿼리 문자열 features=keyValuePairs이 지정된 레이아웃 모델 입니다.
• v4:2024-02-29-미리 보기, 2023-10-31-미리 보기 • v3.1:2023-07-31 (GA)