다음을 통해 공유


Analyzer - Analyze Layout

지정된 문서에서 텍스트 및 레이아웃 정보를 추출합니다. 입력 문서는 지원되는 콘텐츠 형식인 'application/pdf', 'image/jpeg', 'image/png', 'image/tiff' 또는 'image/bmp' 중 하나여야 합니다. 또는 'application/json' 형식을 사용하여 분석할 문서의 위치(URI 또는 로컬 경로)를 지정합니다.

POST {endpoint}/formrecognizer/v2.1/layout/analyze
POST {endpoint}/formrecognizer/v2.1/layout/analyze?pages={pages}&language={language}&readingOrder={readingOrder}

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
endpoint
path True

string

지원되는 Cognitive Services 엔드포인트(프로토콜 및 호스트 이름( 예: https://westus2.api.cognitive.microsoft.com).

language
query

Language

현재, 만 아프리칸스 ('af'), 알바니아어 ('sq'), 아스투리안 ('ast'), 바스크어 ('eu'), 비슬라마 ('bi'), 브레튼 ('br'), 카탈로니아어 ('ca'), 세부아노 ('ceb'), 차모로 ('ch'), 코니쉬 ('kw'), 코르시칸 ('co'), 크림 타타르 - 라틴 문자 ''), 체코어('cs'), 덴마크어('da'), 네덜란드어('nl'), 영어('en'), 에스토니아어('et'), 피지어('fj'), 필리핀어('fil'), 핀란드어('fi'), 프랑스어('fr'), 프리울리안('fur'), 갈리시아어('gl'), 독일어('de'), 길베르테어('gil'), 그린란드어('kl'), 아이티 크리올 ('ht'), 하니 ('hni'), Hmong Daw ('mww'), 헝가리어 ('hu'), 인도네시아어 ('id'), 인터링구아 ('ia'), 이누크티투트 ('iu'), 아일랜드어('ga'), 이탈리아어('it'), 일본어('ja'), 자바어('jv'), 카부베르디아누('kea'), 카친('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), 카시 ('kha'), 한국어 ('ko'), 쿠르드어 - 라틴어 스크립트 ('ku'), K'iche'('quc'), 룩셈부르크어 ('lb'), 말레이어 ('ms'), Manx ('gv'), 나폴리어 ('nap'), 노르웨이어 ('no'), 옥시탄 ('oc'), 폴란드어 ('oc'), 폴란드어 ('oc'), 포르투갈어('pt'), 로마시('rm'), 스코틀랜드어('sco'), 스코틀랜드 게일어('gd'), 중국어('zh-Hans'), 슬로베니아어('sl'), 스페인어('es'), 스와힐리어('sw'), 스웨덴어('sv'), 타타르 - 라틴어 스크립트('tt'), 테툼('tet'), 중국어('tet'), ''), 터키어('tr'), 어퍼 소르비아어('hsb'), 우즈베키스탄('uz'), 볼라퓌크('vo'), 월서('wae'), 서부 프리시안('fy'), 유카텍 마야('yua'), 주앙('za') 및 줄루('zu')가 지원됩니다(인쇄 - 73개 언어 및 필기 – 영어만 해당). 레이아웃은 자동 언어 식별 및 다중 언어 문서를 지원하므로 문서를 특정 언어로 강제로 처리하려는 경우에만 언어 코드를 제공합니다.

pages
query

string[]

다중 페이지 문서(PDF/TIFF)에 대한 사용자 지정 페이지 번호로 OCR 결과를 가져올 페이지 수를 입력합니다. 페이지 범위의 경우 하이픈을 사용합니다. 각 페이지 또는 범위를 쉼표로 구분합니다.

readingOrder
query

ReadingOrder

반환된 텍스트 줄을 정렬하는 순서 알고리즘을 읽습니다. 지원되는 읽기 순서는 기본(기본값), 자연입니다.

요청 헤더

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Name 필수 형식 Description
Ocp-Apim-Subscription-Key True

string

요청 본문

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Name 형식 Description
source

string

minLength: 0
maxLength: 2048

파일 원본 경로입니다.

응답

Name 형식 Description
202 Accepted

요청이 성공적으로 큐에 대기됩니다.

헤더

Operation-Location: string

Other Status Codes

ErrorResponse

오류에 대한 추가 세부 정보를 포함하는 성공하지 못한 응답과 함께 제공되는 응답 엔터티입니다.

보안

Ocp-Apim-Subscription-Key

형식: apiKey
In(다음 안에): header

예제

Analyze layout

샘플 요청

POST {endpoint}/formrecognizer/v2.1/layout/analyze?language=en

샘플 응답

Operation-Location: {endpoint}/formrecognizer/v2.1/layout/analyzeResults/3b1e6c5b-e113-4114-ab6b-ce65dfe8050f

정의

Name Description
ErrorInformation
ErrorResponse
Language

현재, 만 아프리칸스 ('af'), 알바니아어 ('sq'), 아스투리안 ('ast'), 바스크어 ('eu'), 비슬라마 ('bi'), 브레튼 ('br'), 카탈로니아어 ('ca'), 세부아노 ('ceb'), 차모로 ('ch'), 코니쉬 ('kw'), 코르시칸 ('co'), 크림 타타르 - 라틴 문자 ''), 체코어('cs'), 덴마크어('da'), 네덜란드어('nl'), 영어('en'), 에스토니아어('et'), 피지어('fj'), 필리핀어('fil'), 핀란드어('fi'), 프랑스어('fr'), 프리울리안('fur'), 갈리시아어('gl'), 독일어('de'), 길베르테어('gil'), 그린란드어('kl'), 아이티 크리올 ('ht'), 하니 ('hni'), Hmong Daw ('mww'), 헝가리어 ('hu'), 인도네시아어 ('id'), 인터링구아 ('ia'), 이누크티투트 ('iu'), 아일랜드어('ga'), 이탈리아어('it'), 일본어('ja'), 자바어('jv'), 카부베르디아누('kea'), 카친('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), 카시 ('kha'), 한국어 ('ko'), 쿠르드어 - 라틴어 스크립트 ('ku'), K'iche'('quc'), 룩셈부르크어 ('lb'), 말레이어 ('ms'), Manx ('gv'), 나폴리어 ('nap'), 노르웨이어 ('no'), 옥시탄 ('oc'), 폴란드어 ('oc'), 폴란드어 ('oc'), 포르투갈어('pt'), 로마시('rm'), 스코틀랜드어('sco'), 스코틀랜드 게일어('gd'), 중국어('zh-Hans'), 슬로베니아어('sl'), 스페인어('es'), 스와힐리어('sw'), 스웨덴어('sv'), 타타르 - 라틴어 스크립트('tt'), 테툼('tet'), 중국어('tet'), ''), 터키어('tr'), 어퍼 소르비아어('hsb'), 우즈베키스탄('uz'), 볼라퓌크('vo'), 월서('wae'), 서부 프리시안('fy'), 유카텍 마야('yua'), 주앙('za') 및 줄루('zu')가 지원됩니다(인쇄 - 73개 언어 및 필기 – 영어만 해당). 레이아웃은 자동 언어 식별 및 다중 언어 문서를 지원하므로 문서를 특정 언어로 강제로 처리하려는 경우에만 언어 코드를 제공합니다.

ReadingOrder

반환된 텍스트 줄을 정렬하는 순서 알고리즘을 읽습니다. 지원되는 읽기 순서는 기본(기본값), 자연입니다.

SourcePath

원본 데이터에 대한 Uri 또는 로컬 경로입니다.

ErrorInformation

Name 형식 Description
code

string

message

string

ErrorResponse

Name 형식 Description
error

ErrorInformation

Language

현재, 만 아프리칸스 ('af'), 알바니아어 ('sq'), 아스투리안 ('ast'), 바스크어 ('eu'), 비슬라마 ('bi'), 브레튼 ('br'), 카탈로니아어 ('ca'), 세부아노 ('ceb'), 차모로 ('ch'), 코니쉬 ('kw'), 코르시칸 ('co'), 크림 타타르 - 라틴 문자 ''), 체코어('cs'), 덴마크어('da'), 네덜란드어('nl'), 영어('en'), 에스토니아어('et'), 피지어('fj'), 필리핀어('fil'), 핀란드어('fi'), 프랑스어('fr'), 프리울리안('fur'), 갈리시아어('gl'), 독일어('de'), 길베르테어('gil'), 그린란드어('kl'), 아이티 크리올 ('ht'), 하니 ('hni'), Hmong Daw ('mww'), 헝가리어 ('hu'), 인도네시아어 ('id'), 인터링구아 ('ia'), 이누크티투트 ('iu'), 아일랜드어('ga'), 이탈리아어('it'), 일본어('ja'), 자바어('jv'), 카부베르디아누('kea'), 카친('kac'), Kara-Kalpak ('kaa'), Kashubian ('csb'), 카시 ('kha'), 한국어 ('ko'), 쿠르드어 - 라틴어 스크립트 ('ku'), K'iche'('quc'), 룩셈부르크어 ('lb'), 말레이어 ('ms'), Manx ('gv'), 나폴리어 ('nap'), 노르웨이어 ('no'), 옥시탄 ('oc'), 폴란드어 ('oc'), 폴란드어 ('oc'), 포르투갈어('pt'), 로마시('rm'), 스코틀랜드어('sco'), 스코틀랜드 게일어('gd'), 중국어('zh-Hans'), 슬로베니아어('sl'), 스페인어('es'), 스와힐리어('sw'), 스웨덴어('sv'), 타타르 - 라틴어 스크립트('tt'), 테툼('tet'), 중국어('tet'), ''), 터키어('tr'), 어퍼 소르비아어('hsb'), 우즈베키스탄('uz'), 볼라퓌크('vo'), 월서('wae'), 서부 프리시안('fy'), 유카텍 마야('yua'), 주앙('za') 및 줄루('zu')가 지원됩니다(인쇄 - 73개 언어 및 필기 – 영어만 해당). 레이아웃은 자동 언어 식별 및 다중 언어 문서를 지원하므로 문서를 특정 언어로 강제로 처리하려는 경우에만 언어 코드를 제공합니다.

Description
af
ast
bi
br
ca
ceb
ch
co
crh
cs
csb
da
de
en
es
et
eu
fi
fil
fj
fr
fur
fy
ga
gd
gil
gl
gv
hni
hsb
ht
hu
ia
id
it
iu
ja
jv
kaa
kac
kea
kha
kl
ko
ku
kw
lb
ms
mww
nap
nl
no
oc
pl
pt
quc
rm
sco
sl
sq
sv
sw
tet
tr
tt
uz
vo
wae
yua
za
zh-Hans
zh-Hant
zu

ReadingOrder

반환된 텍스트 줄을 정렬하는 순서 알고리즘을 읽습니다. 지원되는 읽기 순서는 기본(기본값), 자연입니다.

Description
basic
natural

SourcePath

원본 데이터에 대한 Uri 또는 로컬 경로입니다.

Name 형식 Description
source

string

minLength: 0
maxLength: 2048

파일 원본 경로입니다.