Form Recognizer에 대한 언어 지원

이 문서는 Form Recognizer v3.0 확인 표시Form Recognizer v3.0에 적용됩니다. 이전 버전:Form Recognizer v2.1

이 문서에서는 텍스트 및 필드 추출(기능별)검색(읽기 전용)에 지원되는 언어를 다룹니다. 두 그룹은 상호 배타적입니다.

읽기, 레이아웃 및 사용자 지정 양식(템플릿) 모델

다음 목록에는 가장 최근의 v3.0 버전에 대한 현재 GA 언어가 포함되어 있습니다. 이러한 언어는 읽기, 레이아웃 및 사용자 지정 양식(템플릿) 모델 기능에서 지원됩니다.

참고

언어 코드(선택 사항)

Form Recognizer의 딥 러닝 기반 유니버설 모델은 혼합된 언어가 있는 텍스트 줄을 포함하여 문서의 다국어 텍스트를 모두 추출하며 언어 코드를 지정할 필요가 없습니다. 언어에 대해 잘 모르는 경우에는 언어 코드를 매개 변수로 제공하지 말고 서비스에서 관련 모델만 강제로 적용하도록 합니다. 그렇지 않으면 서비스에서 불완전하고 잘못된 텍스트를 반환할 수 있습니다.

v3.0-supported 언어를 사용하려면 v3.0 REST API 마이그레이션 가이드를 참조하여 v2.1 GA API와의 차이점을 이해하고, v3.0 SDK 및 REST API 빠른 시작을 살펴보세요.

필기 텍스트

다음 표에는 필기 텍스트 추출에 지원되는 언어가 나와 있습니다.

언어 언어 코드(선택 사항) 언어 언어 코드(선택 사항)
영어 en 일본어 ja
중국어 간체 zh-Hans 한국어 ko
프랑스어 fr 포르투갈어 pt
독일어 de 스페인어 es
이탈리아어 it

다음 표는 가장 최근의 GA 버전에서 인쇄 텍스트에 대한 지원 언어를 나열합니다.

언어 코드(선택 사항) 언어 코드(선택 사항)
아프리칸스어 af 카시어 kha
알바니아어 sq 키체어 quc
앙기카(데바나가리어) anp 한국어 ko
아랍어 ar Korku kfq
아스투리아스어 ast 코랴크어 kpy
아와디-힌디(데바나가리어) awa 코스라에어 kos
아제르바이잔어(라틴어) az 쿠믹어(키릴 자모) kum
Bagheli bfy 쿠르드어(아랍어) ku-arab
바스크어 eu 쿠르드어(라틴 문자) ku-latn
벨로루시어(키릴 자모) be, be-cyrl 쿠루크(데바나가리어) kru
벨로루시어(라틴어) be, be-latn 키르기스어(키릴 자모) ky
보즈푸리-힌디(데바나가리어) bho 라코타어 lkt
비슬라마어 bi 라틴어 la
보도(데바나가리어) brx 리투아니아어 lt
보스니아어(라틴 문자) bs 저지 소르브어 dsb
Brajbha bra 룰레 사미어 smj
브르타뉴어 br 룩셈부르크어 lb
불가리아어 bg 마하수 파하리(데바나가리어) bfz
Bundeli bns 말레이어(라틴 문자) ms
부랴트어(키릴 자모) bua 몰타어 mt
카탈로니아어 ca 말토어(데바나가리어) kmj
세부아노어 ceb 맹크스어 gv
Chamling rab 마오리어 mi
차모로어 ch 마라티어 mr
차티스가르히(데바나가리어) hne 몽골어(키릴 자모) mn
중국어 간체 zh-Hans 몬테네그린어(키릴 자모) cnr-cyrl
중국어 번체 zh-Hant 몬테네그린어(라틴어) cnr-latn
콘월어 kw 나폴리어 nap
코르시카어 co 네팔어 ne
크림 타타르어(라틴어) crh 니우에안어 niu
크로아티아어 hr 노가이어 nog
체코어 cs 북부 사미어(라틴어) sme
덴마크어 da 노르웨이어 no
다리어 prs 오크어 oc
디말(데바나가리어) dhi 오세트어 os
도그리(데바나가리어) doi 파슈토어 ps
네덜란드어 nl 페르시아어 fa
영어 en 폴란드어 pl
에르자어(키릴 자모) myv 포르투갈어 pt
에스토니아어 et 펀잡어(아랍어) pa
페로어 fo 리프아리안어 ksh
피지어 fj 루마니아어 ro
필리핀어 fil 로망슈어 rm
핀란드어 fi 러시아어 ru
프랑스어 fr 사드리(데바나가리어) sck
프리울리안어 fur 사모아어(라틴어) sm
가가우즈어(라틴어) gag Sanskrit(데바나가리) sa
갈리시아어 gl Santali(데바나기리어) sat
독일어 de 스코틀랜드어 sco
길버트어 gil 스코틀랜드 게일어 gd
곤디(데바나가리어) gon 세르비아어(라틴 문자) sr, sr-latn
그린란드어 kl 셰르파(데바나가리어) xsr
구룽(데바나가리어) gvr 시르마우리(데바나가리어) srx
아이티 크리올 ht 스콜트 사미어 sms
할비(데바나가리어) hlb 슬로바키아어 sk
하니어 hni 슬로베니아어 sl
Haryanvi bgc 소말리어(아랍어) so
하와이어 haw 남부 사미어 sma
힌디어 hi 스페인어 es
몽 다오어(라틴어) mww 스와힐리어(라틴어) sw
Ho(데바나기리어) hoc 스웨덴어 sv
헝가리어 hu 타지크어(키릴 자모) tg
아이슬란드어 is 타타르어 (라틴어) tt
이나리 사미어 smn 테툼어 tet
인도네시아어 id 탕미 thf
국제어 ia 통가어 to
이누크티투트어 (라틴어) iu 터키어 tr
아일랜드어 ga 투르크멘어(라틴어) tk
이탈리아어 it 투반어 tyv
일본어 ja 고지대 슬라브어 hsb
자운사리(데바나가리어) Jns 우르두어 ur
자바어 jv 위구르어(아랍어) ug
Kabuverdianu kea 우즈베키스탄어(아랍어) uz-arab
카친어(라틴어) kac 우즈베크어(키릴 자모) uz-cyrl
캉그리(데바나가리어) xnr 우즈베크어(라틴 문자) uz
카라차이발카르어 krc 볼라퓌크어 vo
카라칼파크어(키릴 자모) kaa-cyrl Walser wae
카라칼파크어(라틴어) kaa 웨일스어 cy
카슈비아어 csb 서 프리지아어 fy
카자흐어(키릴 자모) kk-cyrl 유카텍 마야어 yua
카자흐어(라틴어) kk-latn 장족어 za
칼링 klr 줄루어 zu

REST API 또는 해당 SDK를 사용하여 애플리케이션의 이러한 언어를 지원하는 경우 매개 변수 api-version=2022-06-30-preview를 사용합니다.

언어 코드(선택 사항) 언어 코드(선택 사항)
Abaza abq 마다가스카르어 mg
Abkhazian ab Mandinka mnk
Achinese ace Mapudungun arn
Acoli ach Mari(러시아) chm
Adangme ada Masai mas
Adyghe ady Mende(시에라리온) men
Afar aa Meru mer
Akan ak Meta' mgo
Algonquin alq Minangkabau min
Asu(탄자니아) asa 모호크어 moh
Avaric av Mongondow mog
Aymara ay Morisyen mfe
Bafia ksf Mundang mua
Bambara bm Nahuatl nah
바슈키르어 ba Navajo nv
Bemba(잠비아) bem Ndonga ng
Bena(탄자니아) bez Ngomba jgo
Bikol bik North Ndebele nd
Bini bin Nyanja ny
Chechen ce Nyankole nyn
Chiga cgg Nzima nzi
Choctaw cho Ojibwa oj
Chukot ckt Oromo om
Chuvash cv Pampanga pam
Cree cr Pangasinan pag
Creek mus Papiamento pap
Crow cro Pedi nso
Dargwa dar 케추아어 qu
Duala dua Rundi rn
Dungan dng Rwa rwk
Efik efi Samburu saq
Fon fon Sango sg
Ga gaa Sangu(가봉) snq
Ganda lg Sena seh
Gayo gay 세르비아어(키릴 자모) sr-cyrl
과라니어 gn Shambala ksb
Gusii guz 쇼나어 sn
그리스어 el Siksika bla
Herero hz Soga xog
Hiligaynon hil Somali(라틴어) so-latn
Iban iba Songhai son
이그보어 ig South Ndebele nr
Iloko ilo Southern Altai alt
Ingush inh Southern Sotho st
Jola-Fonyi dyo 순다어 su
Kabardian kbd Swati ss
Kalenjin kln Tabassaran tab
Kalmyk xal Tachelhit shi
Kanuri kr 타히티어 ty
Khakas kjh Taita dav
Kikuyu ki 타타르어(키릴 자모) tt-cyrl
Kildin Sami sjd Teso teo
키냐르완다어 rw 태국어 th
Komi kv Tok Pisin tpi
Kongo kg Tsonga ts
Kpelle kpe Tswana tn
Kuanyama kj Udmurt udm
Lak lbe Uighur(키릴 자모) ug-cyrl
라트비아어 lv 우크라이나어 uk
Lezghian lex 베트남어 vi
Lingala ln Vunjo vun
Lozi loz 월로프어 wo
Luo(케냐 및 탄자니아) luo 코사어 xh
Luyia luy 야쿠트어 sah
마케도니아어 mk Zapotec zap
Machame jmc Zarma dje
Madurese mad
Makhuwa-Meetto mgh
Makonde kde

사용자 지정 신경망 모델

언어 로캘 코드
영어(미국) ko-kr

영수증 모델

참고

로캘을 지정할 필요가 없습니다. 선택적 매개 변수입니다. Form Recognizer 딥 러닝 기술은 이미지의 텍스트에 사용된 언어를 자동으로 검색합니다.

영수증은 모든 영어 영수증 및 다음과 같은 로캘을 지원합니다.

언어 로캘 코드
영어(호주) en-au
영어(캐나다) en-ca
영어(영국) en-gb
영어(인도) en-in
영어(미국) en-us
프랑스어 fr
스페인어 es

비즈니스 카드 모델

참고

로캘을 지정할 필요가 없습니다. 선택적 매개 변수입니다. Form Recognizer 딥 러닝 기술은 이미지의 텍스트에 사용된 언어를 자동으로 검색합니다.

명함은 다음과 같은 로캘이 있는 모든 영어 명함을 지원합니다.

언어 로캘 코드
영어(호주) en-au
영어(캐나다) en-ca
영어(영국) en-gb
영어(인도) en-in
영어(미국) en-us

2022-06-30 이상 릴리스에는 일본어 지원이 포함됩니다.

언어 로캘 코드
일본어 ja

청구서 모델

언어 로캘 코드
영어 en-US, en-IN, en-GB, en-CA, en-AU
스페인어 es
독일어(2022-06-30 이상) de
프랑스어(2022-06-30 이상) fr
이탈리아어(2022-06-30 이상) it
포르투갈어(2022-06-30 이상) pt
네덜란드어(2022-06-30 이상) nl

ID 문서 모델

이 기술은 현재 미국 운전면허 및 국제 여권의 인적 사항 페이지에 사용할 수 있습니다(비자 및 기타 여행 문서 제외).

일반 문서

언어 로캘 코드
영어(미국) ko-kr

검색된 언어: Read API

Read API는 문서에서 다음 언어 검색을 지원합니다. 이 목록에는 현재 텍스트 추출이 지원되지 않는 언어가 포함될 수 있습니다.

참고

언어 감지

Form Recognizer 읽기 모델은 언어의 존재 가능성을 검색할 수 있으며 검색된 언어에 대한 언어 코드를 반환합니다. 지정된 언어에 대해 텍스트를 추출할 수도 있는지 확인하려면 이전 섹션을 참조하세요.

참고

검색된 언어와 추출된 언어

이 섹션에는 읽기 모델을 사용하여 문서에서 검색할 수 있는 언어(있는 경우)가 나열됩니다. 이 목록은 각 모델에 대해 위의 섹션에 지정된 텍스트 추출을 지원하는 언어 목록과 다릅니다.

언어 코드
아프리칸스어 af
알바니아어 sq
암하라어 am
아랍어 ar
아르메니아어 hy
아삼어 as
아제르바이잔어 az
바스크어 eu
벨라루스어 be
벵골어 bn
보스니아어 bs
불가리아어 bg
버마어 my
카탈로니아어 ca
중앙 크메르어 km
중국어 zh
중국어 간체 zh_chs
중국어 번체 zh_cht
코르시카어 co
크로아티아어 hr
체코어 cs
덴마크어 da
다리어 prs
디베히어 dv
네덜란드어 nl
영어 en
에스페란토어 eo
에스토니아어 et
피지어 fj
핀란드어 fi
프랑스어 fr
갈리시아어 gl
그루지야 문자 ka
독일어 de
그리스어 el
구자라트어 gu
아이티어 ht
하우사어 ha
히브리어 he
힌디어 hi
몽 다오어 mww
헝가리어 hu
아이슬란드어 is
이그보어 ig
인도네시아어 id
이눅티투트어 iu
아일랜드어 ga
이탈리아어 it
일본어 ja
자바어 jv
칸나다어 kn
카자흐어 kk
키냐르완다어 rw
키르기스어 ky
한국어 ko
쿠르드어 ku
라오어 lo
라틴어 la
라트비아어 lv
리투아니아어 lt
룩셈부르크어 lb
마케도니아어 mk
마다가스카르어 mg
말레이어 ms
말라얄람어 ml
몰타어 mt
마오리어 mi
마라티어 mr
몽골어 mn
네팔어 ne
노르웨이어 no
노르웨이어 니노르스크 nn
오리야어 or
파슈트어 ps
페르시아어 fa
폴란드어 pl
포르투갈어 pt
펀잡어 pa
케레타로 오토미어 otq
루마니아어 ro
러시아어 ru
사모아어 sm
세르비아어 sr
쇼나어 sn
신디어 sd
스리랑카어 si
슬로바키아어 sk
슬로베니아어 sl
소말리아어 so
스페인어 es
순다어 su
스와힐리어 sw
스웨덴어 sv
타갈로그어 tl
타히티어 ty
타지크어 tg
타밀어 ta
타타르어 tt
텔루구어 te
태국어 th
티베트어 bo
티그리냐어 ti
통가어 to
터키어 tr
투르크멘어 tk
우크라이나어 uk
우르두어 ur
우즈베크어 uz
베트남어 vi
웨일스어 cy
코사어 xh
이디시어 yi
요루바어 yo
유카텍 마야어 yua
줄루어 zu

이 문서의 적용 대상:Form Recognizer v2.1 확인 표시Form Recognizer v2.1. 이후 버전:Form Recognizer v3.0

이 테이블에서는 각 Form Recognizer 서비스에서 지원되는 문자 언어가 나열되어 있습니다.

레이아웃 및 사용자 지정 모델

언어 언어 코드
아프리칸스어 af
알바니아어 sq
아스투리아스어 ast
바스크어 eu
비슬라마어 bi
브르타뉴어 br
카탈로니아어 ca
세부아노어 ceb
차모로어 ch
중국어(간체) zh-Hans
중국어(번체) zh-Hant
콘월어 kw
코르시카어 co
크림 타타르어(라틴어) crh
체코어 cs
덴마크어 da
네덜란드어 nl
영어(인쇄 및 필기) en
에스토니아어 et
피지어 fj
필리핀어 fil
핀란드어 fi
프랑스어 fr
프리울리안어 fur
갈리시아어 gl
독일어 de
길버트어 gil
그린란드어 kl
아이티 크리올 ht
하니어 hni
몽 다오어(라틴어) mww
헝가리어 hu
인도네시아어 id
국제어 ia
이누크티투트어 (라틴어) iu
아일랜드어 ga
이탈리아어 it
일본어 ja
자바어 jv
키체어 quc
Kabuverdianu kea
카친어(라틴어) kac
카라칼파크어 kaa
카슈비아어 csb
카시어 kha
한국어 ko
쿠르드어(라틴어) kur
룩셈부르크어 lb
말레이어(라틴 문자) ms
맹크스어 gv
나폴리어 nap
노르웨이어 no
오크어 oc
폴란드어 pl
포르투갈어 pt
로망슈어 rm
스코틀랜드어 sco
스코틀랜드 게일어 gd
슬로베니아어 slv
스페인어 es
스와힐리어(라틴어) sw
스웨덴어 sv
타타르어 (라틴어) tat
테툼어 tet
터키어 tr
고지대 슬라브어 hsb
우즈베크어(라틴 문자) uz
볼라퓌크어 vo
Walser wae
서 프리지아어 fy
유카텍 마야어 yua
장족어 za
줄루어 zu

미리 빌드된 영수증 및 명함

참고

Form Recognizer 딥 러닝 기술은 이미지의 텍스트에 사용된 언어를 자동으로 검색합니다.

미리 빌드된 영수증 및 명함에서는 다음 로캘의 모든 영어 영수증 및 명함이 지원됩니다.

지원되는 언어 세부 정보
영어 미국(-us), 오스트레일리아(-au), 영국(-gb), 인도(-in)
프랑스어 프랑스(FR)
스페인어 스페인(ES)

미리 빌드된 청구서

참고

Form Recognizer 딥 러닝 기술은 이미지의 텍스트에 사용된 언어를 자동으로 검색합니다.

지원되는 언어 세부 정보
  • 영어
미국(-us), 오스트레일리아(-au), 캐나다(-ca), 영국(-gb), 인도(-in)
  • 스페인어
스페인(ES)
  • 독일어
독일(DE)
  • 프랑스어
프랑스(FR)
  • 이탈리아어
이탈리아(IT)
  • 포르투갈어
포르투갈(-pt), 브라질(-br)
  • 네덜란드어
네덜란드(DE)

미리 빌드된 ID 문서

이 기술은 현재 미국 운전면허 및 국제 여권의 인적 사항 페이지에 사용할 수 있습니다(비자 및 기타 여행 문서 제외).

다음 단계