Form Recognizer에 대한 언어 지원
이 문서는 Form Recognizer v3.0에 적용됩니다. 이전 버전:Form Recognizer v2.1
이 문서에서는 텍스트 및 필드 추출(기능별) 및 검색(읽기 전용)에 지원되는 언어를 다룹니다. 두 그룹은 상호 배타적입니다.
읽기, 레이아웃 및 사용자 지정 양식(템플릿) 모델
다음 목록에는 가장 최근의 v3.0 버전에 대한 현재 GA 언어가 포함되어 있습니다. 이러한 언어는 읽기, 레이아웃 및 사용자 지정 양식(템플릿) 모델 기능에서 지원됩니다.
참고
언어 코드(선택 사항)
Form Recognizer의 딥 러닝 기반 유니버설 모델은 혼합된 언어가 있는 텍스트 줄을 포함하여 문서의 다국어 텍스트를 모두 추출하며 언어 코드를 지정할 필요가 없습니다. 언어에 대해 잘 모르는 경우에는 언어 코드를 매개 변수로 제공하지 말고 서비스에서 관련 모델만 강제로 적용하도록 합니다. 그렇지 않으면 서비스에서 불완전하고 잘못된 텍스트를 반환할 수 있습니다.
v3.0-supported 언어를 사용하려면 v3.0 REST API 마이그레이션 가이드를 참조하여 v2.1 GA API와의 차이점을 이해하고, v3.0 SDK 및 REST API 빠른 시작을 살펴보세요.
필기 텍스트
다음 표에는 필기 텍스트 추출에 지원되는 언어가 나와 있습니다.
언어 | 언어 코드(선택 사항) | 언어 | 언어 코드(선택 사항) |
---|---|---|---|
영어 | en |
일본어 | ja |
중국어 간체 | zh-Hans |
한국어 | ko |
프랑스어 | fr |
포르투갈어 | pt |
독일어 | de |
스페인어 | es |
이탈리아어 | it |
텍스트 인쇄
다음 표는 가장 최근의 GA 버전에서 인쇄 텍스트에 대한 지원 언어를 나열합니다.
언어 | 코드(선택 사항) | 언어 | 코드(선택 사항) |
---|---|---|---|
아프리칸스어 | af |
카시어 | kha |
알바니아어 | sq |
키체어 | quc |
앙기카(데바나가리어) | anp |
한국어 | ko |
아랍어 | ar |
Korku | kfq |
아스투리아스어 | ast |
코랴크어 | kpy |
아와디-힌디(데바나가리어) | awa |
코스라에어 | kos |
아제르바이잔어(라틴어) | az |
쿠믹어(키릴 자모) | kum |
Bagheli | bfy |
쿠르드어(아랍어) | ku-arab |
바스크어 | eu |
쿠르드어(라틴 문자) | ku-latn |
벨로루시어(키릴 자모) | be , be-cyrl |
쿠루크(데바나가리어) | kru |
벨로루시어(라틴어) | be , be-latn |
키르기스어(키릴 자모) | ky |
보즈푸리-힌디(데바나가리어) | bho |
라코타어 | lkt |
비슬라마어 | bi |
라틴어 | la |
보도(데바나가리어) | brx |
리투아니아어 | lt |
보스니아어(라틴 문자) | bs |
저지 소르브어 | dsb |
Brajbha | bra |
룰레 사미어 | smj |
브르타뉴어 | br |
룩셈부르크어 | lb |
불가리아어 | bg |
마하수 파하리(데바나가리어) | bfz |
Bundeli | bns |
말레이어(라틴 문자) | ms |
부랴트어(키릴 자모) | bua |
몰타어 | mt |
카탈로니아어 | ca |
말토어(데바나가리어) | kmj |
세부아노어 | ceb |
맹크스어 | gv |
Chamling | rab |
마오리어 | mi |
차모로어 | ch |
마라티어 | mr |
차티스가르히(데바나가리어) | hne |
몽골어(키릴 자모) | mn |
중국어 간체 | zh-Hans |
몬테네그린어(키릴 자모) | cnr-cyrl |
중국어 번체 | zh-Hant |
몬테네그린어(라틴어) | cnr-latn |
콘월어 | kw |
나폴리어 | nap |
코르시카어 | co |
네팔어 | ne |
크림 타타르어(라틴어) | crh |
니우에안어 | niu |
크로아티아어 | hr |
노가이어 | nog |
체코어 | cs |
북부 사미어(라틴어) | sme |
덴마크어 | da |
노르웨이어 | no |
다리어 | prs |
오크어 | oc |
디말(데바나가리어) | dhi |
오세트어 | os |
도그리(데바나가리어) | doi |
파슈토어 | ps |
네덜란드어 | nl |
페르시아어 | fa |
영어 | en |
폴란드어 | pl |
에르자어(키릴 자모) | myv |
포르투갈어 | pt |
에스토니아어 | et |
펀잡어(아랍어) | pa |
페로어 | fo |
리프아리안어 | ksh |
피지어 | fj |
루마니아어 | ro |
필리핀어 | fil |
로망슈어 | rm |
핀란드어 | fi |
러시아어 | ru |
프랑스어 | fr |
사드리(데바나가리어) | sck |
프리울리안어 | fur |
사모아어(라틴어) | sm |
가가우즈어(라틴어) | gag |
Sanskrit(데바나가리) | sa |
갈리시아어 | gl |
Santali(데바나기리어) | sat |
독일어 | de |
스코틀랜드어 | sco |
길버트어 | gil |
스코틀랜드 게일어 | gd |
곤디(데바나가리어) | gon |
세르비아어(라틴 문자) | sr , sr-latn |
그린란드어 | kl |
셰르파(데바나가리어) | xsr |
구룽(데바나가리어) | gvr |
시르마우리(데바나가리어) | srx |
아이티 크리올 | ht |
스콜트 사미어 | sms |
할비(데바나가리어) | hlb |
슬로바키아어 | sk |
하니어 | hni |
슬로베니아어 | sl |
Haryanvi | bgc |
소말리어(아랍어) | so |
하와이어 | haw |
남부 사미어 | sma |
힌디어 | hi |
스페인어 | es |
몽 다오어(라틴어) | mww |
스와힐리어(라틴어) | sw |
Ho(데바나기리어) | hoc |
스웨덴어 | sv |
헝가리어 | hu |
타지크어(키릴 자모) | tg |
아이슬란드어 | is |
타타르어 (라틴어) | tt |
이나리 사미어 | smn |
테툼어 | tet |
인도네시아어 | id |
탕미 | thf |
국제어 | ia |
통가어 | to |
이누크티투트어 (라틴어) | iu |
터키어 | tr |
아일랜드어 | ga |
투르크멘어(라틴어) | tk |
이탈리아어 | it |
투반어 | tyv |
일본어 | ja |
고지대 슬라브어 | hsb |
자운사리(데바나가리어) | Jns |
우르두어 | ur |
자바어 | jv |
위구르어(아랍어) | ug |
Kabuverdianu | kea |
우즈베키스탄어(아랍어) | uz-arab |
카친어(라틴어) | kac |
우즈베크어(키릴 자모) | uz-cyrl |
캉그리(데바나가리어) | xnr |
우즈베크어(라틴 문자) | uz |
카라차이발카르어 | krc |
볼라퓌크어 | vo |
카라칼파크어(키릴 자모) | kaa-cyrl |
Walser | wae |
카라칼파크어(라틴어) | kaa |
웨일스어 | cy |
카슈비아어 | csb |
서 프리지아어 | fy |
카자흐어(키릴 자모) | kk-cyrl |
유카텍 마야어 | yua |
카자흐어(라틴어) | kk-latn |
장족어 | za |
칼링 | klr |
줄루어 | zu |
미리 보기로 텍스트 인쇄(API 버전 2022-06-30-preview)
REST API 또는 해당 SDK를 사용하여 애플리케이션의 이러한 언어를 지원하는 경우 매개 변수 api-version=2022-06-30-preview
를 사용합니다.
언어 | 코드(선택 사항) | 언어 | 코드(선택 사항) |
---|---|---|---|
Abaza | abq |
마다가스카르어 | mg |
Abkhazian | ab |
Mandinka | mnk |
Achinese | ace |
Mapudungun | arn |
Acoli | ach |
Mari(러시아) | chm |
Adangme | ada |
Masai | mas |
Adyghe | ady |
Mende(시에라리온) | men |
Afar | aa |
Meru | mer |
Akan | ak |
Meta' | mgo |
Algonquin | alq |
Minangkabau | min |
Asu(탄자니아) | asa |
모호크어 | moh |
Avaric | av |
Mongondow | mog |
Aymara | ay |
Morisyen | mfe |
Bafia | ksf |
Mundang | mua |
Bambara | bm |
Nahuatl | nah |
바슈키르어 | ba |
Navajo | nv |
Bemba(잠비아) | bem |
Ndonga | ng |
Bena(탄자니아) | bez |
Ngomba | jgo |
Bikol | bik |
North Ndebele | nd |
Bini | bin |
Nyanja | ny |
Chechen | ce |
Nyankole | nyn |
Chiga | cgg |
Nzima | nzi |
Choctaw | cho |
Ojibwa | oj |
Chukot | ckt |
Oromo | om |
Chuvash | cv |
Pampanga | pam |
Cree | cr |
Pangasinan | pag |
Creek | mus |
Papiamento | pap |
Crow | cro |
Pedi | nso |
Dargwa | dar |
케추아어 | qu |
Duala | dua |
Rundi | rn |
Dungan | dng |
Rwa | rwk |
Efik | efi |
Samburu | saq |
Fon | fon |
Sango | sg |
Ga | gaa |
Sangu(가봉) | snq |
Ganda | lg |
Sena | seh |
Gayo | gay |
세르비아어(키릴 자모) | sr-cyrl |
과라니어 | gn |
Shambala | ksb |
Gusii | guz |
쇼나어 | sn |
그리스어 | el |
Siksika | bla |
Herero | hz |
Soga | xog |
Hiligaynon | hil |
Somali(라틴어) | so-latn |
Iban | iba |
Songhai | son |
이그보어 | ig |
South Ndebele | nr |
Iloko | ilo |
Southern Altai | alt |
Ingush | inh |
Southern Sotho | st |
Jola-Fonyi | dyo |
순다어 | su |
Kabardian | kbd |
Swati | ss |
Kalenjin | kln |
Tabassaran | tab |
Kalmyk | xal |
Tachelhit | shi |
Kanuri | kr |
타히티어 | ty |
Khakas | kjh |
Taita | dav |
Kikuyu | ki |
타타르어(키릴 자모) | tt-cyrl |
Kildin Sami | sjd |
Teso | teo |
키냐르완다어 | rw |
태국어 | th |
Komi | kv |
Tok Pisin | tpi |
Kongo | kg |
Tsonga | ts |
Kpelle | kpe |
Tswana | tn |
Kuanyama | kj |
Udmurt | udm |
Lak | lbe |
Uighur(키릴 자모) | ug-cyrl |
라트비아어 | lv |
우크라이나어 | uk |
Lezghian | lex |
베트남어 | vi |
Lingala | ln |
Vunjo | vun |
Lozi | loz |
월로프어 | wo |
Luo(케냐 및 탄자니아) | luo |
코사어 | xh |
Luyia | luy |
야쿠트어 | sah |
마케도니아어 | mk |
Zapotec | zap |
Machame | jmc |
Zarma | dje |
Madurese | mad |
||
Makhuwa-Meetto | mgh |
||
Makonde | kde |
사용자 지정 신경망 모델
언어 | 로캘 코드 |
---|---|
영어(미국) | ko-kr |
영수증 모델
참고
로캘을 지정할 필요가 없습니다. 선택적 매개 변수입니다. Form Recognizer 딥 러닝 기술은 이미지의 텍스트에 사용된 언어를 자동으로 검색합니다.
영수증은 모든 영어 영수증 및 다음과 같은 로캘을 지원합니다.
언어 | 로캘 코드 |
---|---|
영어(호주) | en-au |
영어(캐나다) | en-ca |
영어(영국) | en-gb |
영어(인도) | en-in |
영어(미국) | en-us |
프랑스어 | fr |
스페인어 | es |
비즈니스 카드 모델
참고
로캘을 지정할 필요가 없습니다. 선택적 매개 변수입니다. Form Recognizer 딥 러닝 기술은 이미지의 텍스트에 사용된 언어를 자동으로 검색합니다.
명함은 다음과 같은 로캘이 있는 모든 영어 명함을 지원합니다.
언어 | 로캘 코드 |
---|---|
영어(호주) | en-au |
영어(캐나다) | en-ca |
영어(영국) | en-gb |
영어(인도) | en-in |
영어(미국) | en-us |
2022-06-30 이상 릴리스에는 일본어 지원이 포함됩니다.
언어 | 로캘 코드 |
---|---|
일본어 | ja |
청구서 모델
언어 | 로캘 코드 |
---|---|
영어 | en-US, en-IN, en-GB, en-CA, en-AU |
스페인어 | es |
독일어(2022-06-30 이상) | de |
프랑스어(2022-06-30 이상) | fr |
이탈리아어(2022-06-30 이상) | it |
포르투갈어(2022-06-30 이상) | pt |
네덜란드어(2022-06-30 이상) | nl |
ID 문서 모델
이 기술은 현재 미국 운전면허 및 국제 여권의 인적 사항 페이지에 사용할 수 있습니다(비자 및 기타 여행 문서 제외).
일반 문서
언어 | 로캘 코드 |
---|---|
영어(미국) | ko-kr |
검색된 언어: Read API
Read API는 문서에서 다음 언어 검색을 지원합니다. 이 목록에는 현재 텍스트 추출이 지원되지 않는 언어가 포함될 수 있습니다.
참고
언어 감지
Form Recognizer 읽기 모델은 언어의 존재 가능성을 검색할 수 있으며 검색된 언어에 대한 언어 코드를 반환합니다. 지정된 언어에 대해 텍스트를 추출할 수도 있는지 확인하려면 이전 섹션을 참조하세요.
참고
검색된 언어와 추출된 언어
이 섹션에는 읽기 모델을 사용하여 문서에서 검색할 수 있는 언어(있는 경우)가 나열됩니다. 이 목록은 각 모델에 대해 위의 섹션에 지정된 텍스트 추출을 지원하는 언어 목록과 다릅니다.
언어 | 코드 |
---|---|
아프리칸스어 | af |
알바니아어 | sq |
암하라어 | am |
아랍어 | ar |
아르메니아어 | hy |
아삼어 | as |
아제르바이잔어 | az |
바스크어 | eu |
벨라루스어 | be |
벵골어 | bn |
보스니아어 | bs |
불가리아어 | bg |
버마어 | my |
카탈로니아어 | ca |
중앙 크메르어 | km |
중국어 | zh |
중국어 간체 | zh_chs |
중국어 번체 | zh_cht |
코르시카어 | co |
크로아티아어 | hr |
체코어 | cs |
덴마크어 | da |
다리어 | prs |
디베히어 | dv |
네덜란드어 | nl |
영어 | en |
에스페란토어 | eo |
에스토니아어 | et |
피지어 | fj |
핀란드어 | fi |
프랑스어 | fr |
갈리시아어 | gl |
그루지야 문자 | ka |
독일어 | de |
그리스어 | el |
구자라트어 | gu |
아이티어 | ht |
하우사어 | ha |
히브리어 | he |
힌디어 | hi |
몽 다오어 | mww |
헝가리어 | hu |
아이슬란드어 | is |
이그보어 | ig |
인도네시아어 | id |
이눅티투트어 | iu |
아일랜드어 | ga |
이탈리아어 | it |
일본어 | ja |
자바어 | jv |
칸나다어 | kn |
카자흐어 | kk |
키냐르완다어 | rw |
키르기스어 | ky |
한국어 | ko |
쿠르드어 | ku |
라오어 | lo |
라틴어 | la |
라트비아어 | lv |
리투아니아어 | lt |
룩셈부르크어 | lb |
마케도니아어 | mk |
마다가스카르어 | mg |
말레이어 | ms |
말라얄람어 | ml |
몰타어 | mt |
마오리어 | mi |
마라티어 | mr |
몽골어 | mn |
네팔어 | ne |
노르웨이어 | no |
노르웨이어 니노르스크 | nn |
오리야어 | or |
파슈트어 | ps |
페르시아어 | fa |
폴란드어 | pl |
포르투갈어 | pt |
펀잡어 | pa |
케레타로 오토미어 | otq |
루마니아어 | ro |
러시아어 | ru |
사모아어 | sm |
세르비아어 | sr |
쇼나어 | sn |
신디어 | sd |
스리랑카어 | si |
슬로바키아어 | sk |
슬로베니아어 | sl |
소말리아어 | so |
스페인어 | es |
순다어 | su |
스와힐리어 | sw |
스웨덴어 | sv |
타갈로그어 | tl |
타히티어 | ty |
타지크어 | tg |
타밀어 | ta |
타타르어 | tt |
텔루구어 | te |
태국어 | th |
티베트어 | bo |
티그리냐어 | ti |
통가어 | to |
터키어 | tr |
투르크멘어 | tk |
우크라이나어 | uk |
우르두어 | ur |
우즈베크어 | uz |
베트남어 | vi |
웨일스어 | cy |
코사어 | xh |
이디시어 | yi |
요루바어 | yo |
유카텍 마야어 | yua |
줄루어 | zu |
이 문서의 적용 대상:Form Recognizer v2.1. 이후 버전:Form Recognizer v3.0
이 테이블에서는 각 Form Recognizer 서비스에서 지원되는 문자 언어가 나열되어 있습니다.
레이아웃 및 사용자 지정 모델
언어 | 언어 코드 |
---|---|
아프리칸스어 | af |
알바니아어 | sq |
아스투리아스어 | ast |
바스크어 | eu |
비슬라마어 | bi |
브르타뉴어 | br |
카탈로니아어 | ca |
세부아노어 | ceb |
차모로어 | ch |
중국어(간체) | zh-Hans |
중국어(번체) | zh-Hant |
콘월어 | kw |
코르시카어 | co |
크림 타타르어(라틴어) | crh |
체코어 | cs |
덴마크어 | da |
네덜란드어 | nl |
영어(인쇄 및 필기) | en |
에스토니아어 | et |
피지어 | fj |
필리핀어 | fil |
핀란드어 | fi |
프랑스어 | fr |
프리울리안어 | fur |
갈리시아어 | gl |
독일어 | de |
길버트어 | gil |
그린란드어 | kl |
아이티 크리올 | ht |
하니어 | hni |
몽 다오어(라틴어) | mww |
헝가리어 | hu |
인도네시아어 | id |
국제어 | ia |
이누크티투트어 (라틴어) | iu |
아일랜드어 | ga |
이탈리아어 | it |
일본어 | ja |
자바어 | jv |
키체어 | quc |
Kabuverdianu | kea |
카친어(라틴어) | kac |
카라칼파크어 | kaa |
카슈비아어 | csb |
카시어 | kha |
한국어 | ko |
쿠르드어(라틴어) | kur |
룩셈부르크어 | lb |
말레이어(라틴 문자) | ms |
맹크스어 | gv |
나폴리어 | nap |
노르웨이어 | no |
오크어 | oc |
폴란드어 | pl |
포르투갈어 | pt |
로망슈어 | rm |
스코틀랜드어 | sco |
스코틀랜드 게일어 | gd |
슬로베니아어 | slv |
스페인어 | es |
스와힐리어(라틴어) | sw |
스웨덴어 | sv |
타타르어 (라틴어) | tat |
테툼어 | tet |
터키어 | tr |
고지대 슬라브어 | hsb |
우즈베크어(라틴 문자) | uz |
볼라퓌크어 | vo |
Walser | wae |
서 프리지아어 | fy |
유카텍 마야어 | yua |
장족어 | za |
줄루어 | zu |
미리 빌드된 영수증 및 명함
참고
Form Recognizer 딥 러닝 기술은 이미지의 텍스트에 사용된 언어를 자동으로 검색합니다.
미리 빌드된 영수증 및 명함에서는 다음 로캘의 모든 영어 영수증 및 명함이 지원됩니다.
지원되는 언어 | 세부 정보 |
---|---|
영어 | 미국(-us), 오스트레일리아(-au), 영국(-gb), 인도(-in) |
프랑스어 | 프랑스(FR) |
스페인어 | 스페인(ES) |
미리 빌드된 청구서
참고
Form Recognizer 딥 러닝 기술은 이미지의 텍스트에 사용된 언어를 자동으로 검색합니다.
지원되는 언어 | 세부 정보 |
---|---|
|
미국(-us), 오스트레일리아(-au), 캐나다(-ca), 영국(-gb), 인도(-in) |
|
스페인(ES) |
|
독일(DE) |
|
프랑스(FR) |
|
이탈리아(IT) |
|
포르투갈(-pt), 브라질(-br) |
|
네덜란드(DE) |
미리 빌드된 ID 문서
이 기술은 현재 미국 운전면허 및 국제 여권의 인적 사항 페이지에 사용할 수 있습니다(비자 및 기타 여행 문서 제외).