Поддержка языка: пользовательские модели
Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: версия 3.1 (GA) версии 3.0 (GA) версии 2.1 (GA)
Это содержимое относится к: версия 3.1 (GA) | Последняя версия: версия 4.0 (предварительная версия) | Предыдущие версии: версии 3.0 версии 2.1
Это содержимое относится к: версия 3.0 (GA) | Последние версии: v4.0 (предварительная версия) версии 3.1 | Предыдущая версия: версия 2.1
Это содержимое относится к: версия 2.1 Последняя версия: версия 4.0 (предварительная версия) |
Модели аналитики документов Azure обеспечивают поддержку многоязычной обработки документов. Возможности поддержки языка позволяют пользователям взаимодействовать с вашими приложениями естественными способами и обеспечивать глобальную пропаганду. Пользовательские модели обучены с помощью помеченных наборов данных для извлечения отдельных данных из структурированных, полуструктурированных и неструктурированных документов, относящихся к вашим вариантам использования. Изолированные настраиваемые модели можно объединять для создания составных моделей. В следующих таблицах перечислены доступные языковые стандарты и поддержка по модели и функции:
Настраиваемый классификатор
Язык — код языкового стандарта | По умолчанию. |
---|---|
Английский (США) — en-US | Английский (США) — en-US |
Язык | Код (необязательно) |
---|---|
Африкаанс | af |
Албанский | sq |
Арабский | ar |
Болгарский | bg |
Китайский (Хан (упрощенный вариант)) | zh-Hans |
Китайский (Хан (традиционный вариант)) | zh-Hant |
Хорватский | hr |
Чешский | cs |
датский | da |
Голландский | nl |
Эстонский | et |
Финский | fi |
французский | fr |
немецкий | de |
Иврит | he |
Хинди | hi |
Венгерский | hu |
Индонезийский | id |
Итальянский | it |
Японский | ja |
Корейский | ko |
Латышский | lv |
Литовский | lt |
Macedonian | mk |
Маратхи | mr |
Современный греческий (1453-) | el |
Непали (макролангуаж) | ne |
Норвежский | no |
Панджаби | pa |
Персидский | fa |
Польский | pl |
Португальский | pt |
Румынский | rm |
Русский | ru |
Словацкий | sk |
Словенский | sl |
Сомали (арабское письмо) | so |
Сомалийский (латиница) | so-latn |
Испанский | es |
Swahili (macrolanguage) | sw |
Шведский | sv |
Тамильский | ta |
Тайский | th |
Турецкий | tr |
Украинский | uk |
Урду | ur |
Вьетнамский | vi |
Настраиваемый генерированный
Настраиваемое создание поддерживает только английский en
Настраиваемая нейронная модель
В следующей таблице перечислены поддерживаемые языки для печатного текста.
Язык | Код (необязательно) |
---|---|
Африкаанс | af |
Албанский | sq |
Арабский | ar |
Болгарский | bg |
китайский (упрощенный) | zh-Hans |
китайский (традиционный) | zh-Hant |
Хорватский | hr |
Чешский | cs |
датский | da |
Голландский | nl |
Английский | en |
Эстонский | et |
Финский | fi |
французский | fr |
немецкий | de |
Иврит | he |
Хинди | hi |
Венгерский | hu |
Индонезийский | id |
Итальянский | it |
Японский | ja |
Корейский | ko |
Латышский | lv |
Литовский | lt |
Macedonian | mk |
Маратхи | mr |
Современный греческий (1453-) | el |
Непали (макролангуаж) | ne |
Норвежский | no |
Панджаби | pa |
Персидский | fa |
Польский | pl |
Португальский | pt |
Румынский | rm |
Русский | ru |
Словацкий | sk |
Словенский | sl |
Сомали (арабское письмо) | so |
Сомалийский (латиница) | so-latn |
Испанский | es |
Swahili (macrolanguage) | sw |
Шведский | sv |
Тамильский | ta |
Тайский | th |
Турецкий | tr |
Украинский | uk |
Урду | ur |
Вьетнамский | vi |
Пользовательский шаблон
В следующей таблице перечислены поддерживаемые языки для печатного текста.
Язык | Код (необязательно) |
---|---|
Абазинский | abq |
Абхазский | ab |
Ачинский | туз |
Аколи | ach |
Adangme | ada |
Адыгейский | ady |
Афар | aa |
Африкаанс | af |
Акан | ak |
Албанский | sq |
Алгонкин | alq |
Ангика (Деванагари) | anp |
Арабский | ar |
Астурийский | Аст |
Асу (Танзания) | asa |
Аварич | av |
Авадхи хинди (Деванагари) | awa |
Аймара | ay |
Азербайджанская (латиница) | az |
Бафия | ksf |
Багхели | bfy |
Бамбара | репер |
Башкирский | ba |
Баскский | eu |
Белорусский (кириллица) | be, be-cyrl |
Белорусский (латиница) | be, be-latn |
Бемба (Замбия) | bem |
Бена (Танзания) | bez |
Бходжпури хинди (Деванагари) | bho |
Бикольский | bik |
Бини | bin |
Бислама | дву |
Бодо (Деванагари) | brx |
Боснийский (латиница) | bs |
Браджбха | bra |
Бретонский | br |
Болгарский | bg |
Бундели | bns |
Бурятский (кириллица) | bua |
Каталанский | ca |
Cebuano | ceb |
Чамлинг | Раб |
Чаморро | ch |
Чеченский | ce |
Чхаттисгархи (Деванагари) | hne |
Чига | cgg |
китайский (упрощенный) | zh-Hans |
китайский (традиционный) | zh-Hant |
Чоктав | Чо |
Чукотка | ckt |
Чувашский | резюме |
Корнский | kw |
Корсиканский | co |
Кри | cr |
Ручей | mus |
Крымско-татарский (латиница) | crh |
Хорватский | ч |
Ворона | cro |
чешский | cs |
датский | da |
Даргва | dar |
Дари | prs |
Дхималь (Деванагари) | dhi |
Догри (Деванагари) | Дой |
Дуала | dua |
Дунганский | dng |
Нидерландский | nl |
Эфик | efi |
Английский | en |
Ерзянский (кириллица) | myv |
Эстонский | et |
Фарерский | fo |
Фиджи | fj |
Филиппинский | fil |
Финский | fi |
Язык | Код (необязательно) |
---|---|
Фон | фон |
французский | fr |
Фриульский | fur |
отрасль | gaa |
Гагаузский (латиница) | кляп |
Галисийский | gl |
Ганда | lg |
Гейо | гей |
немецкий | de |
Кирибати | Гил |
Гонди (Деванагари) | гон |
Греческий | el |
Гренландский | kl |
Гуарани | gn |
Гурунг (Деванагари) | gvr |
Gusii | guz |
Гаитянский креольский | ht |
Халби (Деванагари) | hlb |
Хани | hni |
Харьянви | bgc |
Гавайская | haw |
Иврит | he |
Гереро | Гц |
Хилигайнон | hil |
Хинди | hi |
Хмонг дау (латиница) | mww |
Хо (Деванагири) | нерегламентированно |
венгерский | hu |
Iban | Мба |
Исландский | - |
Игбо | ig |
Илоко | Мот |
Инари-саамский | smn |
Индонезийский | id |
Ингушский | inh |
Интерлингва | ia |
Inuktitut (латиница) | iu |
Ирландский | ga |
Итальянский | it |
Японский | ja |
Яунсари (Деванагари) | Jns |
Яванский | jv |
Jola-Fonyi | dyo |
Кабардино-черкесский | kbd |
Кабувердьяну | Кеа |
Качинский (латиница) | kac |
Kalenjin | kln |
Калмыцкий | xal |
Кангри (Деванагари) | xnr |
Канури | Кр |
Карачаево-балкарский | krc |
Каракалпакский (кириллица) | kaa-cyrl |
Каракалпакский (латиница) | kaa |
Кашубский | csb |
Казахский (кириллица) | kk-cyrl |
Казахский (латиница) | kk-latn |
Хакасский | kjh |
Халинг | klr |
Кхаси | Ха |
K'iche' | quc |
Кикуйю | Ки |
Килдин Сами | sjd |
Киньяруанда | rw |
Коми | kv |
Конго | кг |
Корейский | ko |
Корку | kfq |
Корякский | kpy |
Косяэ | Кос |
Kpelle | kpe |
Kuanyama | Кдж |
Кумыкский (кириллица) | Кум |
Курдский (арабский) | ku-arab |
Курдский (латиница) | ku-latn |
Курух (Деванагири) | Кру |
Киргизский (кириллица) | ky |
Лак | lbe |
Лакота | lkt |
Язык | Код (необязательно) |
---|---|
Латинская | la |
Латышский | lv |
Лезгиан | lex |
Лингала | ln |
Литовский | lt |
Нижнелужицкий | dsb |
Лози | loz |
Луле-саамский | smj |
Луо (Кения и Танзания) | луо |
Люксембургский | фунт |
Луия | luy |
Macedonian | mk |
Machame | jmc |
Мадурезе | сумасшедший |
Махасу пахари (Деванагари) | bfz |
Макхува-Встреча | mgh |
Маконде | kde |
Малагасийский | mg |
Малайский (латиница) | мс |
Мальтийский | mt |
Малто (Деванагари) | kmj |
Мандинка | mnk |
Мэнский | gv |
Маори | mi |
Mapudungun | arn |
Маратхи | mr |
Мари (Россия) | chm |
Масаи | mas |
Менде (Сьерра-Леоне) | мужчины |
Меру | Мер |
Мета' | mgo |
Минангкабау | мин |
Индеец-могавк | Мз |
Монгольский (кириллица) | mn |
Mongondow | mog |
Черногорский (кириллица) | cnr-cyrl |
Черногорский (латиница) | cnr-latn |
Морисен | MFE |
Манданг | mua |
Науатль | Нет |
Навахо | nv |
Ndonga | нг |
Неаполитанский | вздремнуть |
Непальский | ne |
Нгомба | jgo |
Ниуэ | niu |
Ногайский | Ног |
Северная Ндебеле | nd |
Северносаамский (латиница) | Мсп |
Норвежский | no |
Ньянджа | ny |
Nyankole | nyn |
Nzima | nzi |
Окситанский | oc |
Ojibwa | oj |
Оромо | om |
Осетинский | os |
Пампанга | Пэм |
Пангасинан | Паг |
Папьяменто | прыщ |
Пушту | ps |
Педи | nso |
Персидский | fa |
Польский | pl |
Португальский | pt |
Пенджаби (арабский) | pa |
Кечуа | qu |
Рипуарский | ksh |
Румынский | ro |
Ретороманский | rm |
Рунди | rn |
русский | ru |
Рв | rwk |
Садри (Деванагари) | sck |
Саха | sah |
Самбуру | saq |
Самоанский (латиница) | sm |
Санго | Sg |
Язык | Код (необязательно) |
---|---|
Сангу (Габон) | snq |
Санскрит (Деванагари) | sa |
Сантали (Деванагири) | сб |
Шотландский | SCO |
Гэльский | gd |
Сена | она |
Сербский (кириллица) | sr-cyrl |
Сербский (латиница) | sr, sr-latn |
Шамбала | ksb |
Шона | sn |
Siksika | Бла |
Сирмаури (Деванагари) | srx |
Колтта-саамский | sms |
Словацкий | sk |
Словенский | sl |
Сога | xog |
Сомали (арабское письмо) | SQL |
Сомалийский (латиница) | so-latn |
Сонхай | son |
Южная Ндебеле | nr |
Южный Алтайский | alt |
Южносаамский | sma |
Сесото | st |
Испанский | es |
Sundanese | su |
Суахили (латиница) | sw |
Свати | ss |
Шведский | sv |
Табассаран | TAB |
Тачелхит | shi |
Таитянский | ty |
Тайта | dav |
Таджикский (кириллица) | tg |
Тамильский | ta |
Татарский (кириллица) | tt-cyrl |
Татарский (латиница) | tt |
Teso | teo |
Тетум | tet |
Тайский | th |
Тхангми | thf |
Ток-писин | tpi |
Тонганский | до |
Тсонга | ts |
Тсвана | tn |
Турецкий | tr |
Туркменский (латиница) | tk |
Тувинский | tyv |
Удмуртский | udm |
Уйгур (кириллица) | ug-cyrl |
Украинский | uk |
Верхнелужицкий | hsb |
Урду | ur |
Уйгурский (арабское письмо) | ug |
Узбекский (арабское письмо) | uz-arab |
Узбекский (кириллица) | uz-cyrl |
Узбекский (латиница) | uz |
Вьетнамский | vi |
Волапюк | vo |
Vunjo | vun |
Валлисский | wae |
Валлийский | cy |
Западнофризский | fy |
Волоф | wo |
Коса | xh |
Юкатекский майя | yua |
Запотек | zap |
Зарма | dje |
Чжуанский | za |
Зулусский | zu |