Sprachunterstützung: benutzerdefinierte Modelle

Artikel
03/08/2024

Dieser Inhalt gilt für:v4.0 (Vorschau) | Vorherige Versionen:v3.1 (GA)v3.0 (GA)v2.1 (GA)

Dieser Inhalt gilt für:v3.1 (GA) | Aktuelle Version:v4.0 (Vorschau) | Vorherige Versionen:v3.0v2.1

Dieser Inhalt gilt für:v3.0 (GA) | Aktuelle Versionen:v4.0 (Vorschau)v3.1 | Vorherige Version:v2.1

Dieser Inhalt gilt für:v2.1 | Neueste Version:v4.0 (Vorschau)

Azure KI Dokument Intelligenz-Modelle bieten Unterstützung für mehrsprachige Dokumentverarbeitung. Unsere Sprachunterstützungsfunktionen ermöglichen es Ihren Benutzern, auf natürliche Weise mit Ihren Anwendungen zu kommunizieren und die globale Reichweite zu erhöhen. Benutzerdefinierte Modelle werden mithilfe Ihrer beschrifteten Datasets trainiert, um unterschiedliche Daten aus strukturierten, halbstrukturierten und unstrukturierten Formularen und Dokumenten zu extrahieren, die für Ihre Anwendungsfälle spezifisch sind. Eigenständige benutzerdefinierte Modelle können kombiniert werden, um zusammengestellte Modelle zu erstellen. Die folgenden Tabellen enthalten die verfügbare Sprach- und Gebietsschemaunterstützung nach Modell und Feature:

Benutzerdefinierter Klassifizierer

Sprache – Gebietsschemacode	Standard
Englisch (USA) – en-US	Englisch (USA) – en-US

Sprache	Code (optional)
Afrikaans	`af`
Albanisch	`sq`
Arabisch	`ar`
Bulgarisch	`bg`
Chinesisch (Han (vereinfachte Variante))	`zh-Hans`
Chinesisch (Han (traditionelle Variante))	`zh-Hant`
Kroatisch	`hr`
Tschechisch	`cs`
Dänisch	`da`
Niederländisch	`nl`
Estnisch	`et`
Finnisch	`fi`
Französisch	`fr`
Deutsch	`de`
Hebräisch	`he`
Hindi	`hi`
Ungarisch	`hu`
Indonesisch	`id`
Italienisch	`it`
Japanisch	`ja`
Koreanisch	`ko`
Lettisch	`lv`
Litauisch	`lt`
Mazedonisch	`mk`
Marathi	`mr`
Neugriechisch (1453-)	`el`
Nepali (Makrosprache)	`ne`
Norwegisch	`no`
Panjabi	`pa`
Persisch	`fa`
Polnisch	`pl`
Portugiesisch	`pt`
Rumänisch	`rm`
Russisch	`ru`
Slowakisch	`sk`
Slowenisch	`sl`
Somali (Arabisch)	`so`
Somali (Lateinische Schrift)	`so-latn`
Spanisch	`es`
Swahili (Makrosprache)	`sw`
Schwedisch	`sv`
Tamilisch	`ta`
Thailändisch	`th`
Türkisch	`tr`
Ukrainisch	`uk`
Urdu	`ur`
Vietnamesisch	`vi`

In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.

Sprache	Code (optional)
Afrikaans	`af`
Albanisch	`sq`
Arabisch	`ar`
Bulgarisch	`bg`
Chinesisch (vereinfacht)	`zh-Hans`
Chinesisch (traditionell)	`zh-Hant`
Kroatisch	`hr`
Tschechisch	`cs`
Dänisch	`da`
Niederländisch	`nl`
Estnisch	`et`
Finnisch	`fi`
Französisch	`fr`
Deutsch	`de`
Hebräisch	`he`
Hindi	`hi`
Ungarisch	`hu`
Indonesisch	`id`
Italienisch	`it`
Japanisch	`ja`
Koreanisch	`ko`
Lettisch	`lv`
Litauisch	`lt`
Mazedonisch	`mk`
Marathi	`mr`
Neugriechisch (1453-)	`el`
Nepali (Makrosprache)	`ne`
Norwegisch	`no`
Panjabi	`pa`
Persisch	`fa`
Polnisch	`pl`
Portugiesisch	`pt`
Rumänisch	`rm`
Russisch	`ru`
Slowakisch	`sk`
Slowenisch	`sl`
Somali (Arabisch)	`so`
Somali (Lateinische Schrift)	`so-latn`
Spanisch	`es`
Swahili (Makrosprache)	`sw`
Schwedisch	`sv`
Tamilisch	`ta`
Thailändisch	`th`
Türkisch	`tr`
Ukrainisch	`uk`
Urdu	`ur`
Vietnamesisch	`vi`

In der folgenden Tabelle sind die unterstützten Sprachen für das Extrahieren handschriftlicher Texte aufgeführt.

Sprache	Sprachcode (optional)	Sprache	Sprachcode (optional)
Englisch	`en`	Japanisch	`ja`
Chinesisch (vereinfacht)	`zh-Hans`	Koreanisch	`ko`
Französisch	`fr`	Portugiesisch	`pt`
Deutsch	`de`	Spanisch	`es`
Italienisch	`it`

Neuronale Modelle unterstützen hinzugefügte Sprachen in v3.1 und späteren APIs.

Sprachen	API-Version
Englisch	`v4.0:2024-02-29-preview, 2023-10-31-preview`, `v3.1:2023-07-31 (GA)`, `v3.0:2022-08-31 (GA)`
Deutsch	`v4.0:2024-02-29-preview, 2023-10-31-preview`, `v3.1:2023-07-31 (GA)`
Italienisch	`v4.0:2024-02-29-preview, 2023-10-31-preview`, `v3.1:2023-07-31 (GA)`
Französisch	`v4.0:2024-02-29-preview, 2023-10-31-preview`, `v3.1:2023-07-31 (GA)`
Spanisch	`v4.0:2024-02-29-preview, 2023-10-31-preview`, `v3.1:2023-07-31 (GA)`
Niederländisch	`v4.0:2024-02-29-preview, 2023-10-31-preview`, `v3.1:2023-07-31 (GA)`

Benutzerdefiniertes Vorlagenmodell

Gedruckt
Handschriftlich

In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.

Sprache	Code (optional)
Abasisch	abq
Abchasische Sprache	ab
Achinesisch	ace
Acholi	ach
Adangme	ada
Adygeisch	ady
Afar	aa
Afrikaans	af
Akan	ak
Albanisch	sq
Algonkin	alq
Angika (Devanagari)	anp
Arabisch	ar
Asturisch	ast
Asu (Tansania)	asa
Avar	av
Awadhi-Hindi (Devanagari)	awa
Aymara	ay
Aserbaidschanisch (Lateinisch)	az
Bafia	ksf
Bagheli	bfy
Bambara	bm
Baschkirisch	ba
Baskisch	eu
Belarussisch (Kyrillisch)	be, be-cyrl
Belarussisch (Lateinisch)	be, be-latn
Bemba (Sambia)	bem
Bena (Tansania)	bez
Bhojpuri-Hindi (Devanagari)	bho
Bikol	bik
Bini	bin
Bislama	bi
Bodo (Devanagari)	brx
Bosnisch (Lateinisch)	bs
Brajbha	bra
Bretonisch	br
Bulgarisch	bg
Bundeli	bns
Burjatisch (Kyrillisch)	bua
Katalanisch	ca
Cebuano	ceb
Chamling	rab
Chamorro	ch
Tschetschenisch	ce
Chhattisgarhi (Devanagari)	hne
Chiga	cgg
Chinesisch (vereinfacht)	zh-Hans
Chinesisch (traditionell)	zh-Hant
Choctaw	cho
Chukot	ckt
Tschuwaschische	cv
Kornisch	kw
Korsisch	co
Cree	cr
Creek	mus
Krimtatarisch (Lateinisch)	crh
Kroatisch	Std.
Crow	cro
Tschechisch	cs
Dänisch	da
Dargwa	dar
Dari	prs
Dhimal (Devanagari)	dhi
Dogri (Devanagari)	doi
Duala	dua
Dunganisch	dng
Niederländisch	nl
Efik	efi
English	en
Ersjanisch (Kyrillisch)	myv
Estnisch	et
Färöisch	fo
Fidschi	fj
Filipino	fil
Finnisch	fi

Sprache	Code (optional)
Fon	fon
Französisch	fr
Friaulisch	fur
Ga	gaa
Gagausisch (Lateinisch)	gag
Galicisch	gl
Ganda	lg
Gayo	gay
Deutsch	de
Gilbertese	gil
Gondi (Devanagari)	gon
Griechisch	el
Grönländisch	kl
Guaraní	gn
Gurung (Devanagari)	gvr
Gusii	guz
Haitianisches Kreolisch	ht
Halbi (Devanagari)	hlb
Hani	hni
Haryanvi	bgc
Hawaiianisch	haw
Hebräisch	er
Herero	hz
Hiligaynon	hil
Hindi	hi
Hmong Daw (Lateinisch)	mww
Ho (Devanagiri)	hoc
Ungarisch	hu
Iban	iba
Isländisch	stimmt
Igbo	ig
Iloko	ilo
Inari-Samisch	smn
Indonesisch	id
Inguschisch	inh
Interlingual	ia
Inuktitut (Lateinisch)	iu
Irisch	ga
Italienisch	it
Japanisch	ja
Jaunsari (Devanagari)	Jns
Javanisch	jv
Jola-Fonyi	dyo
Kabardinisch	kbd
Kabuverdianu	kea
Kachin (Lateinisch)	kac
Kalenjin	kln
Kalmückisch	xal
Kangri (Devanagari)	xnr
Kanuri	kr
Karatschai-Balkarisch	krc
Karakalpakisch (Kyrillisch)	kaa-cyrl
Karakalpakisch (Lateinisch)	kaa
Kaschubisch	csb
Kasachisch (Kyrillisch)	kk-cyrl
Kasachisch (Lateinisch)	kk-latn
Chakassisch	kjh
Khaling	klr
Khasi	kha
K'iche'	quc
Kikuyu	ki
Kildinsamisch	sjd
Kinyarwanda	rw
Komi	kv
Kikongo	kg
Koreanisch	ko
Korku	kfq
Korjakisch	kpy
Kosraeanisch	kos
Kpelle	kpe
Kuanyama	kj
Kumykisch (Kyrillisch)	kum
Kurdisch (arabisch)	ku-arab
Kurdisch (lateinisch)	ku-latn
Kurukh (Devanagari)	kru
Kirgisisch (Kyrillisch)	ky
Lak	lbe
Lakota	lkt

Sprache	Code (optional)
Lateinisch	la
Lettisch	lv
Lezghian	lex
Lingala	ln
Litauisch	lt
Niedersorbisch	dsb
Lozi	loz
Lule-Samisch	smj
Luo (Kenia und Tansania)	luo
Luxemburgisch	lb
Luhyia	luy
Mazedonisch	mk
Machame	jmc
Maduresisch	mad
Mahasu Pahari (Devanagari)	bfz
Makhuwa-Meetto	mgh
Makonde	kde
Madagassisch	mg
Malaiisch (Lateinisch)	ms
Maltesisch	Mt
Malto (Devanagari)	kmj
Mandinka	mnk
Manx	gv
Maori	mi
Mapudungun	arn
Marathi	mr
Mari (Russland)	chm
Maa	mas
Mende (Sierra Leone)	men (Männer)
Meru	mer
Meta'	mgo
Minangkabau	Min
Mohawk	moh
Mongolisch (Kyrillisch)	mn
Mongondow	mog
Montenegrinisch (Kyrillisch)	cnr-cyrl
Montenegrinisch (Lateinisch)	cnr-latn
Morisyen	mfe
Mundang	mua
Nahuatl	nah
Navajo	nv
Ndonga	ng
Neapolitanisch	nap
Nepalesisch	ne
Ngomba	jgo
Niue	niu
Nogaisch	nog
Nord-Ndebele	nd
Nordsamisch (Lateinisch)	sme
Norwegisch	Nein
Nyanja	ny
Nkore	nyn
Nzima	nzi
Okzitanisch	oc
Ojibwa	oj
Oromo	om
Ossetisch	os
Pampanga	pam
Pangasinensisch	pag
Papiamento	pap
Paschtu	ps
Pedi	nso
Persisch	fa
Polnisch	pl
Portugiesisch (Portugal)	pt
Punjabi (Arabisch)	pa
Quechua	qu
Ripuarisch	ksh
Rumänisch	ro
Rätoromanisch	rm
Rundi	rn
Russisch	ru
Rwa	rwk
Sadri (Devanagari)	sck
Sakha	sah
Samburu	saq
Samoanisch (Lateinisch)	sm
Sango	sg

Sprache	Code (optional)
Sangu (Gabun)	snq
Sanskrit (Devanagari)	sa
Santali (Devanagiri)	sat
Schotten	sco
Schottisch-Gälisch	gd
Sena	seh
Serbisch (Kyrillisch)	sr-cyrl
Serbisch (Lateinisch)	sr, sr-latn
Shambala	ksb
Shona	sn
Siksika	bla
Sirmauri (Devanagari)	srx
Skolt-Samisch	sms
Slowakisch	sk
Slowenisch	sl
Soga	xog
Somali (Arabisch)	SO
Somali (Lateinische Schrift)	so-latn
Songhai	son
Süd-Ndebele	nr
Südliches Altaisch	alt
Südsamisch	sma
Südliches Sotho	st
Spanisch	es
Sundanesisch	su
Suaheli (Lateinisch)	sw
Siswati	ss
Schwedisch	sv
Tabassaran	Tabulatorzeichen
Taschelhit	shi
Tahitisch	ty
Taita	dav
Tadschikisch (Kyrillisch)	tg
Tamilisch	ta
Tatar (Kyrillisch)	tt-cyrl
Tatarisch (Lateinisch)	tt
Teso	teo
Tetum	tet
Thailändisch	th
Thangmi	thf
Tok Pisin	tpi
Tongaisch	Bis
Xitsonga	ts
Setswana	tn
Türkisch	tr
Turkmenisch (Lateinisch)	tk
Tuwinisch	tyv
Udmurtisch	udm
Uigurisch (Kyrillisch)	ug-cyrl
Ukrainisch	uk
Obersorbisch	hsb
Urdu	ur
Uigurisch (Arabisch)	ug
Usbekisch (Arabisch)	uz-arab
Usbekisch (kyrillisch)	uz-cyrl
Usbekisch (Lateinisch)	uz
Vietnamesisch	vi
Volapük	vo
Vunjo	vun
Walser	wae
Walisisch	cy
Westfriesisch	fy
Wolof	wo
Xhosa	xh
Yukatekisches Maya	yua
Zapotekisch	zap
Djerma	dje
Zhuang	za
Zulu	zu

In der folgenden Tabelle sind die unterstützten Sprachen für das Extrahieren handschriftlicher Texte aufgeführt:

Sprache	Sprachcode (optional)	Sprache	Sprachcode (optional)
Englisch	`en`	Japanisch	`ja`
Chinesisch (vereinfacht)	`zh-Hans`	Koreanisch	`ko`
Französisch	`fr`	Portugiesisch	`pt`
Deutsch	`de`	Spanisch	`es`
Italienisch	`it`

Share via

Sprachunterstützung: benutzerdefinierte Modelle

Benutzerdefinierter Klassifizierer

Benutzerdefiniertes neuronales Modell

Benutzerdefiniertes Vorlagenmodell

Zusätzliche Ressourcen