Vereisten en beperkingen voor modellen in Microsoft Syntex

Artikel
08/16/2024

^{Van toepassing op: ✓ Alle aangepaste modellen | ✓ Alle vooraf gemaakte modellen}

Met Microsoft Syntex kunt u aangepaste modellen en vooraf gemaakte modellen maken. Afhankelijk van het type model dat u kiest, kunnen er verschillende vereisten zijn, zoals bestandstype en grootte, talen die moeten worden ondersteund, geografische overwegingen en andere factoren die u helpen bepalen welk type model u wilt gebruiken.

Aangepaste modellen:

Ongestructureerde documentverwerking
Documentverwerking in vrije vorm
Gestructureerde documentverwerking

Vooraf gemaakte modellen:

Contractverwerking
Factuurverwerking
Ontvangstbevestiging verwerken
Verwerking van gevoelige informatie

Aangepaste modellen

Ongestructureerde documentverwerking

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls en .xlsx ( formules in .xls- en .xlsx-bestanden worden niet uitgevoerd).
	Ondersteunde talen Dit model ondersteunt alle latijnse talen, waaronder: Engels, Frans, Duits, Italiaans en Spaans.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Als uw .pdf bestanden met een wachtwoord zijn vergrendeld, moet u de vergrendeling verwijderen voordat u ze indient. - De gecombineerde bestandsgrootte van de documenten die worden gebruikt voor training per verzameling mag niet groter zijn dan 50 MB en PDF-documenten mogen niet meer dan 500 pagina's bevatten. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. Afbeeldingen die erg breed zijn of bijzondere afmetingen hebben (bijvoorbeeld bouwtekeningen), worden mogelijk afgekapt tijdens het OCR-proces en worden mogelijk minder nauwkeurig. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - Bij het scannen van papieren documenten moeten scans afbeeldingen van hoge kwaliteit zijn. - Moet het Latijnse alfabet (Engelse tekens) gebruiken. Let op de volgende verschillen tussen Microsoft Office-tekstbestanden en OCR-gescande bestanden (.pdf, afbeelding of .tiff): - Alle bestanden: afgekapt met 64.000 tekens (in training en wanneer uitgevoerd op bestanden in een documentbibliotheek). - OCR-gescande bestanden: er is een limiet van 500 pagina's. Alleen PDF- en afbeeldingsbestandstypen worden verwerkt door OCR.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Documentverwerking in vrije vorm

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: zie vereisten voor bestandstypen.
	Ondersteunde talen Dit model ondersteunt de volgende talen: zie Model voor algemene documenten.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste op documenten die aan deze vereisten voldoen.
	Optimalisatietips Als uw model niet presteert zoals u wilt, voert u deze stappen uit om de prestaties van uw model te verbeteren.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Aangepaste Power Platform-omgevingen Als u een aangepaste omgeving (in plaats van de standaardomgeving) gebruikt voor Power Platform-verwerking, zijn er aanvullende installatievereisten. Zie Aangepaste Power Platform-omgevingen voor meer informatie.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model. U kunt slechts één vrije vorm of één gestructureerd model per bibliotheek hebben.

Gestructureerde documentverwerking

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: zie vereisten voor bestandstypen.
	Ondersteunde talen Dit model ondersteunt de volgende talen: zie Model voor documenten met vaste sjablonen.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste op documenten die aan deze vereisten voldoen.
	Optimalisatietips Als uw model niet presteert zoals u wilt, voert u deze stappen uit om de prestaties van uw model te verbeteren.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Aangepaste Power Platform-omgevingen Als u een aangepaste omgeving (in plaats van de standaardomgeving) gebruikt voor Power Platform-verwerking, zijn er aanvullende installatievereisten. Zie Aangepaste Power Platform-omgevingen voor meer informatie.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model. U kunt slechts één vrije vorm of één gestructureerd model per bibliotheek hebben.

Vooraf gebouwde modellen

Contractverwerking

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
	Ondersteunde talen Dit model ondersteunt alleen Engelse contracten.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Factuurverwerking

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
	Ondersteunde talen Dit model ondersteunt facturen in het Engels, Spaans, Duits, Frans, Italiaans, Portugees en Nederlands.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Ontvangstbevestiging verwerken

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
	Ondersteunde talen Dit model ondersteunt ontvangstbewijzen in het Engels, Croation, Tsjechisch, Deens, Nederlands, Fins, Duits, Hongaars, Italiaans, Japans, Lets, Litouws, Noors, Portugees, Spaans, Zweeds en Vietnamees.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Verwerking van gevoelige informatie

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls en .xlsx.
	Ondersteunde talen Dit model ondersteunt de volgende talen: zie ondersteunde talen. Dit model ondersteunt ook talen voor zowel handgeschreven tekst als afdruktekst.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder. Ondersteunt talen voor zowel handgeschreven tekst als afdruktekst.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Delen via