Delen via


Vereisten en beperkingen voor modellen in Microsoft Syntex

Van toepassing op: ✓ Alle aangepaste modellen | ✓ Alle vooraf gemaakte modellen

Met Microsoft Syntex kunt u aangepaste modellen en vooraf gemaakte modellen maken. Afhankelijk van het type model dat u kiest, kunnen er verschillende vereisten zijn, zoals bestandstype en grootte, talen die moeten worden ondersteund, geografische overwegingen en andere factoren die u helpen bepalen welk type model u wilt gebruiken.

Aangepaste modellen:

Vooraf gemaakte modellen:

Aangepaste modellen

Ongestructureerde documentverwerking

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls en .xlsx ( formules in .xls- en .xlsx-bestanden worden niet uitgevoerd).
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt alle latijnse talen, waaronder: Engels, Frans, Duits, Italiaans en Spaans.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Als uw .pdf bestanden met een wachtwoord zijn vergrendeld, moet u de vergrendeling verwijderen voordat u ze indient.
- De gecombineerde bestandsgrootte van de documenten die worden gebruikt voor training per verzameling mag niet groter zijn dan 50 MB en PDF-documenten mogen niet meer dan 500 pagina's bevatten.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. Afbeeldingen die erg breed zijn of bijzondere afmetingen hebben (bijvoorbeeld bouwtekeningen), worden mogelijk afgekapt tijdens het OCR-proces en worden mogelijk minder nauwkeurig.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- Bij het scannen van papieren documenten moeten scans afbeeldingen van hoge kwaliteit zijn.
- Moet het Latijnse alfabet (Engelse tekens) gebruiken.
Let op de volgende verschillen tussen Microsoft Office-tekstbestanden en OCR-gescande bestanden (.pdf, afbeelding of .tiff):
- Alle bestanden: afgekapt met 64.000 tekens (in training en wanneer uitgevoerd op bestanden in een documentbibliotheek).
- OCR-gescande bestanden: er is een limiet van 500 pagina's. Alleen PDF- en afbeeldingsbestandstypen worden verwerkt door OCR.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Documentverwerking in vrije vorm

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: zie vereisten voor bestandstypen.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt de volgende talen: zie Model voor algemene documenten.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste op documenten die aan deze vereisten voldoen.
Bandbreedte-/efficiëntiesymbool. Optimalisatietips
Als uw model niet presteert zoals u wilt, voert u deze stappen uit om de prestaties van uw model te verbeteren.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Bloksymbool. Aangepaste Power Platform-omgevingen
Als u een aangepaste omgeving (in plaats van de standaardomgeving) gebruikt voor Power Platform-verwerking, zijn er aanvullende installatievereisten. Zie Aangepaste Power Platform-omgevingen voor meer informatie.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model. U kunt slechts één vrije vorm of één gestructureerd model per bibliotheek hebben.

Gestructureerde documentverwerking

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: zie vereisten voor bestandstypen.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt de volgende talen: zie Model voor documenten met vaste sjablonen.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste op documenten die aan deze vereisten voldoen.
Bandbreedte-/efficiëntiesymbool. Optimalisatietips
Als uw model niet presteert zoals u wilt, voert u deze stappen uit om de prestaties van uw model te verbeteren.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Bloksymbool. Aangepaste Power Platform-omgevingen
Als u een aangepaste omgeving (in plaats van de standaardomgeving) gebruikt voor Power Platform-verwerking, zijn er aanvullende installatievereisten. Zie Aangepaste Power Platform-omgevingen voor meer informatie.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model. U kunt slechts één vrije vorm of één gestructureerd model per bibliotheek hebben.

Vooraf gebouwde modellen

Contractverwerking

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt alleen Engelse contracten.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Factuurverwerking

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt facturen in het Engels, Spaans, Duits, Frans, Italiaans, Portugees en Nederlands.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Ontvangstbevestiging verwerken

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt ontvangstbewijzen in het Engels, Croation, Tsjechisch, Deens, Nederlands, Fins, Duits, Hongaars, Italiaans, Japans, Lets, Litouws, Noors, Portugees, Spaans, Zweeds en Vietnamees.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Verwerking van gevoelige informatie

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls en .xlsx.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt de volgende talen: zie ondersteunde talen.
Dit model ondersteunt ook talen voor zowel handgeschreven tekst als afdruktekst.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Ondersteunt talen voor zowel handgeschreven tekst als afdruktekst.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.