Krav och begränsningar för modeller i Microsoft Syntex

Artikel
01/30/2024

^{Gäller för: ✔ Alla anpassade modeller | ✔ Alla fördefinierade modeller}

Microsoft Syntex kan du skapa anpassade modeller och fördefinierade modeller. Beroende på vilken typ av modell du väljer kan det finnas olika krav, till exempel filtyp och storlek, språk som måste stödjas, geografiska överväganden och andra faktorer som hjälper dig att avgöra vilken typ av modell som ska användas.

Anpassade modeller:

Ostrukturerad dokumentbearbetning
Bearbetning av frihandsfigurdokument
Strukturerad dokumentbearbetning

Fördefinierade modeller:

Kontraktsbearbetning
Bearbetning av faktura
Bearbetning av kvitto

Anpassade modeller

Ostrukturerad dokumentbearbetning

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls och .xlsx ( formler i .xls och .xlsx filer körs inte).
	Språk som stöds Den här modellen stöder följande språk: se språk som stöds.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. – Om dina .pdf filer är lösenordslåsta måste du ta bort låset innan du skickar dem. – Den kombinerade filstorleken för de dokument som används för träning per samling får inte överstiga 50 MB och PDF-dokument får inte ha fler än 500 sidor. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. Bilder som är mycket breda eller har udda mått (t.ex. planritningar) kan trunkeras i OCR-processen och förlora precision. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. - Om skannas från pappersdokument, ska genomsökningar vara högkvalitativa bilder. - Måste använda det latinska alfabetet (engelska tecken). Observera följande skillnader om textbaserade filer i Microsoft Office och OCR-skannade filer (.pdf, bild eller .tiff): – Alla filer: Trunkerade med 64 000 tecken (i träning och när de körs mot filer i ett dokumentbibliotek). – OCR-skannade filer: Det finns en gräns på 500 sidor. Endast PDF- och bildfiltyper bearbetas av OCR.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.

Bearbetning av frihandsfigurdokument

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: se filtypskrav.
	Språk som stöds Den här modellen stöder följande språk: se språk som stöds.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetning fungerar bäst på dokument som uppfyller dessa krav.
	Optimeringstips Om din modell inte fungerar som du vill kan du prova de här stegen för att förbättra modellens prestanda.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Anpassade Power Platform-miljöer Om du använder en anpassad miljö (i stället för standardmiljön) för Power Platform-bearbetning finns det ytterligare konfigurationskrav. Mer information finns i Anpassade Power Platform-miljöer.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen. Du kan bara ha en frihandsfigur eller en strukturerad modell per bibliotek.

Strukturerad dokumentbearbetning

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: se filtypskrav.
	Språk som stöds Den här modellen stöder följande språk: se språk som stöds.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetning fungerar bäst på dokument som uppfyller dessa krav.
	Optimeringstips Om din modell inte fungerar som du vill kan du prova de här stegen för att förbättra modellens prestanda.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Anpassade Power Platform-miljöer Om du använder en anpassad miljö (i stället för standardmiljön) för Power Platform-bearbetning finns det ytterligare konfigurationskrav. Mer information finns i Anpassade Power Platform-miljöer.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen. Du kan bara ha en frihandsfigur eller en strukturerad modell per bibliotek.

Fördefinierade modeller

Kontraktsbearbetning

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .bmp, .jpeg, .pdf, .png och .tiff.
	Språk som stöds Den här modellen stöder endast engelskspråkiga kontrakt.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. - För .pdf och .tiff filer kan upp till 2 000 sidor bearbetas. – Filstorleken måste vara mindre än 50 MB. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. – Den totala storleken på träningsdata är 500 sidor eller mindre.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.

Bearbetning av faktura

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .bmp, .jpeg, .pdf, .png och .tiff.
	Språk som stöds Den här modellen stöder fakturor på engelska, spanska, tyska, franska, italienska, portugisiska och nederländska.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. - För .pdf och .tiff filer kan upp till 2 000 sidor bearbetas. – Filstorleken måste vara mindre än 50 MB. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. – Den totala storleken på träningsdata är 500 sidor eller mindre.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.

Bearbetning av kvitto

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .bmp, .jpeg, .pdf, .png och .tiff.
	Språk som stöds Den här modellen stöder försäljning på engelska, croation, tjeckiska, danska, nederländska, finska, tyska, ungerska, italienska, japanska, lettiska, litauiska, norska, portugisiska, spanska, svenska och vietnamesiska.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. - För .pdf och .tiff filer kan upp till 2 000 sidor bearbetas. – Filstorleken måste vara mindre än 50 MB. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. – Den totala storleken på träningsdata är 500 sidor eller mindre.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.