Requisitos e limitações para modelos no Microsoft Syntex
Aplica-se a: ✓ Todos os modelos personalizados | ✓ Todos os modelos pré-criados
O Microsoft Syntex permite-lhe criar modelos personalizados e modelos pré-criados. Consoante o tipo de modelo que escolher, poderão existir diferentes requisitos, como o tipo e o tamanho do ficheiro, idiomas que têm de ser suportados, considerações geográficas e outros fatores que o ajudarão a decidir que tipo de modelo utilizar.
Modelos personalizados:
- Processamento de documentos não estruturados
- Processamento de documentos de forma livre
- Processamento de documentos estruturados
Modelos pré-criados:
- Processamento de contratos
- Processamento de faturas
- Processamento de recibos
- Processamento de informações confidenciais
Modelos personalizados
Processamento de documentos não estruturados
Ícone | Descrição |
---|---|
Tipos de arquivos compatíveis Este modelo suporta os seguintes tipos de ficheiro: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls e .xlsx ( as fórmulas nos ficheiros .xls e .xlsx não são executadas). |
|
Idiomas compatíveis Este modelo suporta todos os idiomas baseados no latim, incluindo: inglês, francês, alemão, italiano e espanhol. |
|
Considerações sobre o OCR Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que atendem aos seguintes requisitos: - Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres. - Se os seus ficheiros de .pdf estiverem bloqueados por palavra-passe, tem de remover o bloqueio antes de os submeter. - O tamanho de ficheiro combinado dos documentos utilizados para preparação por coleção não pode exceder os 50 MB e os documentos PDF não devem ter mais de 500 páginas. - Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis. Imagens muito largas ou com dimensões ímpares (por exemplo, plantas terrárias) podem ficar truncadas no processo de OCR e perder precisão. - Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores. - Se forem analisadas a partir de documentos em papel, as análises devem ser imagens de alta qualidade. - Tem de utilizar o alfabeto latino (carateres em inglês). Tenha em atenção as seguintes diferenças sobre ficheiros baseados em texto do Microsoft Office e ficheiros analisados pelo OCR (.pdf, imagem ou .tiff): - Todos os ficheiros: truncados com 64 000 carateres (em preparação e quando executados em ficheiros numa biblioteca de documentos). - Ficheiros analisados pelo OCR: existe um limite de 500 páginas. Apenas os tipos de ficheiros pdf e de imagem são processados pelo OCR. |
|
Ambientes Multi-Geo Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft. |
|
Bibliotecas de vários modelos Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. |
Processamento de documentos de forma livre
Ícone | Descrição |
---|---|
Tipos de arquivos compatíveis Este modelo suporta os seguintes tipos de ficheiro: ver requisitos de tipo de ficheiro. |
|
Idiomas compatíveis Este modelo suporta os seguintes idiomas: veja Modelo para Documentos gerais. |
|
Considerações sobre o OCR Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem estes requisitos. |
|
Sugestões de otimização Se o modelo não estiver a funcionar como pretende, experimente estes passos para melhorar o desempenho do modelo. |
|
Ambientes Multi-Geo Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft. |
|
Ambientes personalizados do Power Platform Se utilizar um ambiente personalizado (em vez do ambiente predefinido) para o processamento do Power Platform, existem requisitos de configuração adicionais. Para obter mais informações, veja Ambientes personalizados do Power Platform. |
|
Bibliotecas de vários modelos Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. Só pode ter um modelo de forma livre ou um modelo estruturado por biblioteca. |
Processamento de documentos estruturados
Ícone | Descrição |
---|---|
Tipos de arquivos compatíveis Este modelo suporta os seguintes tipos de ficheiro: ver requisitos de tipo de ficheiro. |
|
Idiomas compatíveis Este modelo suporta os seguintes idiomas: veja Modelo para documentos de modelo fixo. |
|
Considerações sobre o OCR Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem estes requisitos. |
|
Sugestões de otimização Se o modelo não estiver a funcionar como pretende, experimente estes passos para melhorar o desempenho do modelo. |
|
Ambientes Multi-Geo Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft. |
|
Ambientes personalizados do Power Platform Se utilizar um ambiente personalizado (em vez do ambiente predefinido) para o processamento do Power Platform, existem requisitos de configuração adicionais. Para obter mais informações, veja Ambientes personalizados do Power Platform. |
|
Bibliotecas de vários modelos Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. Só pode ter um modelo de forma livre ou um modelo estruturado por biblioteca. |
Modelos predefinidos
Processamento de contratos
Ícone | Descrição |
---|---|
Tipos de arquivos compatíveis Este modelo suporta os seguintes tipos de ficheiro: .bmp, .jpeg, .pdf, .png e .tiff. |
|
Idiomas compatíveis Este modelo suporta apenas contratos de idioma em inglês. |
|
Considerações sobre o OCR Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que atendem aos seguintes requisitos: - Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres. - Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas. - O tamanho do ficheiro tem de ser inferior a 50 MB. - Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis. - Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores. - O tamanho total dos dados de preparação é de 500 páginas ou menos. |
|
Ambientes Multi-Geo Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft. |
|
Bibliotecas de vários modelos Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. |
Processamento de faturas
Ícone | Descrição |
---|---|
Tipos de arquivos compatíveis Este modelo suporta os seguintes tipos de ficheiro: .bmp, .jpeg, .pdf, .png e .tiff. |
|
Idiomas compatíveis Este modelo suporta faturas em inglês, espanhol, alemão, francês, italiano, português e neerlandês. |
|
Considerações sobre o OCR Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que atendem aos seguintes requisitos: - Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres. - Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas. - O tamanho do ficheiro tem de ser inferior a 50 MB. - Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis. - Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores. - O tamanho total dos dados de preparação é de 500 páginas ou menos. |
|
Ambientes Multi-Geo Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft. |
|
Bibliotecas de vários modelos Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. |
Processamento de recibos
Ícone | Descrição |
---|---|
Tipos de arquivos compatíveis Este modelo suporta os seguintes tipos de ficheiro: .bmp, .jpeg, .pdf, .png e .tiff. |
|
Idiomas compatíveis Este modelo suporta recibos em inglês, croação, checo, dinamarquês, neerlandês, finlandês, alemão, húngaro, italiano, japonês, letão, lituano, norueguês, português, espanhol, sueco e vietnamita. |
|
Considerações sobre o OCR Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que atendem aos seguintes requisitos: - Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres. - Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas. - O tamanho do ficheiro tem de ser inferior a 50 MB. - Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis. - Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores. - O tamanho total dos dados de preparação é de 500 páginas ou menos. |
|
Ambientes Multi-Geo Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft. |
|
Bibliotecas de vários modelos Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. |
Processamento de informações confidenciais
Ícone | Descrição |
---|---|
Tipos de arquivos compatíveis Este modelo suporta os seguintes tipos de ficheiro: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls e .xlsx. |
|
Idiomas compatíveis Este modelo suporta os seguintes idiomas: veja os idiomas suportados. Este modelo também suporta idiomas para texto manuscrito e texto de impressão. |
|
Considerações sobre o OCR Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que atendem aos seguintes requisitos: - Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres. - Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas. - O tamanho do ficheiro tem de ser inferior a 50 MB. - Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis. - Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores. - O tamanho total dos dados de preparação é de 500 páginas ou menos. Suporta idiomas para texto manuscrito e texto de impressão. |
|
Ambientes Multi-Geo Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft. |
|
Bibliotecas de vários modelos Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. |