Condividi tramite


Supporto linguistico per l'analisi del testo personalizzata per l'integrità

Usare questo articolo per informazioni sulle lingue attualmente supportate da Analisi testuale personalizzata per la salute.

Opzione multilingue

Con Analisi testuale personalizzata per la salute è possibile eseguire il training di un modello in una lingua e usarlo per estrarre entità da documenti diversi. Questa funzionalità consente di creare progetti separati per ogni lingua e di combinare i set di dati in un singolo progetto, semplificando la scalabilità dei progetti in più lingue. È possibile eseguire il training del progetto interamente con documenti in inglese e eseguirne una query in: francese, tedesco, italiano e altri. È possibile abilitare l'opzione multilingue come parte del processo di creazione del progetto o versioni successive tramite le impostazioni del progetto.

Non è previsto aggiungere lo stesso numero di documenti per ogni lingua. È consigliabile creare la maggior parte del progetto in una lingua e aggiungere solo alcuni documenti nelle lingue che si osservano non funzionano correttamente. Se si crea un progetto che è principalmente in inglese e si inizia a testarlo in francese, tedesco e spagnolo, si potrebbe osservare che il tedesco non esegue oltre alle altre due lingue. In tal caso, è consigliabile aggiungere di nuovo il 5% dei documenti in inglese originali in tedesco, eseguire nuovamente il training di un nuovo modello e testare in tedesco. Nella pagina dell'etichettatura dei dati in Language Studio è possibile selezionare la lingua del documento che si sta aggiungendo. Verranno visualizzati risultati migliori per le query tedesche. Più documenti etichettati aggiunti, più probabilmente i risultati saranno migliori. Quando si aggiungono dati in un'altra lingua, non è consigliabile che influisca negativamente su altre lingue.

L'ebraico non è supportato nei progetti multilingue. Se la lingua primaria del progetto è ebraico, non sarà possibile aggiungere dati di training in altre lingue o eseguire query sul modello con altre lingue. Analogamente, se la lingua primaria del progetto non è ebraico, non sarà possibile aggiungere dati di training in ebraico o eseguire query sul modello in ebraico.

Lingue supportate

Le Analisi del testo personalizzate per l'integrità supportano .txt i file nelle lingue seguenti:

Linguaggio Codice lingua
Inglese en
Francese fr
Tedesco de
Spagnolo es
Italiano it
Portoghese (Portogallo) pt-pt
Ebraico he

Passaggi successivi