Supporto linguistico per la comprensione del linguaggio di conversazione
Usare questo articolo per informazioni sulle lingue attualmente supportate dalla funzionalità CLU.
Opzione multi linguale
Suggerimento
Vedere Come eseguire il training di un modello per informazioni sulla modalità di training da usare per i progetti multilingue.
Con la comprensione del linguaggio di conversazione, è possibile eseguire il training di un modello in una lingua e usare per stimare finalità ed entità da espressioni in un'altra lingua. Questa funzionalità è potente perché consente di risparmiare tempo e sforzo. Anziché creare progetti separati per ogni lingua, è possibile gestire un set di dati multi linguale in un progetto. Il set di dati non deve essere interamente nella stessa lingua, ma è necessario abilitare l'opzione multi linguale per il progetto durante la creazione o una versione successiva nelle impostazioni del progetto. Se si nota che il modello esegue in modo scarsa in determinate lingue durante il processo di valutazione, è consigliabile aggiungere altri dati in queste lingue al set di training.
È possibile eseguire il training del progetto interamente con espressioni inglesi e eseguirne una query in: francese, tedesco, mandarino, giapponese, coreano e altri. La comprensione del linguaggio di conversazione semplifica la scalabilità dei progetti in più lingue usando la tecnologia multilingue per eseguire il training dei modelli.
Ogni volta che si identifica che una determinata lingua non viene eseguita oltre ad altre lingue, è possibile aggiungere espressioni per tale lingua nel progetto. Nella pagina espressioni tag in Language Studio è possibile selezionare la lingua dell'espressione aggiunta. Quando si introduceno esempi per tale linguaggio al modello, viene introdotta una maggior parte della sintassi di tale linguaggio e si apprenderà a stimarla meglio.
Non è previsto aggiungere lo stesso numero di espressioni per ogni lingua. È consigliabile creare la maggior parte del progetto in una lingua e aggiungere solo alcune espressioni nelle lingue che si osservano non funzionano correttamente. Se si crea un progetto che è principalmente in inglese e si inizia a testarlo in francese, tedesco e spagnolo, si potrebbe osservare che il tedesco non esegue oltre alle altre due lingue. In questo caso, prendere in considerazione l'aggiunta del 5% degli esempi originali in inglese in tedesco, eseguire di nuovo il training di un nuovo modello e test in tedesco. Verranno visualizzati risultati migliori per le query tedesche. Più espressioni aggiunte, più probabilmente i risultati saranno migliori.
Quando si aggiungono dati in un'altra lingua, non è consigliabile che influisca negativamente su altre lingue.
Elencare e predefinito i componenti in più lingue
I progetti con più lingue abilitate consentono di specificare sinonimi per ogni lingua per ogni chiave di elenco. A seconda del linguaggio con cui si esegue una query sul progetto, si otterranno solo corrispondenze per il componente elenco con sinonimi di tale lingua. Quando si esegue una query sul progetto, è possibile specificare la lingua nel corpo della richiesta:
"query": "{query}"
"language": "{language code}"
Se non si fornisce una lingua, verrà restituita la lingua predefinita del progetto.
I componenti predefiniti sono simili, dove si prevede di ottenere stime per i componenti predefiniti disponibili in lingue specifiche. La lingua della richiesta determina di nuovo quali componenti tentano di essere stimati.
Lingue supportate dalla comprensione del linguaggio di conversazione
La comprensione del linguaggio conversazionale supporta espressioni nelle lingue seguenti:
Linguaggio | Codice lingua |
---|---|
Afrikaans | af |
Amharico | am |
Arabo | ar |
Assamese | as |
Azerbaigiano | az |
Bielorusso | be |
Bulgaro | bg |
Bengalese | bn |
Bretone | br |
Bosniaco | bs |
Catalano | ca |
Ceco | cs |
Gallese | cy |
Danese | da |
Tedesco | de |
Greco | el |
Inglese (Stati Uniti) | en-us |
Inglese (Regno Unito) | en-gb |
Esperanto | eo |
Spagnolo | es |
Estone | et |
Basco | eu |
Persiano | fa |
Finlandese | fi |
Francese | fr |
Frisiano occidentale | fy |
Irlandese | ga |
Scozzese Gaelico | gd |
Galiziano | gl |
Gujarati | gu |
Hausa | ha |
Ebraico | he |
Hindi | hi |
Croato | hr |
Ungherese | hu |
Armeno | hy |
Indonesiano | id |
Italiano | it |
Giapponese | ja |
Giavanese | jv |
Georgiano | ka |
Kazako | kk |
Khmer | km |
Kannada | kn |
Coreano | ko |
Curdo (Kurmanji) | ku |
kirghiso | ky |
Latino | la |
Lao | lo |
Lituano | lt |
Lettone | lv |
Malgascio | mg |
Macedone | mk |
Malayalam | ml |
Mongolo | mn |
Marathi | mr |
Malese | ms |
Birmano | my |
Nepalese | ne |
Olandese | nl |
Norvegese (Bokmål) | nb |
Odia | or |
Punjabi | pa |
Polacco | pl |
Pashto | ps |
Portoghese (Brasile) | pt-br |
Portoghese (Portogallo) | pt-pt |
Romeno | ro |
Russo | ru |
Sanscrito | sa |
Sindhi | sd |
Singalese | si |
Slovacco | sk |
Sloveno | sl |
Somalo | so |
Albanese | sq |
Serbo | sr |
Sundanese | su |
Svedese | sv |
Swahili | sw |
Tamil | ta |
Telugu | te |
Thai | th |
Filippino | tl |
Turco | tr |
Uiguro | ug |
Ucraino | uk |
Urdu | ur |
Uzbeco | uz |
Vietnamita | vi |
Xhosa | xh |
Yiddish | yi |
Cinese (semplificato) | zh-hans |
Cinese (tradizionale) | zh-hant |
Zulù | zu |