Dela via


Språkstöd för anpassad textanalys för hälsa

Använd den här artikeln om du vill veta mer om de språk som för närvarande stöds av Anpassningsbar textanalys för hälsa.

Flerspråkigt alternativ

Med Anpassningsbar textanalys för hälsa kan du träna en modell på ett språk och använda den för att extrahera entiteter från dokument på andra språk. Den här funktionen sparar problem med att skapa separata projekt för varje språk och kombinerar i stället dina datauppsättningar i ett enda projekt, vilket gör det enkelt att skala dina projekt till flera språk. Du kan träna projektet helt och hållet med engelska dokument och köra frågor mot det på: franska, tyska, italienska och andra. Du kan aktivera det flerspråkiga alternativet som en del av projektskapandeprocessen eller senare via projektinställningarna.

Du förväntas inte lägga till samma antal dokument för varje språk. Du bör skapa merparten av projektet på ett språk och bara lägga till några få dokument på språk som du observerar inte fungerar bra. Om du skapar ett projekt som främst är på engelska och börjar testa det på franska, tyska och spanska kan du observera att tyska inte fungerar lika bra som de andra två språken. I så fall bör du överväga att lägga till 5 % av dina ursprungliga engelska dokument på tyska, träna en ny modell och testa på tyska igen. På sidan för dataetiketter i Language Studio kan du välja språk för det dokument som du lägger till. Du bör se bättre resultat för tyska frågor. Ju mer märkta dokument du lägger till, desto mer sannolikt blir resultatet bättre. När du lägger till data på ett annat språk bör du inte förvänta dig att det påverkar andra språk negativt.

Hebreiska stöds inte i flerspråkiga projekt. Om projektets primära språk är hebreiska kan du inte lägga till träningsdata på andra språk eller köra frågor mot modellen med andra språk. Om projektets primära språk inte är hebreiska kan du på samma sätt inte lägga till träningsdata på hebreiska eller fråga modellen på hebreiska.

Stöd för språk

Anpassade Textanalys för hälsa stöder .txt filer på följande språk:

Språk Språkkod
Engelska en
Franska fr
Tyska de
Spanska es
Italienska it
Portugisiska (Portugal) pt-pt
Hebreiska he

Nästa steg