Språkstöd för anpassad textanalys för hälsa
Använd den här artikeln om du vill veta mer om de språk som för närvarande stöds av Anpassningsbar textanalys för hälsa.
Flerspråkigt alternativ
Med Anpassningsbar textanalys för hälsa kan du träna en modell på ett språk och använda den för att extrahera entiteter från dokument på andra språk. Den här funktionen sparar problem med att skapa separata projekt för varje språk och kombinerar i stället dina datauppsättningar i ett enda projekt, vilket gör det enkelt att skala dina projekt till flera språk. Du kan träna projektet helt och hållet med engelska dokument och köra frågor mot det på: franska, tyska, italienska och andra. Du kan aktivera det flerspråkiga alternativet som en del av projektskapandeprocessen eller senare via projektinställningarna.
Du förväntas inte lägga till samma antal dokument för varje språk. Du bör skapa merparten av projektet på ett språk och bara lägga till några få dokument på språk som du observerar inte fungerar bra. Om du skapar ett projekt som främst är på engelska och börjar testa det på franska, tyska och spanska kan du observera att tyska inte fungerar lika bra som de andra två språken. I så fall bör du överväga att lägga till 5 % av dina ursprungliga engelska dokument på tyska, träna en ny modell och testa på tyska igen. På sidan för dataetiketter i Language Studio kan du välja språk för det dokument som du lägger till. Du bör se bättre resultat för tyska frågor. Ju mer märkta dokument du lägger till, desto mer sannolikt blir resultatet bättre. När du lägger till data på ett annat språk bör du inte förvänta dig att det påverkar andra språk negativt.
Hebreiska stöds inte i flerspråkiga projekt. Om projektets primära språk är hebreiska kan du inte lägga till träningsdata på andra språk eller köra frågor mot modellen med andra språk. Om projektets primära språk inte är hebreiska kan du på samma sätt inte lägga till träningsdata på hebreiska eller fråga modellen på hebreiska.
Stöd för språk
Anpassade Textanalys för hälsa stöder .txt
filer på följande språk:
Språk | Språkkod |
---|---|
Engelska | en |
Franska | fr |
Tyska | de |
Spanska | es |
Italienska | it |
Portugisiska (Portugal) | pt-pt |
Hebreiska | he |
Nästa steg
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för