Snabbstart: Skapa, publicera och översätta med anpassade modeller

Translator är en molnbaserad översättningstjänst för neurala datorer som ingår i Azure AI-tjänstefamiljen med REST API som kan användas med alla operativsystem. Translator driver många Microsoft-produkter och -tjänster som används av tusentals företag över hela världen för att utföra språköversättning och andra språkrelaterade åtgärder. I den här snabbstarten lär du dig att skapa anpassade lösningar för dina program på alla språk som stöds.

Förutsättningar

Om du vill använda Custom Translator-portalen behöver du följande resurser:

  • Ett Microsoft-konto.

  • Azure-prenumeration – Skapa en kostnadsfritt

  • När du har en Azure-prenumeration skapar du en Translator-resurs i Azure Portal för att hämta din nyckel och slutpunkt. När den har distribuerats väljer du Gå till resurs.

    • Du behöver nyckeln och slutpunkten från resursen för att ansluta programmet till Translator-tjänsten. Klistra in nyckeln och slutpunkten i koden senare i snabbstarten. Du hittar dessa värden på sidan Azure Portal nycklar och slutpunkt:

      Skärmbild: Azure Portal nycklar och slutpunktssida.

Mer information finns iskapa en Translator-resurs.

Custom Translator-portalen

När du har ovanstående krav loggar du in på Custom Translator-portalen för att skapa arbetsytor, skapa projekt, ladda upp filer, träna modeller och publicera din anpassade lösning.

Du kan läsa en översikt över översättning och anpassad översättning, lära dig några tips och watch en komma igång-video i den tekniska Azure AI-bloggen.

Processsammanfattning

  1. Skapa en arbetsyta. En arbetsyta är ett arbetsområde för att skapa och skapa ett anpassat översättningssystem. En arbetsyta kan innehålla flera projekt, modeller och dokument. Allt arbete du gör i Custom Translator görs på en specifik arbetsyta.

  2. Skapa ett projekt. Ett projekt är en omslutning för modeller, dokument och tester. Varje projekt innehåller alla dokument som laddas upp till arbetsytan med rätt språkpar. Om du till exempel har både ett engelsk-till-spanskt projekt och ett spansk-till-engelskt projekt inkluderas samma dokument i båda projekten.

  3. Ladda upp parallella dokument. Parallella dokument är par med dokument där det ena (målet) är översättningen av det andra (källa). Ett dokument i paret innehåller meningar i källspråket och det andra dokumentet innehåller meningar översatta till målspråket. Det spelar ingen roll vilket språk som är markerat som "källa" och vilket språk som är markerat som "mål" – ett parallellt dokument kan användas för att träna ett översättningssystem i båda riktningarna.

  4. Träna din modell. En modell är det system som tillhandahåller översättning för ett visst språkpar. Resultatet av en lyckad träning är en modell. När du tränar en modell krävs tre ömsesidigt uteslutande dokumenttyper: träning, justering och testning. Om endast träningsdata tillhandahålls när du köar en träning monterar Custom Translator automatiskt justerings- och testdata. Den använder en slumpmässig delmängd meningar från dina träningsdokument och exkluderar dessa meningar från själva träningsdatan. En parallell mening på 10 000 är minimikravet för att träna en modell.

  5. Testa (mänsklig utvärdera) din modell. Testuppsättningen används för att beräkna BLEU-poängen . Den här poängen anger kvaliteten på översättningssystemet.

  6. Publicera (distribuera) din tränade modell. Din anpassade modell görs tillgänglig för körningsöversättningsbegäranden.

  7. Översätta text. Använd den molnbaserade, säkra, högpresterande, mycket skalbara Microsoft Translator Text API V3 för att göra översättningsbegäranden.

Skapa en arbetsyta

  1. När du har loggat in på Custom Translator uppmanas du att läsa din profil från Microsofts identitetsplattform för att begära din användaråtkomsttoken och uppdateringstoken. Båda token behövs för autentisering och för att säkerställa att du inte loggas ut under din livesession eller när du tränar dina modeller.
    Välj Ja.

    Skärmbild som illustrerar hur du skapar en arbetsyta.

  2. Välj Mina arbetsytor.

  3. Välj Skapa en ny arbetsyta.

  4. Skriv Contoso MT-modeller som arbetsytenamn och välj Nästa.

  5. Välj "Global" för Välj resursregion i listrutan.

  6. Kopiera/klistra in Translator Services-nyckeln.

  7. Välj Nästa.

  8. Välj Klar.

    Anteckning

    Regionen måste matcha den region som valdes när resursen skapades. Du kan använda NYCKEL 1 eller NYCKEL 2.

    Skärmbild som illustrerar resursnyckeln.

    Skärmbild som illustrerar skapandet av arbetsytan.

Skapa ett projekt

När arbetsytan har skapats tas du till sidan Projekt .

Du skapar ett engelsk-till-tyskt projekt för att träna en anpassad modell med endast en utbildningsdokumenttyp .

  1. Välj Skapa projekt.

  2. Skriv engelska till tyska som projektnamn.

  3. Välj engelska (en) som källspråk i listrutan.

  4. Välj Tyska (de) som målspråk i listrutan.

  5. Välj Allmänt för Domän i listrutan.

  6. Välj Skapa projekt.

    Skärmbild som illustrerar hur du skapar ett projekt.

Ladda upp dokument

För att skapa en anpassad modell måste du ladda upp alla eller en kombination av dokumenttyper för träning, justering, testning och ordlistedokument .

I den här snabbstarten laddar du upp träningsdokument för anpassning.

Anteckning

Du kan använda vår exempeldatauppsättning för tränings-, fras- och meningsordlistor, kundexempel på engelska till tyska datamängder för den här snabbstarten. För produktion är det dock bättre att ladda upp din egen träningsdatauppsättning.

  1. Välj projektnamn för engelska till tyska .

  2. Välj Hantera dokument på den vänstra navigeringsmenyn.

  3. Välj Lägg till dokumentuppsättning.

  4. Markera rutan Träningsuppsättning och välj Nästa.

  5. Håll Parallella dokument markerade och skriv sample-English-German.

  6. Under filen Källa (engelska – EN) väljer du Bläddra bland filer och väljer sample-English-German-Training-en.txt.

  7. Under Målfil (tyska – EN) väljer du Bläddra bland filer och väljer sample-English-German-Training-de.txt.

  8. Välj Ladda upp

    Anteckning

    Du kan ladda upp datauppsättningen exempelfraser och meningsordlistor. Det här steget är kvar för dig att slutföra.

    Skärmbild som illustrerar hur du laddar upp dokument.

Träna modellen

Nu är du redo att träna din engelsk-till-tyska modell.

  1. Välj Träna modell på den vänstra navigeringsmenyn.

  2. Skriv en-de med exempeldata för Modellnamn.

  3. Håll Full träning kontrollerad.

  4. Under Välj dokument kontrollerar du sample-English-German och granskar träningskostnaden som är associerad med det valda antalet meningar.

  5. Välj Träna nu.

  6. Välj Träna för att bekräfta.

    Anteckning

    Meddelanden visar modellträning som pågår, t.ex. Skicka datatillstånd . Träningsmodellen tar några timmar, beroende på antalet valda meningar.

    Skärmbild som illustrerar hur du skapar en modell.

  7. Efter en lyckad modellträning väljer du Modellinformation på den vänstra navigeringsmenyn.

  8. Välj modellnamnet en-de med exempeldata. Granska träningsdatum/tid, total träningstid, antal meningar som används för träning, justering, testning och ordlista. Kontrollera om systemet genererade test- och justeringsuppsättningarna. Du använder för att göra översättningsbegäranden Category ID .

  9. Utvärdera modellens BLEU-poäng . Testuppsättningens BLEU-poäng är den anpassade modellpoängen och Baseline BLEU är den förtränad baslinjemodell som används för anpassning. En högre BLEU-poäng innebär högre översättningskvalitet med hjälp av den anpassade modellen.

    Anteckning

    Om du tränar med våra delade kundexempeldatauppsättningar skiljer sig BLEU-poängen från bilden.

    Skärmbild som illustrerar modellinformation.

Testa din modell

När träningen har slutförts kontrollerar du testuppsättningen översatta meningar.

  1. Välj Testmodell på den vänstra navigeringsmenyn.
  2. Välj "en-de med exempeldata"
  3. Mänsklig utvärderingsöversättning från ny modell (anpassad modell) och baslinjemodell (vår förtränad baslinje som används för anpassning) mot referens (målöversättning från testuppsättningen)

Publicera din modell

När du publicerar din modell blir den tillgänglig för användning med Translator-API:et. Ett projekt kan ha en eller flera tränade modeller. Du kan bara publicera en modell per projekt, men du kan publicera en modell i en eller flera regioner beroende på dina behov. Mer information finns i Translator-priser.

  1. Välj Publicera modell på den vänstra navigeringsmenyn.

  2. Välj en-de med exempeldata och välj Publicera.

  3. Kontrollera önskade regioner.

  4. Välj Publicera. Statusen bör övergå från Distribution till Distribuerad.

    Skärmbild som illustrerar hur du distribuerar en tränad modell.

Översätt text

  1. Utvecklare bör använda när de Category ID gör översättningsbegäranden med Microsoft Translator Text API V3. Mer information om Translator Text API kan hittas på webbsidan API-referens.

  2. Företagsanvändare kanske vill ladda ned och installera vår kostnadsfria DocumentTranslator-app för Windows.

Nästa steg