Dela via


Snabbstart: anpassad sammanfattning (förhandsversion)

Använd den här artikeln om du vill komma igång med att skapa ett anpassat sammanfattningsprojekt där du kan träna anpassade modeller ovanpå sammanfattning. En modell är programvara för artificiell intelligens som är tränad att utföra en viss uppgift. För det här systemet sammanfattar modellerna text och tränas genom att lära sig av importerade data.

I den här artikeln använder vi Language Studio för att demonstrera viktiga begrepp för anpassad sammanfattning. Som ett exempel ska vi skapa en anpassad sammanfattningsmodell för att extrahera anläggningen eller behandlingsplatsen från korta urladdningsanteckningar.

Förutsättningar

Skapa en ny Azure AI Language-resurs och Ett Azure-lagringskonto

Innan du kan använda anpassad sammanfattning måste du skapa en Azure AI Language-resurs som ger dig de autentiseringsuppgifter som du behöver för att skapa ett projekt och börja träna en modell. Du behöver också ett Azure Storage-konto där du kan ladda upp din datauppsättning som ska användas för att skapa din modell.

Viktigt!

För att komma igång snabbt rekommenderar vi att du skapar en ny Azure AI Language-resurs med hjälp av stegen i den här artikeln. Med hjälp av stegen i den här artikeln kan du skapa språkresursen och lagringskontot samtidigt, vilket är enklare än att göra det senare.

Skapa en ny resurs från Azure-portalen

  1. Gå till Azure-portalen för att skapa en ny Azure AI Language-resurs.

  2. I fönstret som visas väljer du den här tjänsten från de anpassade funktionerna. Välj Fortsätt för att skapa resursen längst ned på skärmen.

    En skärmbild som visar anpassad textklassificering och anpassad namngiven entitetsigenkänning i Azure-portalen.

  3. Skapa en språkresurs med följande information.

    Name beskrivning
    Prenumeration Din Azure-prenumeration.
    Resursgrupp En resursgrupp som ska innehålla din resurs. Du kan använda en befintlig eller skapa en ny.
    Region Regionen för språkresursen. Till exempel "USA, västra 2".
    Name Ett namn på resursen.
    Prisnivå Prisnivån för din språkresurs. Du kan använda nivån Kostnadsfri (F0) för att prova tjänsten.

    Kommentar

    Om du får ett meddelande om att ditt inloggningskonto inte är ägare till det valda lagringskontots resursgrupp måste ditt konto ha en ägarroll tilldelad till resursgruppen innan du kan skapa en Språkresurs. Kontakta din Azure-prenumerationsägare om du vill ha hjälp.

  4. I den här tjänstens avsnitt väljer du ett befintligt lagringskonto eller väljer Nytt lagringskonto. Dessa värden hjälper dig att komma igång och inte nödvändigtvis de lagringskontovärden som du vill använda i produktionsmiljöer. Undvik svarstider när du skapar projektet genom att ansluta till lagringskonton i samma region som språkresursen.

    Lagringskontovärde Rekommenderat värde
    Lagringskontonamn Valfritt namn
    Storage account type Standard LRS
  5. Kontrollera att meddelandet om ansvarsfull AI är markerat. Välj Granska + skapa längst ned på sidan och välj sedan Skapa.

Ladda ned exempeldata

Om du behöver exempeldata har vi angett några för scenarier för textsammanfattning och konversationssammanfattning i den här snabbstarten.

Ladda upp exempeldata till blobcontainer

  1. Leta upp filerna som ska laddas upp till ditt lagringskonto

  2. I Azure-portalen navigerar du till lagringskontot som du skapade och väljer det.

  3. I ditt lagringskonto väljer du Containrar på den vänstra menyn under Datalagring. På skärmen som visas väljer du + Container. Ge containern namnet example-data och lämna standardnivån offentlig åtkomst.

    En skärmbild som visar huvudsidan för ett lagringskonto.

  4. När containern har skapats väljer du den. Välj sedan knappen Ladda upp för att välja filerna .txt och .json som du laddade ned tidigare.

    En skärmbild som visar knappen för att ladda upp filer till lagringskontot.

Skapa ett anpassat sammanfattningsprojekt

När resursen och lagringskontot har konfigurerats skapar du ett nytt anpassat sammanfattningsprojekt. Ett projekt är ett arbetsområde för att skapa dina anpassade ML-modeller baserat på dina data. Ditt projekt kan bara nås av dig och andra som har åtkomst till den språkresurs som används.

  1. Logga in på Language Studio. Ett fönster visas där du kan välja din prenumeration och språkresurs. Välj den språkresurs som du skapade i steget ovan.

  2. Välj den funktion som du vill använda i Language Studio.

  3. Välj Skapa nytt projekt på den översta menyn på projektsidan. När du skapar ett projekt kan du märka data, träna, utvärdera, förbättra och distribuera dina modeller.

    En skärmbild av sidan för att skapa projektet.

  4. Ange projektinformationen, inklusive ett namn, en beskrivning och språket för filerna i projektet. Om du använder exempeldatauppsättningen väljer du Engelska. Du kan inte ändra namnet på projektet senare. Välj Nästa

    Dricks

    Datamängden behöver inte vara helt på samma språk. Du kan ha flera dokument, var och en med olika språk som stöds. Om datamängden innehåller dokument med olika språk eller om du förväntar dig text från olika språk under körningen väljer du alternativet Aktivera flerspråkig datauppsättning när du anger grundläggande information för projektet. Det här alternativet kan aktiveras senare från sidan Projektinställningar .

  5. När du har valt Skapa nytt projekt visas ett fönster där du kan ansluta ditt lagringskonto. Om du redan har anslutit ett lagringskonto visas det anslutna lagringskontot. Om inte väljer du ditt lagringskonto i listrutan som visas och väljer Anslut lagringskonto. Detta anger de roller som krävs för ditt lagringskonto. Det här steget returnerar eventuellt ett fel om du inte har tilldelats som ägare på lagringskontot.

    Kommentar

    • Du behöver bara göra det här steget en gång för varje ny resurs som du använder.
    • Den här processen kan inte ångras, om du ansluter ett lagringskonto till din Språkresurs kan du inte koppla från det senare.
    • Du kan bara ansluta språkresursen till ett lagringskonto.
  6. Välj den container där du har laddat upp datamängden.

  7. Om du redan har etiketterat data kontrollerar du att de följer formatet som stöds och väljer Ja, mina filer är redan märkta och jag har formaterat JSON-etikettfilen och väljer etikettfilen i den nedrullningsbara menyn. Välj Nästa. Om du använder datauppsättningen från snabbstarten behöver du inte granska formateringen för JSON-etikettfilen.

  8. Granska de data som du har angett och välj Skapa projekt.

Träna din modell

När du har skapat ett projekt går du vidare och börjar träna din modell.

Så här börjar du träna din modell inifrån Language Studio:

  1. Välj Träningsjobb på menyn till vänster.

  2. Välj Starta ett träningsjobb på den översta menyn.

  3. Välj Träna en ny modell och skriv in modellnamnet i textrutan. Du kan också skriva över en befintlig modell genom att välja det här alternativet och välja den modell som du vill skriva över från den nedrullningsbara menyn. Att skriva över en tränad modell är oåterkalleligt, men det påverkar inte dina distribuerade modeller förrän du distribuerar den nya modellen.

    Skapa ett nytt träningsjobb

  4. Som standard delar systemet upp dina märkta data mellan tränings- och testuppsättningarna enligt angivna procentandelar. Om du har dokument i testuppsättningen kan du dela upp tränings- och testdata manuellt.

  5. Välj knappen Träna.

  6. Om du väljer ID för träningsjobb i listan visas en sidoruta där du kan kontrollera träningsförloppet, jobbstatusen och annan information för det här jobbet.

    Kommentar

    • Endast slutförda träningsjobb genererar modeller.
    • Träningen kan ta lite tid mellan ett par minuter och flera timmar baserat på storleken på dina märkta data.
    • Du kan bara köra ett träningsjobb i taget. Du kan inte starta ett annat träningsjobb i samma projekt förrän det pågående jobbet har slutförts.

Distribuera din modell

Vanligtvis efter att ha tränat en modell skulle du granska dess utvärderingsinformation och göra förbättringar om det behövs. I den här snabbstarten distribuerar du bara din modell och gör den tillgänglig för dig att prova i Language Studio.

Så här distribuerar du din modell inifrån Language Studio:

  1. Välj Distribuera en modell från menyn till vänster.

  2. Välj Lägg till distribution för att starta ett nytt distributionsjobb.

    En skärmbild som visar distributionsknappen

  3. Välj Skapa ny distribution för att skapa en ny distribution och tilldela en tränad modell i listrutan nedan. Du kan också skriva över en befintlig distribution genom att välja det här alternativet och välja den tränade modell som du vill tilldela till den i listrutan nedan.

    Kommentar

    Om du skriver över en befintlig distribution krävs inte ändringar i api-anropet för förutsägelse , men de resultat du får baseras på den nyligen tilldelade modellen.

    En skärmbild som visar distributionsskärmen

  4. Välj Distribuera för att starta distributionsjobbet.

  5. När distributionen har slutförts visas ett förfallodatum bredvid den. Distributionen upphör att gälla när den distribuerade modellen inte kommer att användas för förutsägelse, vilket vanligtvis sker tolv månader efter att en träningskonfiguration upphör att gälla.

Testa din modell

I den här snabbstarten använder du Language Studio för att skicka den anpassade sammanfattningsuppgiften och visualisera resultatet. I exempeldatauppsättningen som du laddade ned tidigare hittar du några testdokument som du kan använda i det här steget.

Så här testar du dina distribuerade modeller från Language Studio:

  1. Välj Testa distributioner på menyn till vänster.

  2. Välj den distribution som du vill testa. Du kan bara testa modeller som har tilldelats distributioner.

  3. För flerspråkiga projekt går du till listrutan språk och väljer språket för den text som du testar.

  4. Välj den distribution som du vill köra frågor mot/testa i listrutan.

  5. Du kan ange den text som du vill skicka till begäran eller ladda upp en .txt fil som ska användas.

  6. Välj Kör testet på den översta menyn.

  7. På fliken Resultat kan du se de extraherade entiteterna från din text och deras typer. Du kan också visa JSON-svaret under fliken JSON .

En skärmbild som visar modelltestresultatet.

Rensa resurser

När du inte längre behöver projektet kan du ta bort projektet med Hjälp av Language Studio. Välj den funktion som du använder längst upp och välj sedan det projekt som du vill ta bort. Välj Ta bort på den översta menyn för att ta bort projektet.

Nästa steg