Dela via


Så här använder du grundmodeller med öppen källkod som har kurerats av Azure Mašinsko učenje

I den här artikeln får du lära dig hur du finjusterar, utvärderar och distribuerar grundmodeller i modellkatalogen.

Du kan snabbt testa valfri förtränad modell med hjälp av exempelinferensformuläret på modellkortet, vilket ger dina egna exempelindata för att testa resultatet. Dessutom innehåller modellkortet för varje modell en kort beskrivning av modellen och länkar till exempel för kodbaserad slutsatsdragning, finjustering och utvärdering av modellen.

Så här utvärderar du grundmodeller med hjälp av dina egna testdata

Du kan utvärdera en foundation-modell mot din testdatauppsättning, antingen med hjälp av formuläret Utvärdera användargränssnitt eller med hjälp av kodbaserade exempel som är länkade från modellkortet.

Utvärdera med hjälp av studio

Du kan anropa formuläret Utvärdera modell genom att välja knappen Utvärdera på modellkortet för valfri grundmodell.

Skärmbild som visar formuläret för utvärderingsinställningar när användaren har valt knappen Utvärdera på ett modellkort för en grundmodell.

Varje modell kan utvärderas för den specifika slutsatsdragningsuppgift som modellen ska användas för.

Testdata:

  1. Skicka in de testdata som du vill använda för att utvärdera din modell. Du kan välja att antingen ladda upp en lokal fil (i JSONL-format) eller välja en befintlig registrerad datauppsättning från din arbetsyta.
  2. När du har valt datauppsättningen måste du mappa kolumnerna från dina indata baserat på det schema som krävs för uppgiften. Mappa till exempel kolumnnamnen som motsvarar nycklarna "mening" och "etikett" för textklassificering

Skärmbild som visar utvärderingskartan i grundmodellernas utvärderingsformulär.

Compute:

  1. Ange det Azure Mašinsko učenje Compute-kluster som du vill använda för att finjustera modellen. Utvärderingen måste köras på GPU-beräkning. Se till att du har tillräcklig beräkningskvot för de beräknings-SKU:er som du vill använda.

  2. Välj Slutför i formuläret Utvärdera för att skicka utvärderingsjobbet. När jobbet är klart kan du visa utvärderingsmått för modellen. Baserat på utvärderingsmåtten kan du bestämma om du vill finjustera modellen med dina egna träningsdata. Dessutom kan du bestämma om du vill registrera modellen och distribuera den till en slutpunkt.

Utvärdera med hjälp av kodbaserade exempel

För att göra det möjligt för användare att komma igång med modellutvärdering har vi publicerat exempel (både Python-notebook-filer och CLI-exempel) iutvärderingsexempel i azureml-examples. Varje modellkort länkar också till utvärderingsexempel för motsvarande uppgifter

Finjustera grundmodeller med hjälp av dina egna träningsdata

Om du vill förbättra modellprestandan i din arbetsbelastning kanske du vill finjustera en grundmodell med dina egna träningsdata. Du kan enkelt finjustera dessa grundmodeller genom att antingen finjustera inställningarna i studion eller med hjälp av kodbaserade exempel som är länkade från modellkortet.

Finjustera med studio

Du kan anropa formuläret för finjustera inställningar genom att välja knappen Finjustera på modellkortet för valfri grundmodell.

Finjustera inställningar:

Skärmbild som visar inställningsalternativen för finjusterande inställningar i formuläret finjustera inställningar för grundmodeller.

Finjustering av aktivitetstyp

  • Varje förtränad modell från modellkatalogen kan finjusteras för en specifik uppsättning uppgifter (till exempel textklassificering, tokenklassificering, frågesvar). Välj den uppgift som du vill använda i listrutan.

Träningsdata

  1. Skicka in de träningsdata som du vill använda för att finjustera din modell. Du kan välja att antingen ladda upp en lokal fil (i JSONL-, CSV- eller TSV-format) eller välja en befintlig registrerad datauppsättning från din arbetsyta.

  2. När du har valt datauppsättningen måste du mappa kolumnerna från dina indata baserat på det schema som krävs för uppgiften. Till exempel: mappa kolumnnamnen som motsvarar nycklarna "mening" och "etikett" för textklassificering

Skärmbild som visar finjusteringskartan i guiden utvärdera grundmodeller.

  • Valideringsdata: Skicka in de data som du vill använda för att verifiera din modell. Om du väljer Automatisk delning reserveras en automatisk uppdelning av träningsdata för validering. Du kan också ange en annan valideringsdatauppsättning.
  • Testdata: Skicka in de testdata som du vill använda för att utvärdera din finjusterade modell. Om du väljer Automatisk delning reserveras en automatisk uppdelning av träningsdata för testning.
  • Beräkning: Ange det Azure Mašinsko učenje Compute-kluster som du vill använda för att finjustera modellen. Finjustering måste köras på GPU-beräkning. Vi rekommenderar att du använder beräknings-SKU:er med A100/V100 GPU:er vid finjustering. Se till att du har tillräcklig beräkningskvot för de beräknings-SKU:er som du vill använda.
  1. Välj Slutför i finjusteringsformuläret för att skicka ditt finjusteringsjobb. När jobbet är klart kan du visa utvärderingsmått för den finjusterade modellen. Du kan sedan registrera de finjusterade modellutdata från finjusteringsjobbet och distribuera den här modellen till en slutpunkt för slutsatsdragning.

Finjustera med hjälp av kodbaserade exempel

För närvarande har Azure Machine Learning stöd för finjusteringsmodeller för följande språkuppgifter:

  • Textklassificering
  • Tokenklassificering
  • Frågor och svar
  • Summering
  • Översättning

För att göra det möjligt för användare att snabbt komma igång med finjustering har vi publicerat exempel (både Python-notebook-filer och CLI-exempel) för varje uppgift i git-lagringsplatsen Azureml-examples Finetune-exempel. Varje modellkort länkar också till finjusteringsexempel för finjusterande uppgifter som stöds.

Distribuera grundmodeller till slutpunkter för slutsatsdragning

Du kan distribuera grundmodeller (både förtränade modeller från modellkatalogen och finjusterade modeller när de har registrerats på din arbetsyta) till en slutpunkt som sedan kan användas för slutsatsdragning. Distribution till både serverlösa API:er och hanterad beräkning stöds. Du kan distribuera dessa modeller med hjälp av guiden Distribuera användargränssnitt eller med hjälp av kodbaserade exempel som är länkade från modellkortet.

Distribuera med studio

Du kan anropa formuläret Distribuera användargränssnitt genom att välja knappen Distribuera på modellkortet för valfri grundmodell och välja antingen Serverlöst API med Azure AI Content Safety eller Hanterad beräkning utan Azure AI Content Safety

Skärmbild som visar distributionsknappen på grundmodellkortet.

Distributionsinställningar

Eftersom bedömningsskriptet och miljön automatiskt ingår i grundmodellen behöver du bara ange den SKU för virtuell dator som ska användas, antalet instanser och slutpunktsnamnet som ska användas för distributionen.

Skärmbild som visar distributionsalternativen på grundmodellkortet när användaren har valt knappen distribuera.

Delad kvot

Om du distribuerar en Llama-2-, Phi-, Nemotron-, Mistral-, Dolly- eller Deci-DeciLM-modell från modellkatalogen men inte har tillräckligt med kvot för distributionen Mašinsko učenje kan du använda kvoter från en delad kvotpool under en begränsad tid. Mer information om delade kvot finns i Delade kvoter för Azure Machine Learning.

Skärmbild som visar alternativet att tillfälligt distribuera en Llama-modell med delad kvot.

Distribuera med kodbaserade exempel

För att göra det möjligt för användare att snabbt komma igång med distribution och slutsatsdragning har vi publicerat exempel i inferensexemplen på git-lagringsplatsen azureml-examples. De publicerade exemplen innehåller Python-notebook-filer och CLI-exempel. Varje modellkort länkar också till slutsatsdragningsexempel för realtids- och Batch-slutsatsdragning.

Importera grundmodeller

Om du vill använda en modell med öppen källkod som inte ingår i modellkatalogen kan du importera modellen från Hugging Face till din Azure Machine Learning-arbetsyta. Hugging Face är ett bibliotek med öppen källkod för bearbetning av språkteknologi (NLP) som tillhandahåller förtränade modeller för populära NLP-uppgifter. För närvarande har modellimport stöd för import av modeller för följande uppgifter, så länge modellen uppfyller kraven som anges i modellimport-notbooken:

  • fyllningsmask
  • tokenklassificering
  • frågesvar
  • summering
  • textgenerering
  • textklassificering
  • översättning
  • bildklassificering
  • text till bild

Kommentar

Modeller från Hugging Face omfattas av licensvillkor från tredje part som är tillgängliga på sidan Hugging Face-modellinformation. Det är ditt ansvar att följa modellens licensvillkor.

Du kan välja knappen Importera längst upp till höger i modellkatalogen för att använda modellimportanteckningsboken.

Skärmbild som visar knappen för modellimport eftersom den visas i det övre högra hörnet i grundmodellkatalogen.

Notebook-filen för modellimport ingår också i git-lagringsplatsen azureml-examples här.

För att kunna importera modellen måste du skicka in den MODEL_ID modell som du vill importera från Hugging Face. Bläddra bland modeller på Hugging Face Hub och identifiera modellen som ska importeras. Kontrollera att modellens aktivitetstyp finns bland de aktivitetstyper som stöds. Kopiera modell-ID:t, som är tillgängligt i sidans URI eller kan kopieras med kopieringsikonen bredvid modellnamnet. Tilldela den till variabeln "MODEL_ID" i notebook-filen för modellimport. Till exempel:

Skärmbild som visar ett exempel på ett huggande ansiktsmodell-ID (

Du måste ange beräkning för att modellimporten ska köras. Om du kör modellimporten importeras den angivna modellen från Hugging Face och registreras på din Azure Mašinsko učenje-arbetsyta. Du kan sedan finjustera den här modellen eller distribuera den till en slutpunkt för slutsatsdragning.

Läs mer