Dela via


Azure Training-resurser för Model Builder

Följande är en guide som hjälper dig att lära dig mer om resurser som används för att träna modeller i Azure med Model Builder.

Vad är ett Azure Machine Learning-experiment?

Ett Azure Machine Learning-experiment är en resurs som måste skapas innan du kör Model Builder-utbildning i Azure.

Experimentet kapslar in konfigurationen och resultaten för en eller flera maskininlärningsträningskörningar. Experiment tillhör en specifik arbetsyta. Första gången ett experiment skapas registreras namnet på arbetsytan. Efterföljande körningar , om samma experimentnamn används, loggas som en del av samma experiment. Annars skapas ett nytt experiment.

Vad är en Azure Machine Learning-arbetsyta?

En arbetsyta är en Azure Machine Learning-resurs som ger en central plats för alla Azure Machine Learning-resurser och artefakter som skapats som en del av träningskörningen.

För att skapa en Azure Machine Learning-arbetsyta krävs följande:

  • Namn: Ett namn på arbetsytan mellan 3 och 33 tecken. Namn får bara innehålla alfanumeriska tecken och bindestreck.
  • Region: Den geografiska platsen för det datacenter där din arbetsyta och dina resurser distribueras till. Vi rekommenderar att du väljer en plats nära där du eller dina kunder finns.
  • Resursgrupp: En container som innehåller alla relaterade resurser för en Azure-lösning.

Vad är en Azure Machine Learning-beräkning?

En Azure Machine Learning-beräkning är en molnbaserad virtuell Linux-dator som används för träning.

För att skapa en Azure Machine Learning-beräkning krävs följande:

  • Namn: Ett namn för din beräkning mellan 2 och 16 tecken. Namn får bara innehålla alfanumeriska tecken och bindestreck.

  • Beräkningsstorlek

    Model Builder kan använda någon av följande GPU-optimerade beräkningstyper:

    Storlek vCPU Minne: GiB Temporär lagring (SSD) GiB GPU GPU-minne: GiB Maximalt antal datadiskar Maximalt antal nätverkskort
    Standard_NC12 12 112 680 2 24 48 2
    Standard_NC24 24 224 1440 4 48 64 4

    Mer information om GPU-optimerade beräkningstyper finns i dokumentationen om virtuella Linux-datorer i NC-serien.

  • Beräkningsprioritet

    • Låg prioritet: Passar för aktiviteter med kortare körningstider. Kan påverkas av avbrott och brist på tillgänglighet. Kostar vanligtvis mindre eftersom den drar nytta av överskottskapaciteten i Azure.
    • Dedikerat: Passar för aktiviteter oavsett varaktighet, men särskilt långvariga jobb. Påverkas inte av avbrott eller brist på tillgänglighet. Kostar vanligtvis mer eftersom den reserverar en dedikerad uppsättning beräkningsresurser i Azure för dina uppgifter.

Utbildning

Utbildning i Azure är endast tillgänglig för scenariot för model builder-avbildningsklassificering. Algoritmen som används för att träna dessa modeller är ett djupt neuralt nätverk baserat på ResNet50-arkitekturen. Träningsprocessen tar lite tid och hur lång tid det tar kan variera beroende på storleken på den valda beräkningen samt mängden data. Du kan spåra förloppet för dina körningar genom att välja länken "Övervaka aktuell körning i Azure-portalen" i Visual Studio.

Resultat

När träningen är klar läggs två projekt till i din lösning med följande suffix:

  • ConsoleApp: En C#-konsolapp som tillhandahåller startkod för att skapa förutsägelsepipelinen och göra förutsägelser.

  • Modell: En C# .NET Standard-app som innehåller de datamodeller som definierar schemat för indata- och utdatamodelldata samt följande tillgångar:

    • bestModel.onnx: En serialiserad version av modellen i ONNX-format (Open Neural Network Exchange). ONNX är ett öppen källkod format för AI-modeller som stöder samverkan mellan ramverk som ML.NET, PyTorch och TensorFlow.
    • bestModelMap.json: En lista över kategorier som används när du gör förutsägelser för att mappa modellutdata till en textkategori.
    • MLModel.zip: En serialiserad version av pipelinen för ML.NET förutsägelse som använder den serialiserade versionen av modellen bestModel.onnx för att göra förutsägelser och mappa utdata med hjälp av bestModelMap.json filen.

Använda maskininlärningsmodellen

Klasserna ModelInput och ModelOutput i modellprojektet definierar schemat för modellens förväntade indata respektive utdata.

I ett bildklassificeringsscenario innehåller de ModelInput två kolumnerna:

  • ImageSource: Strängsökvägen för bildplatsen.
  • Label: Den faktiska kategori som bilden tillhör. Label används endast som indata vid träning och behöver inte tillhandahållas när du gör förutsägelser.

Innehåller ModelOutput två kolumner:

  • Prediction: Bildens förutsagda kategori.
  • Score: Listan över sannolikheter för alla kategorier (den högsta tillhör Prediction).

Felsökning

Det går inte att skapa beräkning

Om ett fel uppstår när Azure Machine Learning-beräkning skapas kan beräkningsresursen fortfarande finnas i ett feltillstånd. Om du försöker återskapa beräkningsresursen med samma namn misslyckas åtgärden. Åtgärda det här felet genom att antingen:

  • Skapa den nya beräkningen med ett annat namn
  • Gå till Azure-portalen och ta bort den ursprungliga beräkningsresursen