Vad är Azure Machine Learning?

Slutförd

Azure Machine Learning är en plattform för att skapa och hantera livscykeln från slutpunkt till slutpunkt för maskininlärningssystem. Azure Machine Learning är ramverksoberoende, vilket ger dig flexibiliteten att arbeta med de tekniker du föredrar, till exempel TensorFlow, PyTorch, ONNX, MLFlow och Scikit-learn.

Med Azure Machine Learning kan användare som är bekanta med ML-ramverk snabbt träna och distribuera modeller med hjälp av kod, samtidigt som andra får kraftfulla visuella verktyg. Alla dina träningsskript, modeller, loggar och beräkningar är centraliserade på en delad arbetsyta i Azure Machine Learning, vilket hjälper dig att skapa och distribuera maskininlärningssystem, vilket innebär att du kan fokusera på modeller medan Azure Machine Learning gör resten.

Azure Machine Learning har en omfattande uppsättning funktioner som stöder loggning, övervakning och styrning av data och modeller, vilket säkerställer att dina modeller fungerar som avsett och effektivt förmedlas till intressenterna.

Vad är Azure Machine Learning Studio?

Azure Machine Learning-studio är en webbläsarbaserad tjänst som tillhandahåller lösningar utan kod och kod för att visuellt skapa, träna och hantera modeller via ett webbgränssnitt. Azure Machine Learning-studio tillåter Python SDK integreras sömlöst med de inbyggda Jupyter Notebooks som stöds för samarbetsanteckningar och kodning. Data i Azure Machine Learning-studio är enkla att hantera med intuitiv datavisualisering och AI-stödda funktioner för bild- eller textetiketter.

Screenshot of an experiment in Azure Machine Learning studio.

Skapa en modell

Modeller kan skapas i Azure Machine Learning på flera sätt. Utbildning kan ske på en lokal dator eller i Azure-molnet, till exempel en virtuell dator eller ett beräkningskluster.

Koda med Python

Med Azure Machine Learning SDK för Python kan du interagera med tjänsten från flera miljöer, inklusive Jupyter Notebooks. Notebook-filer ger en samarbetsmiljö för runnbar kod, visualiseringar och kommentarer. I Studio ingår exempelanteckningsböcker som du kan använda för att komma igång med Azure Machine Learning.

Screenshot of Azure Machine Learning notebooks.

AutoML

Automatiserad maskininlärning (AutoML) automatiserar skapandet av de bästa maskininlärningsmodellerna, vilket hjälper dig att hitta den bästa modellen för dina data – oavsett dina kunskaper om datavetenskap. AutoML-experiment med olika funktioner, algoritmer och parametrar beroende på uppgiften är specialiserade på klassificering, regression och tidsserieprognoser och ger sedan poäng på modeller som den anser passar bäst. Dessa modeller kan sedan distribueras som de är eller exporteras till ett ONNX-format som kan köras på olika plattformar och enheter. AutoML:s mångsidighet och hastighet innebär att det ofta används som utgångspunkt av både erfarna och nybörjare dataforskare.

Du kan använda AutoML i Azure Machine Learning-studio eller via Python SDK.

I följande bild kan vi se en översikt över AutoML-pipelinebyggnaden och rekommendera en modell.

azure automl pipeline

Designer

Om du föredrar ett alternativ utan kod ger Azure Machine Learning Designer i Azure Machine Learning-studio dig en visuell arbetsyta med dra och släpp-kontroller för att ändra datauppsättningar och moduler. Moduler i Azure Machine Learning Designer är algoritmer som kan ha olika syften, från dataingressfunktioner till träning, bedömning och valideringsprocesser. Dessa länkade moduler skapar effektiva ML-pipelines för att skapa, testa och distribuera ML-modeller, enligt följande exempel.

Screenshot of Azure Machine Learning designer.

Compute

De databehandlingsresurser som du behöver för ml-miljön kan allokeras eller kopplas via Azure Machine Learning. Från den beräkning som driver dina Jupyter-notebook-filer för undersökande dataanalys, till de kluster som du använder för träning och de hanterade slutpunkter som du distribuerar till för produktionsinferens i stor skala, kan alla skapas och hanteras via Azure Machine Learning.

Hantera data

Med Azure Machine Learning kan den tidsintensiva processen för förberedelse och inmatning av data effektiviseras och samarbeta. Plattformen integreras smidigt med Azure Synapse, Azure Databricks och en uppsättning andra Azure-tjänster för att hjälpa datateknikpipelines att extrahera, transformera och läsa in rådata (ETL) i datalager.

Datalager och etikettering

Azure Machine Learning lagrar dina rådata i datalagringen på ett säkert sätt, så du behöver inte förlita dig på externa källor för dina skript, och dina träningsuppsättningar kan experimenteras med utan att riskera integriteten för de ursprungliga rådata. När du har lagrat dem kan du rensa, transformera och märka data för att skapa träningsuppsättningar från datalagringen. Azure Machine Learning erbjuder verktyg för att märka tabell-, bild- och textdata – med inbyggda maskininlärningssystem som kan föreslå etiketter eller automatisera dataetiketter helt. I följande exempel visas ett mänskligt lett klassificeringsprojekt för flera etiketter som pågår i Azure Machine Learning-studio.

Screenshot of multi-label classification in Azure Machine Learning studio.

MLOps

Alla modeller – inklusive de som fungerar perfekt när de distribueras – kräver övervakning och omträning över tid för att upprätthålla höga prestanda. Azure Machine Learning tillhandahåller funktioner för Maskininlärningsåtgärder (MLOps) för att skapa repeterbara steg för förberedelse av data, träning, bedömning och återanvändbara programvarumiljöer för enkel distribution. Dessa reproducerbara pipelines och miljöer ger en kontinuerlig integrerings-/kontinuerlig leveransupplevelse (CI/CD) till ditt arbetsflöde för maskininlärning.

Utöver dessa funktioner tillhandahåller Azure Machine Learning även MLOps-övervakningsverktyg för att meddela dig om händelser inom ML-livscykeln – och till och med reagera på dem. Med den här kontrollen kan du snabbt identifiera och svara på minskande modellprestanda eller problem inom datauppsättningar. Styrningsinformation finns också i Azure Machine Learning, så att du kan visa en fullständig körningshistorik och spåra gruppmedlemmars åtgärder inom modellens livscykel.