Sdílet prostřednictvím


Materiály pro trénování Azure v Tvůrci modelů

Následuje průvodce, který vám pomůže získat další informace o prostředcích používaných k trénování modelů v Azure pomocí Tvůrce modelů.

Co je experiment azure Machine Učení?

Experiment Učení Azure je prostředek, který je potřeba vytvořit před spuštěním trénování Model Builderu v Azure.

Experiment zapouzdřuje konfiguraci a výsledky pro jedno nebo více trénovacích běhů strojového učení. Experimenty patří do určitého pracovního prostoru. Při prvním vytvoření experimentu se jeho název zaregistruje v pracovním prostoru. Všechna následná spuštění – pokud se použije stejný název experimentu – se protokolují jako součást stejného experimentu. V opačném případě se vytvoří nový experiment.

Co je pracovní prostor služby Azure Machine Learning?

Pracovní prostor je prostředek azure machine Učení, který poskytuje centrální místo pro všechny prostředky a artefakty azure machine Učení vytvořené v rámci trénovacího běhu.

K vytvoření pracovního prostoru Azure Machine Učení se vyžadují následující položky:

  • Název: Název pracovního prostoru mezi 3 až 33 znaky. Názvy mohou obsahovat pouze alfanumerické znaky a pomlčky.
  • Oblast: Zeměpisné umístění datového centra, do kterého se nasazují vaše pracovní prostory a prostředky. Doporučujeme zvolit umístění blízko místa, kde jste vy nebo vaši zákazníci.
  • Skupina prostředků: Kontejner, který obsahuje všechny související prostředky pro řešení Azure.

Co je výpočetní Učení Azure Machine?

Azure Machine Učení compute je cloudový virtuální počítač s Linuxem, který se používá k trénování.

K vytvoření Učení výpočetních prostředků Azure je potřeba:

  • Název: Název výpočetních prostředků mezi 2 až 16 znaky. Názvy mohou obsahovat pouze alfanumerické znaky a pomlčky.

  • Velikost výpočetních prostředků

    Tvůrce modelů může použít jeden z následujících výpočetních typů optimalizovaných pro GPU:

    Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (SSD): GiB GPU Paměť GPU: GiB Max. datových disků Maximální počet síťových karet
    Standard_NC12 12 112 680 2 24 48 2
    Standard_NC24 24 224 1440 4 48 64 4

    Další podrobnosti o výpočetních typech optimalizovaných pro GPU najdete v dokumentaci k virtuálním počítačům řady NC-series s Linuxem.

  • Priorita výpočetních prostředků

    • Nízká priorita: Vhodné pro úlohy s kratší dobou provádění. Může to mít vliv na přerušení a nedostatek dostupnosti. Obvykle stojí méně, protože využívá nadbytečnou kapacitu v Azure.
    • Vyhrazeno: Hodí se pro úkoly libovolné doby trvání, ale zejména pro dlouhotrvající úlohy. Není ovlivněn přerušením nebo nedostatkem dostupnosti. Obvykle stojí více, protože pro vaše úlohy si vyhrazuje vyhrazenou sadu výpočetních prostředků v Azure.

Školení

Trénování v Azure je k dispozici pouze pro scénář klasifikace obrázků v Tvůrci modelů. Algoritmus použitý k trénování těchto modelů je hloubková neurální síť založená na architektuře ResNet50. Proces trénování nějakou dobu trvá a doba se může lišit v závislosti na velikosti vybraného výpočetního objektu a množství dat. Průběh spuštění můžete sledovat tak, že v sadě Visual Studio vyberete odkaz Sledovat aktuální spuštění na webu Azure Portal.

Výsledky

Po dokončení trénování se do řešení přidají dva projekty s následujícími příponami:

  • ConsoleApp: Konzolová aplikace jazyka C#, která poskytuje počáteční kód pro sestavení kanálu předpovědi a vytváření předpovědí.

  • Model: Aplikace .NET Standard jazyka C#, která obsahuje datové modely, které definují schéma vstupních a výstupních dat modelu a také následující prostředky:

    • bestModel.onnx: Serializovaná verze modelu ve formátu Open Neural Network Exchange (ONNX). ONNX je open source formát pro modely AI, které podporují interoperabilitu mezi architekturami, jako jsou ML.NET, PyTorch a TensorFlow.
    • bestModelMap.json: Seznam kategorií použitých při vytváření předpovědí pro mapování výstupu modelu na textovou kategorii.
    • MLModel.zip: Serializovaná verze kanálu predikce ML.NET, která používá serializovanou verzi modelu bestModel.onnx k vytvoření předpovědí a mapuje výstupy pomocí bestModelMap.json souboru.

Použití modelu strojového učení

Třídy ModelInput a ModelOutput třídy v projektu modelu definují schéma očekávaného vstupu a výstupu modelu.

Ve scénáři ModelInput klasifikace obrázků obsahuje dva sloupce:

  • ImageSource: Cesta k řetězci umístění obrázku.
  • Label: Skutečná kategorie, do které image patří. Label se používá pouze jako vstup při trénování a při provádění předpovědí není nutné je poskytovat.

Obsahuje ModelOutput dva sloupce:

  • Prediction: Predikovaná kategorie obrázku.
  • Score: Seznam pravděpodobností pro všechny kategorie (nejvyšší patří do Prediction).

Řešení problému

Nejde vytvořit výpočetní prostředky

Pokud během vytváření výpočetních prostředků Azure Učení dojde k chybě, může výpočetní prostředek stále existovat v chybovém stavu. Pokud se pokusíte znovu vytvořit výpočetní prostředek se stejným názvem, operace selže. Pokud chcete tuto chybu opravit, proveďte jednu z těchto akcí:

  • Vytvoření nového výpočetního prostředí s jiným názvem
  • Přejděte na web Azure Portal a odeberte původní výpočetní prostředek.