Jak działa usługa Azure Machine Edukacja
Korzystanie z usługi Azure Machine Edukacja wymaga konta platformy Azure i subskrypcji platformy Azure. Subskrypcja ma standardowe i bezpłatne warstwy cenowe oraz udostępnia punkt końcowy i klucz subskrypcji w celu uzyskania dostępu do usługi.
Dostęp do usługi Azure Machine Edukacja w chmurze lub na komputerze lokalnym można uzyskać za pomocą zestawu SDK (Software Development Kit), interfejsu API REST i rozszerzenia interfejsu wiersza polecenia (CLI). Jeśli wolisz opcje niskiego lub braku kodu, usługa Azure Machine Edukacja Studio może służyć do szybkiego trenowania i wdrażania modeli uczenia maszynowego.
Usługa Azure Machine Edukacja zarządza wszystkimi zasobami potrzebnymi do cyklu życia uczenia maszynowego w obszarze roboczym. Obszary robocze mogą być współużytkowane przez wiele osób i obejmują takie elementy jak zasoby obliczeniowe dostępne dla notesów, klastrów szkoleniowych i potoków. Obszary robocze to również kontenery logiczne dla magazynów danych i repozytorium dla modeli i innych elementów w cyklu życia modelu.
Jak tworzyć modele uczenia maszynowego
Modele można tworzyć przy użyciu zestawu SDK, zaimportowanego ze struktur uczenia maszynowego lub bez kodu przy użyciu programu Azure Machine Edukacja Studio. Po nawiązaniu połączenia z obszarem roboczym można wybrać różne środowiska programistyczne ze wstępnie załadowanymi pakietami zawierającymi wyselekcjonowane środowiska dla popularnych platform, takich jak TensorFlow i PyTorch. Docelowe obiekty obliczeniowe można następnie wybrać, aby uruchomić skrypt trenowania lokalnie lub na maszynie wirtualnej w celu utworzenia modelu. Cele obliczeniowe w usłudze Azure Machine Edukacja mogą automatycznie skalować zadania w górę i zarządzać nimi w celu wydajnego używania zasobów procesora GPU i procesora CPU.
Stan przebiegów można rejestrować i monitorować natywnie za pośrednictwem zestawu SDK, usługi Azure Monitor i programu Azure Machine Edukacja Studio lub instalowania pakietów do uruchamiania bibliotek MLFlow i TensorBoard. Wizualizacja przebiegów trenowania można następnie wyświetlić w programie Azure Studio lub obszarze roboczym, aby przejść do szczegółów wyników i metryk.
W poniższym przykładzie zobaczymy, jak można dostosować wizualizację usługi Azure Machine Edukacja Studio, aby dodawać wykresy, porównywać dane i stosować filtry, aby lepiej analizować wyniki i metryki.
Eksperymenty
Aby wytrenować model w usłudze Azure Machine Edukacja, należy uruchomić eksperyment — czyli po uruchomieniu skryptu szkoleniowego, który może generować metryki i dane wyjściowe, które są śledzone. Możesz uruchomić ten sam eksperyment wiele razy z różnymi hiperparametrami, danymi, kodem lub ustawieniami. Obszar roboczy przechowuje historię wszystkich przebiegów trenowania, w tym dzienniki, metryki, dane wyjściowe i migawkę skryptów w środowisku. W projekcie współpracy dzienniki eksperymentów to doskonały sposób na przejrzenie i śledzenie postępu. Mogą pokazać, kto publikuje lub zmienia modele, dlaczego wprowadzono zmiany oraz kiedy modele zostały wdrożone lub używane w środowisku produkcyjnym.
Pipelines
Potok to przepływ pracy kompletnego zadania uczenia maszynowego, który może obejmować przygotowywanie danych, szkolenie, testowanie i wdrażanie. Potoki mają wiele zastosowań. Możesz utworzyć potok, który trenuje modele, tworzy przewidywania w czasie rzeczywistym lub taki, który czyści tylko dane. Ponieważ każdy krok w potoku jest niezależny, wiele osób może pracować nad różnymi krokami w ramach tego samego potoku jednocześnie. Usługa Azure Machine Edukacja Pipelines może zaoszczędzić czas, uruchamiając tylko kroki ponownego uruchamiania, których dane wejściowe uległy zmianie — znacząco zmniejszając środowiska uruchomieniowe, jeśli po prostu dopasujesz hiperparametry lub inne kroki. Zarówno usługa Azure Data Factory, jak i usługa Azure Pipelines udostępniają gotowe potoki dla usługi Azure Machine Edukacja, dzięki czemu można skupić się na uczeniu maszynowym zamiast infrastruktury.
Zasoby danych
Zasoby danych można tworzyć na podstawie magazynów danych, publicznych adresów URL i zestawów danych Usługi Azure Open. Tworząc zasób danych, odwołujesz się do lokalizacji źródła danych — dlatego dane z zestawów szkoleniowych i potoków będą przechowywane bez zmiany oryginalnych danych. Zasoby danych można następnie rejestrować, wersjonować, śledzić i śledzić w celu umożliwienia ponownego użycia i udostępniania w zespołach, rolach i eksperymentach. Przechowywanie wersji powtarzalnych eksperymentów jest również możliwe, co umożliwia lepszą analizę wydajności danych i wydajności modelu.
Usługa Azure Machine Edukacja może okresowo sprawdzać, czy nowo przechowywane dane są odświeżane przyrostowo, umożliwiając automatyczne aktualizowanie zasobów danych po dodaniu nowych danych do magazynu danych. T
Etykietowanie
Etykietowanie danych to scentralizowane miejsce do tworzenia zadań etykietowania, zarządzania nimi i monitorowania ich. Wszystkie projekty etykietowania danych można administrować za pośrednictwem pulpitu nawigacyjnego usługi Azure Machine Edukacja studio lub obszaru roboczego, w którym członkowie zespołu mogą wyświetlać postępy i pomagać w projektach etykietowania wspólnego. W tym miejscu może odbywać się etykietowanie pętli human-in-the-loop, dzięki czemu członkowie zespołu mogą ręcznie dodawać tagi do trenowania modeli etykietowania uczenia maszynowego. Po przesłaniu wystarczającej liczby etykiet model klasyfikacji jest używany do przewidywania tagów. Członkowie zespołu mogą następnie akceptować lub odrzucać wystąpienia danych oznaczonych tagiem uczenia maszynowego, aby pomóc w wytrenowaniu dokładności modelu etykietowania. W końcu model będzie mógł oznaczać dane bez pomocy.
Poniżej przedstawiono przykład zadania etykietowania w toku w usłudze Azure Machine Edukacja Studio.
Wdrażanie modeli uczenia maszynowego
Usługa Azure Machine Edukacja może pakować i uruchamiać modele w kontenerach platformy Docker na potrzeby wdrażania. Te kontenery są oddzielone od skryptu uruchamiania, dzięki czemu można szybko zamienić lub zaktualizować modele przy użyciu ulepszonych, pozostawiając skrypt niezmodyfikowany.
Model można również pobrać do formatu Open Neural Network Exchange (ONNX ), który zapewnia szeroką elastyczność potencjalnych platform wdrażania i urządzeń, takich jak iOS, Android i Linux.
Usługa Azure Machine Edukacja udostępnia wstępnie spakowane obrazy kontenerów, które obejmują stabilne środowiska ze wstępnie załadowanymi pakietami i ustawieniami języka Python. Te obrazy kontenerów ułatwiają wdrażanie w popularnych platformach uczenia maszynowego, takich jak TensorFlow i PyTorch przy minimalnej konfiguracji.