Operacje uczenia maszynowego

Artykuł
07/16/2024

W tym artykule opisano trzy architektury platformy Azure dla operacji uczenia maszynowego, które mają kompleksowe potoki ciągłej integracji i ciągłego dostarczania (CI/CD) oraz potoki ponownego trenowania. Architektury są przeznaczone dla tych aplikacji sztucznej inteligencji:

Klasyczne uczenie maszynowe
Przetwarzanie obrazów (CV)
Przetwarzanie języka naturalnego

Te architektury są produktem projektu MLOps w wersji 2. Obejmują one najlepsze rozwiązania, które architekci rozwiązań zidentyfikowali w procesie opracowywania różnych rozwiązań uczenia maszynowego. Wynik jest możliwy do wdrożenia, powtarzalny i konserwowalny wzorce. Wszystkie trzy architektury korzystają z usługi Azure Machine Learning.

Aby zapoznać się z implementacją z przykładowymi szablonami wdrażania dla metodyki MLOps w wersji 2, zobacz Akcelerator rozwiązań usługi Azure MLOps w wersji 2.

Potencjalne przypadki użycia

Klasyczne uczenie maszynowe: prognozowanie szeregów czasowych, regresja i klasyfikacja danych tabelarycznych ze strukturą są najczęstszymi przypadkami użycia w tej kategorii. Oto kilka przykładów:
- Klasyfikacja binarna i wieloaskładowa.
- Regresja liniowa, wielomianowa, grzbietowa, lasso, kwantylowa i bayesyjna.
- ARIMA, autoregressive, SARIMA, VAR, SES, LSTM.
CV: Struktura MLOps w tym artykule koncentruje się głównie na przypadkach użycia CV segmentacji i klasyfikacji obrazów.
Przetwarzanie języka naturalnego: możesz użyć tej platformy MLOps do zaimplementowania:
- Rozpoznawanie nazwanych jednostek:
- Klasyfikacja tekstu
- Generowanie tekstu
- Analiza opinii
- Tłumaczenie
- Odpowiadanie na pytania
- Podsumowanie
- Wykrywanie zdań
- Wykrywanie języka
- Tagowanie części mowy

W tym artykule nie opisano symulacji sztucznej inteligencji, uczenia głębokiego wzmacniania i innych form sztucznej inteligencji.

Architektura

Wzorzec architektury MLOps w wersji 2 ma cztery główne składniki modułowe lub fazy cyklu życia metodyki MLOps:

Majątek danych
Administracja i instalacja
Programowanie modelu lub faza pętli wewnętrznej
Wdrażanie modelu lub faza pętli zewnętrznej

Powyższe składniki, połączenia między nimi i typowe osoby, których dotyczy, są standardami we wszystkich architekturach scenariuszy MLOps w wersji 2. Różnice w szczegółach poszczególnych składników zależą od scenariusza.

Podstawowa architektura metodyki MLOps w wersji 2 dla uczenia maszynowego to klasyczny scenariusz uczenia maszynowego dla danych tabelarycznych. Architektury CV i NLP są oparte na architekturze podstawowej i modyfikują je.

Metodyka MLOps w wersji 2 obejmuje następujące architektury opisane w tym artykule:

Klasyczna architektura uczenia maszynowego
Architektura CV usługi Machine Learning
Architektura przetwarzania języka naturalnego usługi Machine Learning

Klasyczna architektura uczenia maszynowego

Pobierz plik programu Visio z tą architekturą.

Przepływ pracy dla klasycznej architektury uczenia maszynowego

Majątek danych

Ten składnik ilustruje majątek danych organizacji oraz potencjalne źródła danych i cele dla projektu nauki o danych. Inżynierowie danych są głównymi właścicielami tego składnika cyklu życia metodyki MLOps w wersji 2. Platformy danych platformy Azure na tym diagramie nie są wyczerpujące ani normatywne. Zielony znacznik wyboru wskazuje źródła danych i cele reprezentujące zalecane najlepsze rozwiązania oparte na przypadku użycia klienta.
Administracja i instalacja

Ten składnik jest pierwszym krokiem we wdrożeniu akceleratora MLOps w wersji 2. Składa się z wszystkich zadań związanych z tworzeniem i zarządzaniem zasobami i rolami skojarzonymi z projektem. Na przykład zespół infrastruktury może:
1. Tworzenie repozytoriów kodu źródłowego projektu.
2. Tworzenie obszarów roboczych usługi Machine Learning za pomocą narzędzia Bicep lub Terraform.
3. Tworzenie lub modyfikowanie zestawów danych i zasobów obliczeniowych na potrzeby tworzenia i wdrażania modelu.
4. Definiowanie użytkowników zespołu projektu, ich ról i kontroli dostępu do innych zasobów.
5. Tworzenie potoków ciągłej integracji/ciągłego wdrażania.
6. Tworzenie składników monitorowania w celu zbierania i tworzenia alertów dotyczących metryk modelu i infrastruktury.
Podstawową osobą skojarzą z tą fazą jest zespół infrastruktury, ale organizacja może również mieć inżynierów danych, inżynierów uczenia maszynowego lub analityków danych.
Programowanie modelu (faza pętli wewnętrznej)

Faza pętli wewnętrznej składa się z iteracyjnego przepływu pracy nauki o danych, który działa w dedykowanym i bezpiecznym obszarze roboczym uczenia maszynowego. Na powyższym diagramie przedstawiono typowy przepływ pracy. Proces rozpoczyna się od pozyskiwania danych, przechodzi przez eksploracyjne analizy danych, eksperymentowanie, opracowywanie i ewaluację modelu, a następnie rejestruje model do użytku produkcyjnego. Ten modułowy składnik zaimplementowany w akceleratorze MLOps w wersji 2 jest niezależny i dostosowywany do procesu używanego przez zespół ds. nauki o danych do tworzenia modeli.

Osoby skojarzone z tą fazą obejmują analityków danych i inżynierów uczenia maszynowego.
Rejestry usługi Machine Learning

Gdy zespół ds. nauki o danych opracuje model, który może wdrożyć w środowisku produkcyjnym, zarejestruje model w rejestrze obszarów roboczych usługi Machine Learning. Potoki ciągłej integracji, które są wyzwalane automatycznie przez rejestrację modelu lub przez zatwierdzenie przez człowieka w pętli, podwyższanie poziomu modelu i innych zależności modelu do fazy wdrażania modelu.

Osoby skojarzone z tym etapem są zwykle inżynierami uczenia maszynowego.
Wdrażanie modelu (faza pętli zewnętrznej)

Wdrożenie modelu lub faza pętli zewnętrznej składa się z etapu przedprodukcyjnego i testowania, wdrażania produkcyjnego oraz monitorowania modelu, danych i infrastruktury. Gdy model spełnia kryteria organizacji i przypadku użycia, potoki ciągłego wdrażania promują model i powiązane zasoby za pośrednictwem środowiska produkcyjnego, monitorowania i potencjalnego ponownego trenowania.

Osoby skojarzone z tą fazą są głównie inżynierami uczenia maszynowego.
Przemieszczanie i testowanie

Faza przemieszczania i testowania różni się w zależności od praktyk klienta. Ta faza obejmuje zazwyczaj operacje, takie jak ponowne trenowanie i testowanie kandydata modelu na danych produkcyjnych, wdrożenia testowe pod kątem wydajności punktu końcowego, kontrole jakości danych, testy jednostkowe i odpowiedzialne sprawdzanie sztucznej inteligencji pod kątem uprzedzeń modelu i danych. Ta faza odbywa się w co najmniej jednym dedykowanym i bezpiecznym obszarze roboczym usługi Machine Learning.
Wdrożenie produkcyjne

Gdy model przejdzie etap przejściowy i testowy, inżynierowie uczenia maszynowego mogą używać zatwierdzenia bramkowanego przez człowieka do produkcji. Opcje wdrażania modelu obejmują zarządzany punkt końcowy wsadowy dla scenariuszy wsadowych lub zarządzanego punktu końcowego online lub wdrożenia kubernetes, które korzysta z usługi Azure Arc na potrzeby scenariuszy online niemal w czasie rzeczywistym. Produkcja zwykle odbywa się w co najmniej jednym dedykowanym i bezpiecznym obszarze roboczym usługi Machine Learning.
Monitorowanie

Inżynierowie uczenia maszynowego monitorują składniki w środowisku przejściowym, testowym i produkcyjnym, aby zbierać metryki związane ze zmianami wydajności modelu, danych i infrastruktury. Mogą używać tych metryk do podjęcia działań. Monitorowanie modeli i danych może obejmować sprawdzanie dryfu modelu i danych, wydajność modelu na nowych danych oraz problemy z odpowiedzialną sztuczną inteligencją. Monitorowanie infrastruktury może identyfikować powolną reakcję punktu końcowego, niewystarczającą pojemność obliczeniową lub problemy z siecią.
Monitorowanie danych i modeli: zdarzenia i akcje

Na podstawie kryteriów modelu i danych, takich jak progi metryk lub harmonogramy, automatyczne wyzwalacze i powiadomienia mogą implementować odpowiednie akcje do wykonania. Na przykład wyzwalacz może ponownie wytrenować model w celu użycia nowych danych produkcyjnych, a następnie sprzężenia zwrotnego modelu do przemieszczania i testowania na potrzeby oceny przedprodukcyjnej. Lub problem z modelem lub danymi może wywołać akcję, która wymaga sprzężenia zwrotnego do fazy opracowywania modelu, w której analitycy danych mogą zbadać problem i potencjalnie opracować nowy model.
Monitorowanie infrastruktury: zdarzenia i akcje

Zautomatyzowane wyzwalacze i powiadomienia mogą implementować odpowiednie akcje w celu wykonania na podstawie kryteriów infrastruktury, takich jak opóźnienie odpowiedzi punktu końcowego lub niewystarczające zasoby obliczeniowe dla wdrożenia. Wyzwalacze automatyczne i powiadomienia mogą wyzwalać sprzężenie zwrotne do fazy konfiguracji i administrowania, w której zespół infrastruktury może zbadać problem i potencjalnie ponownie skonfigurować zasoby obliczeniowe i sieciowe.

Architektura CV usługi Machine Learning

Pobierz plik programu Visio z tą architekturą.

Przepływ pracy dla architektury CV

Architektura CV usługi Machine Learning jest oparta na klasycznej architekturze uczenia maszynowego, ale ma modyfikacje specyficzne dla nadzorowanych scenariuszy CV.

Majątek danych

Ten składnik przedstawia zasoby danych organizacji oraz potencjalne źródła danych i cele dla projektu nauki o danych. Inżynierowie danych są głównymi właścicielami tego składnika w cyklu życia metodyki MLOps w wersji 2. Platformy danych platformy Azure na tym diagramie nie są wyczerpujące ani normatywne. Obrazy scenariuszy CV mogą pochodzić z różnych źródeł danych. Aby uzyskać wydajność podczas tworzenia i wdrażania modeli CV za pomocą usługi Machine Learning, zalecamy usługę Azure Blob Storage i usługę Azure Data Lake Storage.
Administracja i instalacja

Ten składnik jest pierwszym krokiem we wdrożeniu akceleratora MLOps w wersji 2. Składa się z wszystkich zadań związanych z tworzeniem i zarządzaniem zasobami i rolami skojarzonymi z projektem. W przypadku scenariuszy CV administracja i konfiguracja środowiska MLOps w wersji 2 jest w dużej mierze taka sama jak w przypadku klasycznego uczenia maszynowego, ale obejmuje dodatkowy krok. Zespół ds. infrastruktury używa funkcji etykietowania usługi Machine Learning lub innego narzędzia do tworzenia projektów etykietowania obrazów i adnotacji.
Programowanie modelu (faza pętli wewnętrznej)

Faza pętli wewnętrznej składa się z iteracyjnego przepływu pracy nauki o danych wykonywanego w dedykowanym i bezpiecznym obszarze roboczym usługi Machine Learning. Podstawową różnicą między tym przepływem pracy a klasycznym scenariuszem uczenia maszynowego jest to, że etykietowanie obrazów i adnotacja to kluczowy składnik tej pętli programowania.
Rejestry usługi Machine Learning

Gdy zespół ds. nauki o danych opracuje model, który może wdrożyć w środowisku produkcyjnym, zarejestruje model w rejestrze obszarów roboczych usługi Machine Learning. Potoki ciągłej integracji wyzwalane automatycznie przez rejestrację modelu lub przez zatwierdzenie przez człowieka w pętli promują model i wszelkie inne zależności modelu do fazy wdrażania modelu.
Wdrażanie modelu (faza pętli zewnętrznej)

Faza wdrażania modelu lub pętli zewnętrznej składa się z etapu przedprodukcyjnego i testowania, wdrażania produkcyjnego oraz monitorowania modelu, danych i infrastruktury. Gdy model spełnia kryteria organizacji i przypadku użycia, potoki ciągłego wdrażania promują model i powiązane zasoby za pośrednictwem środowiska produkcyjnego, monitorowania i potencjalnego ponownego trenowania.
Przemieszczanie i testowanie

Faza przemieszczania i testowania różni się w zależności od praktyk klienta. Ta faza obejmuje zazwyczaj operacje, takie jak wdrożenia testowe pod kątem wydajności punktu końcowego, kontrole jakości danych, testowanie jednostkowe i kontrole odpowiedzialnej sztucznej inteligencji pod kątem stronniczych modeli i danych. W przypadku scenariuszy CV inżynierowie uczenia maszynowego nie muszą ponownie trenować kandydata modelu na danych produkcyjnych z powodu ograniczeń dotyczących zasobów i czasu. Zespół ds. nauki o danych może zamiast tego używać danych produkcyjnych do tworzenia modeli. Model kandydata zarejestrowany w pętli programowania jest oceniany pod kątem produkcji. Ta faza odbywa się w co najmniej jednym dedykowanym i bezpiecznym obszarze roboczym usługi Machine Learning.
Wdrożenie produkcyjne

Gdy model przejdzie etap przejściowy i testowy, inżynierowie uczenia maszynowego mogą używać zatwierdzenia bramkowanego przez człowieka do produkcji. Opcje wdrażania modelu obejmują zarządzany punkt końcowy wsadowy dla scenariuszy wsadowych lub zarządzanego punktu końcowego online lub wdrożenia kubernetes, które korzysta z usługi Azure Arc na potrzeby scenariuszy online niemal w czasie rzeczywistym. Produkcja zwykle odbywa się w co najmniej jednym dedykowanym i bezpiecznym obszarze roboczym usługi Machine Learning.
Monitorowanie

Inżynierowie uczenia maszynowego monitorują składniki w środowisku przejściowym, testowym i produkcyjnym, aby zbierać metryki związane ze zmianami wydajności modelu, danych i infrastruktury. Mogą używać tych metryk do podjęcia działań. Monitorowanie modeli i danych może obejmować sprawdzanie wydajności modelu na nowych obrazach. Monitorowanie infrastruktury może identyfikować powolną reakcję punktu końcowego, niewystarczającą pojemność obliczeniową lub problemy z siecią.
Monitorowanie danych i modeli: zdarzenia i akcje

Fazy monitorowania danych i modelu oraz zdarzenia i akcji metodyki MLOps na potrzeby przetwarzania języka naturalnego są kluczowymi różnicami w porównaniu z klasycznym uczeniem maszynowym. Automatyczne ponowne trenowanie zwykle nie jest wykonywane w scenariuszach CV, gdy wykryto obniżenie wydajności modelu na nowych obrazach. W takim przypadku proces pętli human-in-the-loop jest niezbędny do przejrzenia i dodawania adnotacji do nowych danych tekstowych dla modelu, który działa źle. Następna akcja często wraca do pętli tworzenia modelu w celu zaktualizowania modelu przy użyciu nowych obrazów.
Monitorowanie infrastruktury: zdarzenia i akcje

Zautomatyzowane wyzwalacze i powiadomienia mogą implementować odpowiednie akcje w celu wykonania na podstawie kryteriów infrastruktury, takich jak opóźnienie odpowiedzi punktu końcowego lub niewystarczające zasoby obliczeniowe dla wdrożenia. Wyzwalacze automatyczne i powiadomienia mogą wyzwalać sprzężenie zwrotne do fazy konfiguracji i administrowania, w której zespół infrastruktury może zbadać problem i potencjalnie ponownie skonfigurować środowisko, zasoby obliczeniowe i sieciowe.

Architektura przetwarzania języka naturalnego usługi Machine Learning

Pobierz plik programu Visio z tą architekturą.

Przepływ pracy dla architektury przetwarzania języka naturalnego

Architektura przetwarzania języka naturalnego usługi Machine Learning jest oparta na klasycznej architekturze uczenia maszynowego, ale ma pewne modyfikacje specyficzne dla scenariuszy NLP.

Majątek danych

Ten składnik przedstawia zasoby danych organizacji oraz potencjalne źródła danych i cele dla projektu nauki o danych. Inżynierowie danych są głównymi właścicielami tego składnika w cyklu życia metodyki MLOps w wersji 2. Platformy danych platformy Azure na tym diagramie nie są wyczerpujące ani normatywne. Zielony znacznik wyboru wskazuje źródła i cele reprezentujące zalecane najlepsze rozwiązania oparte na przypadku użycia klienta.
Administracja i instalacja

Ten składnik jest pierwszym krokiem we wdrożeniu akceleratora MLOps w wersji 2. Składa się z wszystkich zadań związanych z tworzeniem i zarządzaniem zasobami i rolami skojarzonymi z projektem. W przypadku scenariuszy przetwarzania języka naturalnego administracja i konfiguracja środowiska MLOps w wersji 2 jest w dużej mierze taka sama jak w przypadku klasycznego uczenia maszynowego, ale z dodatkowym krokiem: tworzenie projektów etykietowania obrazów i adnotacji przy użyciu funkcji etykietowania usługi Machine Learning lub innego narzędzia.
Programowanie modelu (faza pętli wewnętrznej)

Faza pętli wewnętrznej składa się z iteracyjnego przepływu pracy nauki o danych wykonywanego w dedykowanym i bezpiecznym obszarze roboczym usługi Machine Learning. Typowa pętla programowania modelu NLP różni się od klasycznego scenariusza uczenia maszynowego, ponieważ typowe kroki programistyczne dla tego scenariusza obejmują adnotacje dla zdań i tokenizacji, normalizacji i osadzania danych tekstowych.
Rejestry usługi Machine Learning

Gdy zespół ds. nauki o danych opracuje model, który może wdrożyć w środowisku produkcyjnym, zarejestruje model w rejestrze obszarów roboczych usługi Machine Learning. Potoki ciągłej integracji wyzwalane automatycznie przez rejestrację modelu lub przez zatwierdzenie przez człowieka w pętli promują model i wszelkie inne zależności modelu do fazy wdrażania modelu.
Wdrażanie modelu (faza pętli zewnętrznej)

Faza wdrażania modelu lub pętli zewnętrznej składa się z etapu przedprodukcyjnego i testowania, wdrażania produkcyjnego oraz monitorowania modelu, danych i infrastruktury. Gdy model spełnia kryteria organizacji i przypadku użycia, potoki ciągłego wdrażania promują model i powiązane zasoby za pośrednictwem środowiska produkcyjnego, monitorowania i potencjalnego ponownego trenowania.
Przemieszczanie i testowanie

Faza przemieszczania i testowania różni się w zależności od praktyk klienta. Ta faza obejmuje zazwyczaj operacje, takie jak ponowne trenowanie i testowanie kandydata modelu na danych produkcyjnych, wdrożenia testowe pod kątem wydajności punktu końcowego, kontrole jakości danych, testy jednostkowe i odpowiedzialne sprawdzanie sztucznej inteligencji pod kątem uprzedzeń modelu i danych. Ta faza odbywa się w co najmniej jednym dedykowanym i bezpiecznym obszarze roboczym usługi Machine Learning.
Wdrożenie produkcyjne

Gdy model przejdzie etap przejściowy i testowy, inżynierowie uczenia maszynowego mogą używać zatwierdzenia bramkowanego przez człowieka do produkcji. Opcje wdrażania modelu obejmują zarządzany punkt końcowy wsadowy dla scenariuszy wsadowych lub zarządzanego punktu końcowego online lub wdrożenia kubernetes, które korzysta z usługi Azure Arc na potrzeby scenariuszy online niemal w czasie rzeczywistym. Produkcja zwykle odbywa się w co najmniej jednym dedykowanym i bezpiecznym obszarze roboczym usługi Machine Learning.
Monitorowanie

Inżynierowie uczenia maszynowego monitorują składniki w środowisku przejściowym, testowym i produkcyjnym, aby zbierać metryki związane ze zmianami wydajności modelu, danych i infrastruktury. Mogą używać tych metryk do podjęcia działań. Monitorowanie modelu i danych może obejmować sprawdzanie dryfu modelu i danych, wydajność modelu na nowych danych tekstowych i problemy z odpowiedzialną sztuczną inteligencją. Monitorowanie infrastruktury może identyfikować problemy, takie jak powolne reagowanie na punkty końcowe, niewystarczająca pojemność obliczeniowa i problemy z siecią.
Monitorowanie danych i modeli: zdarzenia i akcje

Podobnie jak w przypadku architektury CV, fazy monitorowania danych i modelu oraz zdarzenia i akcji metodyki MLOps na potrzeby przetwarzania języka naturalnego są kluczowymi różnicami w porównaniu z klasycznym uczeniem maszynowym. Automatyczne ponowne trenowanie nie jest zwykle wykonywane w scenariuszach przetwarzania języka naturalnego, gdy wykryto obniżenie wydajności modelu na nowym tekście. W takim przypadku proces pętli human-in-the-loop jest niezbędny do przejrzenia i dodawania adnotacji do nowych danych tekstowych dla modelu, który działa źle. Często kolejną akcją jest powrót do pętli tworzenia modelu w celu zaktualizowania modelu przy użyciu nowych danych tekstowych.
Monitorowanie infrastruktury: zdarzenia i akcje

Zautomatyzowane wyzwalacze i powiadomienia mogą implementować odpowiednie akcje w celu wykonania na podstawie kryteriów infrastruktury, takich jak opóźnienie odpowiedzi punktu końcowego lub niewystarczające zasoby obliczeniowe dla wdrożenia. Wyzwalacze automatyczne i powiadomienia mogą wyzwalać sprzężenie zwrotne do fazy konfiguracji i administrowania, w której zespół infrastruktury może zbadać problem i potencjalnie ponownie skonfigurować zasoby obliczeniowe i sieciowe.

Składniki

Machine Learning to usługa w chmurze, której można użyć do trenowania, oceniania, wdrażania i zarządzania modelami uczenia maszynowego na dużą skalę.
Azure Pipelines to system kompilacji i testowania oparty na usłudze Azure DevOps, który jest używany do tworzenia i wydawania potoków. Usługa Azure Pipelines dzieli te potoki na kroki logiczne nazywane zadaniami.
GitHub to platforma hostingu kodu do kontroli wersji, współpracy i przepływów pracy ciągłej integracji/ciągłego wdrażania.
Azure Arc to platforma, która używa usługi Azure Resource Manager do zarządzania zasobami platformy Azure i zasobami lokalnymi. Zasoby mogą obejmować maszyny wirtualne, klastry Kubernetes i bazy danych.
Kubernetes to system typu open source, którego można użyć do automatyzacji wdrażania, skalowania i zarządzania konteneryzowanymi aplikacjami.
Azure Data Lake Storage to system plików zgodny z usługą Hadoop. Ma zintegrowaną hierarchiczną przestrzeń nazw oraz ogromną skalę i gospodarkę usługi Blob Storage.
Azure Synapse Analytics to nieograniczona usługa analizy, która łączy integrację danych, magazynowanie danych przedsiębiorstwa i analizę danych big data.
Azure Event Hubs to usługa, która pozyskuje strumienie danych generowane przez aplikacje klienckie. Następnie pozyskuje i przechowuje dane przesyłane strumieniowo, co zachowuje sekwencję odebranych zdarzeń. Klienci mogą łączyć się z punktami końcowymi centrum, aby pobierać komunikaty do przetwarzania. Ta architektura korzysta z integracji usługi Data Lake Storage.

Inne uwagi

Powyższy wzorzec architektury MLOps w wersji 2 ma kilka krytycznych składników, w tym kontrolę dostępu opartą na rolach (RBAC), która jest zgodna z osobami biorącymi udział w projekcie biznesowym, wydajnym zarządzaniem pakietami i niezawodnymi mechanizmami monitorowania. Te składniki wspólnie przyczyniają się do pomyślnej implementacji i zarządzania przepływami pracy uczenia maszynowego.

Kontrola dostępu oparta na rolach oparta na osobach

Niezwykle ważne jest zarządzanie dostępem do danych i zasobów uczenia maszynowego. Kontrola dostępu oparta na rolach zapewnia niezawodną platformę, która ułatwia zarządzanie osobami, które mogą wykonywać określone działania i uzyskiwać dostęp do określonych obszarów w rozwiązaniu. Zaprojektuj strategię segmentacji tożsamości, aby dostosować się do cyklu życia modeli uczenia maszynowego w usłudze Machine Learning i osobach uwzględnionych w procesie. Każda osoba ma określony zestaw obowiązków, które są odzwierciedlane w rolach RBAC i członkostwie w grupach.

Przykładowe osoby

Aby zapewnić obsługę odpowiedniej segmentacji w obciążeniu uczenia maszynowego, rozważ następujące typowe osoby, które informują o projekcie grupy RBAC opartej na tożsamościach.

Analityk danych i inżynier uczenia maszynowego

Analitycy danych i inżynierowie uczenia maszynowego wykonują różne działania związane z uczeniem maszynowym i nauką o danych w całym cyklu życia tworzenia oprogramowania projektu. Ich obowiązki obejmują eksploracyjne analizowanie danych i wstępne przetwarzanie danych. Analitycy danych i inżynierowie uczenia maszynowego są odpowiedzialni za szkolenie, ocenianie i wdrażanie modeli. Obowiązki tych ról obejmują również działania naprawy przerwania dla modeli uczenia maszynowego, pakietów i danych. Te obowiązki są poza zakresem zespołu pomocy technicznej platformy.