Udostępnij za pośrednictwem


Aprowizuj analizę w skali chmury

Proces wdrażania strefy docelowej zarządzania danymi

Zespół operacyjny platformy danych jest odpowiedzialny za wdrożenie strefy docelowej zarządzania danymi. Strefa docelowa zarządzania danymi powinna mieć własne repozytorium obsługiwane przez zespół operacyjny platformy danych.

Uwaga

Utwórz i wdróż strefę docelową zarządzania danymi przed wdrożeniem dowolnej strefy docelowej danych.

Proces wdrażania strefy docelowej danych

Zespoły mogą używać szablonów udostępnianych przez zespół operacyjny platformy danych, aby uniknąć rozpoczynania od podstaw dla każdego zasobu. Zalecamy wzorzec rozwidlania w celu zautomatyzowania wdrażania nowej strefy docelowej.

Na przykład zespół operacyjny strefy docelowej danych żąda nowej strefy docelowej danych przy użyciu narzędzia do zarządzania IT lub usługi Power Apps. Po zatwierdzeniu żądania uruchom następujący przepływ pracy przy użyciu parametrów żądania:

  1. Wdróż nową subskrypcję dla nowej strefy docelowej danych.
  2. Utwórz rozwidlenie główne szablonu strefy docelowej danych w celu utworzenia nowego repozytorium.
  3. Utwórz połączenie usługi w nowym repozytorium.
  4. Zaktualizuj parametry w nowym repozytorium na podstawie parametrów z żądania.
  5. Utwórz potok wdrażania w celu wdrożenia usług wyzwalanych za pomocą zaewidencjonowania zaktualizowanych parametrów.
  6. Powiadom zespół operacyjny strefy docelowej danych, że nowa strefa docelowa jest dostępna.

Zespół operacyjny strefy docelowej danych może teraz zmienić lub dodać szablony usługi Azure Resource Manager.

Ten przepływ pracy można zautomatyzować przy użyciu wielu zestawów usług na platformie Azure. Obsługa niektórych kroków, takich jak zmiana nazwy parametrów w plikach parametrów przy użyciu potoków ciągłej integracji/ciągłego wdrażania. Inne kroki można wykonać przy użyciu innych narzędzi orkiestracji przepływu pracy, takich jak Logic Apps.

Diagram of forked DevOps model.

Wzorzec rozwidlenia umożliwia zespołom aktualizowanie szablonów z oryginalnych szablonów używanych do ich rozwidlenia. Ponadto, jeśli ulepszenia lub nowe funkcje są implementowane w repozytoriach szablonów, zespoły operacyjne mogą ściągnąć je do rozwidlenia.

Zastosuj najlepsze rozwiązania dotyczące repozytoriów, takie jak:

  • Zabezpiecz gałąź główną.
  • Użyj gałęzi dla zmian, aktualizacji i ulepszeń.
  • Zdefiniuj właścicieli kodu, którzy zatwierdzają żądania ściągnięcia przed scaleniem zmian w gałęzi głównej.
  • Weryfikowanie gałęzi za pomocą testów automatycznych.
  • Ogranicz liczbę akcji i osób w zespole, takich jak osoby, które mogą wyzwalać potoki kompilacji i wydania.

Napiwek

Koordynowanie działań między zespołami w celu zapewnienia, że ulepszenia lub nowe funkcje w oryginalnych szablonach są replikowane we wszystkich wystąpieniach strefy docelowej danych. Zespoły ds. operacji mogą ściągnąć oryginalne zmiany szablonu do rozwidlenia.

Diagram of a data landing zone automation process.

Proces dołączania jest oddzielony od procesu wdrażania strefy docelowej danych. Ta separacja jest oparta na założeniu, że większość organizacji ma standardowy proces wdrażania subskrypcji platformy Azure w ramach modelu operacyjnego w chmurze. Proces dołączania wdraża standardowe składniki firmowe (takie jak narzędzie do zarządzania usługami IT innej firmy). Składniki specyficzne dla strefy docelowej danych są wdrażane w następnej kolejności.

Brak dostępnych interfejsów API usługi Git do klonowania/aktualizowania/zatwierdzania/wypychania w proponowanym rozwiązaniu automatyzacji. Dlatego naszym podejściem jest użycie konta usługi Azure Automation zawierającego elementy Runbook programu PowerShell, które:

  • Konfigurowanie strefy docelowej danych
  • Tworzenie rozwidlenia głównego repozytorium do repozytorium Git platformy danych
  • Konfigurowanie konfiguracji podsieci dla strefy docelowej danych
  • Konfigurowanie identyfikatora Entra firmy Microsoft

Elementy Runbook używają funkcji Git z modułu GitAutomation programu PowerShell do pracy z repozytoriami Git. Po zainstalowaniu tego modułu na koncie usługi Azure Automation użytkownicy mogą wykonywać operacje tworzenia, klonowania, wykonywania zapytań, wypychania, ściągania i zatwierdzania w repozytoriach Git. Na poniższej GitAutomation ilustracji przedstawiono moduł zainstalowany na koncie usługi Azure Automation:

Diagram of `GitAutomation` module for working with Git repositories.

Copy-GitRepository Użyj funkcji z modułuGitAutomation, aby sklonować główne repozytorium Git z adresu URL określonego przez URL do ścieżki git platformy danych określonej przez DestinationPath.

Takie podejście do wdrożenia strefy docelowej danych jest elastyczne, zapewniając jednocześnie zgodność akcji z wymaganiami organizacji. Zarządzanie cyklem życia jest włączone przez zastosowanie nowych funkcji lub optymalizacji z oryginalnych szablonów.

Proces wdrażania aplikacji danych

Po utworzeniu strefy docelowej danych dołączanie może rozpocząć się dla zespołów aplikacji danych. Zespoły ds. operacji platformy danych lub strefy docelowej danych udzielają zatwierdzenia wdrożenia.

Wdrożenie odbywa się bezpośrednio przy użyciu narzędzi DevOps lub wywoływane za pośrednictwem potoków/przepływów pracy uwidocznionych jako interfejsy API. Podobnie jak w przypadku strefy docelowej danych wdrożenie rozpoczyna się od rozwidlenia oryginalnego repozytorium aplikacji danych.

Diagram of the data application deployment automation.

  1. Użytkownik wysyła żądanie dotyczące nowych usług aplikacji danych.
  2. Proces przepływu pracy żąda zatwierdzenia przez zespół operacyjny platformy danych lub strefy docelowej danych.
  3. Przepływ pracy wywołuje interfejs API zarządzania usługami IT, aby utworzyć wymagane grupy zasobów i utworzyć połączenie usługi Azure DevOps. Przepływ pracy przypisuje zespół do projektu usługi Azure DevOps.
  4. Przepływ pracy tworzy oryginalne repozytorium aplikacji danych w celu utworzenia docelowego projektu usługi Azure DevOps.
  5. Przepływ pracy tworzy plik i potoki parametrów szablonu usługi Azure Resource Manager.
  6. Następnie przepływ pracy uruchamia potok platformy Azure w celu utworzenia wymagań sieciowych i innego potoku platformy Azure w celu wdrożenia usług aplikacji danych.
  7. Przepływ pracy powiadamia użytkownika po zakończeniu.

Napiwek

Jeśli dopiero zaczynasz korzystać z usługi DataOps, zapoznaj się z artykułem DataOps for the modern data warehouse hands-on lab in the Azure Architecture Center (Metodyka DataOps dla nowoczesnego magazynu danych w praktycznym laboratorium w Centrum architektury platformy Azure). W scenariuszu laboratorium opisano fikcyjne biuro planowania miasta, które może korzystać z tego rozwiązania wdrożeniowego. Rozwiązanie wdrożeniowe udostępnia kompleksowe potoki danych, które są zgodne ze wzorcem architektury nowoczesnego magazynu danych, wraz z odpowiednimi procesami DevOps i DataOps, w celu oceny korzystania z parkingu i podejmowania świadomych decyzji biznesowych.

Podsumowanie

Powyższe wzorce zapewniają kontrolę, elastyczność, samoobsługę i zarządzanie cyklem życia zasad.

Diagram of the overall DataOps model.

Na początku projektu platforma danych ma jeden projekt usługi Azure DevOps z co najmniej jedną usługą Azure Boards. Poszczególne zespoły DevOps koncentrują się na:

  • Jedno repozytorium strefy docelowej zarządzania danymi, potoków i połączenia usługi ze środowiskiem chmury.
  • Jedno repozytorium szablonów dla strefy docelowej danych, potoki w celu wdrożenia wystąpienia strefy docelowej danych i połączenia usługi ze środowiskami chmury.
  • Jedno repozytorium szablonów dla usług produktów danych, potoków w celu wdrożenia wystąpienia produktu danych i połączeń usług ze środowiskami w chmurze. Te połączenia są rozwidlenia ze strefy docelowej danych Usługi Azure DevOps Projects.

Po wdrożeniu stref docelowych danych analiza w skali chmury określa, że:

  • Każda strefa docelowa danych będzie miała własny projekt usługi Azure DevOps z co najmniej jedną usługą Azure Boards.
  • Dla każdej aplikacji danych rozwidlenie projektu usługi Azure DevOps strefy docelowej danych jest tworzone po zatwierdzeniu żądania.
  • Każda aplikacja danych obejmuje:
    • Połączenie z usługą.
    • Zarejestrowany potok.
    • Zespół DevOps z dostępem do tablicy i repozytorium platformy Azure.
    • Inny zestaw zasad dla rozwidlenia repozytorium.

Aby kontrolować wdrażanie aplikacji danych, wykonaj następujące rozwiązania:

  • Zespół operacyjny strefy docelowej danych jest właścicielem głównej gałęzi repozytorium i zabezpiecza go.
  • Tylko gałąź główna służy do wdrażania w środowiskach testowych i produkcyjnych.
  • Gałęzie funkcji mogą być wdrażane w środowiskach deweloperskich.
  • Gałęzie funkcji są własnością zespołów dataops. Są one używane do testowania nowych lub zmodyfikowanych funkcji.
  • Zespoły ds. operacji DataOps mogą scalać gałęzie funkcji z innymi gałęziami funkcji bez zatwierdzania.
  • Zespoły dataOps tworzą żądanie ściągnięcia w celu scalenia gałęzi funkcji z gałęzią główną, a zespół operacyjny strefy docelowej danych zapewnia zatwierdzenie.
  • Nowe funkcje lub ulepszenia oryginalnych szablonów są scalane z rozwidlonym repozytorium w celu ich aktualizowania.

Następne kroki