Udostępnij za pośrednictwem


Lista kontrolna wprowadzenie

Podczas podróży do danych za pomocą analizy w skali chmury znajdziesz wiele etapów w cyklu życia wdrażania. Ta sekcja zawiera szybką listę kontrolną wprowadzającą, która ułatwia wdrażanie scenariusza na etapach. Te etapy to:

  • Etap 1. Pierwsza strefa docelowa
  • Etap 2. Dodatkowe domeny danych
  • Etap 3. Zwiększanie gotowości zużycia
  • Etap 4. Krytyczne składniki ładu

Etap 1 — pierwsza strefa docelowa

  • Definiowanie pierwszych przypadków użycia
  • Wdrażanie pierwszej strefy docelowej zarządzania danymi
  • Wdrażanie pierwszej strefy docelowej danych
  • Zdefiniuj pierwszy (pozyskiwanie) wzorzec (na przykład wsadowy parquet)
  • Opracowywanie pierwszego produktu danych (pozyskanego nieprzetworzonego, abstrakcyjnego dla produktu)
  • Określanie ładu "just-enough"
  • Definiowanie wymagań dotyczących metadanych (informacje o aplikacji, metadane schematu)
  • Rejestrowanie pierwszego konsumenta danych (proces ręczny)

Etap 2 — dodatkowe domeny danych

  • Uściślij architekturę docelową
  • Wdrażanie większej liczby stref docelowych danych
  • Rozszerzanie na drugie, trzecie i czwarte produkty danych
  • Zdaj sobie sprawę, że repozytorium metadanych produktu danych (baza danych lub program Excel)
  • Implementowanie pierwszego zestawu kontrolek (jakość danych, walidacja schematu)
  • Zdaj sobie sprawę z używanego potoku (biorąc dane wejściowe jako dane wyjściowe)
  • Ustanawianie własności danych

Etap 3 — zwiększanie gotowości zużycia

  • Implementowanie rejestracji samoobsługowej i pozyskiwania metadanych
  • Oferowanie innych wzorców transformacji (struktura transformacji, narzędzia ETL itp.)
  • Wzbogacanie kontrolek po stronie dostawcy (słownik, pochodzenie, połączenie)
  • Implementowanie procesu zużywania: zatwierdzenia, metadane przypadku użycia, ręczne wdrażanie bezpiecznych widoków
  • Ustanawianie tablicy kontroli ładu danych

Etap 4 — krytyczne składniki ładu

  • Stosowanie automatyzacji (automatyczne aprowizowanie bezpiecznego widoku)
  • Wdrażanie silnego ładu w zakresie danych, konfigurowanie organu sporu
  • Finalizowanie wytycznych dotyczących produktów danych
  • Definiowanie dodatkowego standardu współdziałania
  • Opracowywanie samoobsługowego procesu zużycia danych
  • Opracowywanie zapytań dotyczących danych, samoobsługi, katalogu, możliwości pochodzenia itp.
  • Opracowywanie większej liczby możliwości platformy handlowej danych.

Podsumowanie

Te cztery etapy programowania umożliwiają skonfigurowanie minimalnego opłacalnego produktu na etapie drugim, nauka i iterowanie na etapie drugim. W całym podejściu etapowym rośnie dojrzałość do tworzenia samoobsługowej, skalowalnej i zarządzanej platformy.

Następne kroki