Lista kontrolna wprowadzenie
Podczas podróży do danych za pomocą analizy w skali chmury znajdziesz wiele etapów w cyklu życia wdrażania. Ta sekcja zawiera szybką listę kontrolną wprowadzającą, która ułatwia wdrażanie scenariusza na etapach. Te etapy to:
- Etap 1. Pierwsza strefa docelowa
- Etap 2. Dodatkowe domeny danych
- Etap 3. Zwiększanie gotowości zużycia
- Etap 4. Krytyczne składniki ładu
Etap 1 — pierwsza strefa docelowa
- Definiowanie pierwszych przypadków użycia
- Wdrażanie pierwszej strefy docelowej zarządzania danymi
- Wdrażanie pierwszej strefy docelowej danych
- Zdefiniuj pierwszy (pozyskiwanie) wzorzec (na przykład wsadowy parquet)
- Opracowywanie pierwszego produktu danych (pozyskanego nieprzetworzonego, abstrakcyjnego dla produktu)
- Określanie ładu "just-enough"
- Definiowanie wymagań dotyczących metadanych (informacje o aplikacji, metadane schematu)
- Rejestrowanie pierwszego konsumenta danych (proces ręczny)
Etap 2 — dodatkowe domeny danych
- Uściślij architekturę docelową
- Wdrażanie większej liczby stref docelowych danych
- Rozszerzanie na drugie, trzecie i czwarte produkty danych
- Zdaj sobie sprawę, że repozytorium metadanych produktu danych (baza danych lub program Excel)
- Implementowanie pierwszego zestawu kontrolek (jakość danych, walidacja schematu)
- Zdaj sobie sprawę z używanego potoku (biorąc dane wejściowe jako dane wyjściowe)
- Ustanawianie własności danych
Etap 3 — zwiększanie gotowości zużycia
- Implementowanie rejestracji samoobsługowej i pozyskiwania metadanych
- Oferowanie innych wzorców transformacji (struktura transformacji, narzędzia ETL itp.)
- Wzbogacanie kontrolek po stronie dostawcy (słownik, pochodzenie, połączenie)
- Implementowanie procesu zużywania: zatwierdzenia, metadane przypadku użycia, ręczne wdrażanie bezpiecznych widoków
- Ustanawianie tablicy kontroli ładu danych
Etap 4 — krytyczne składniki ładu
- Stosowanie automatyzacji (automatyczne aprowizowanie bezpiecznego widoku)
- Wdrażanie silnego ładu w zakresie danych, konfigurowanie organu sporu
- Finalizowanie wytycznych dotyczących produktów danych
- Definiowanie dodatkowego standardu współdziałania
- Opracowywanie samoobsługowego procesu zużycia danych
- Opracowywanie zapytań dotyczących danych, samoobsługi, katalogu, możliwości pochodzenia itp.
- Opracowywanie większej liczby możliwości platformy handlowej danych.
Podsumowanie
Te cztery etapy programowania umożliwiają skonfigurowanie minimalnego opłacalnego produktu na etapie drugim, nauka i iterowanie na etapie drugim. W całym podejściu etapowym rośnie dojrzałość do tworzenia samoobsługowej, skalowalnej i zarządzanej platformy.