Strategia wykonawcza dotycząca ujednolicania danych

Cel danych: Każda organizacja chce, aby jej dane napędzały pewne decyzje biznesowe. Dane muszą być zaufane, łatwe do ponownego użycia na potrzeby analizy i sztucznej inteligencji oraz domyślnie bezpieczne. Wyzwanie dotyczące danych: W przypadku większości organizacji ten cel jest trudny do osiągnięcia. Dane są rozmieszczone w systemach i zespołach. Standardy różnią się. Zarządzanie jest niespójne. Te problemy sprawiają, że analiza i sztuczna inteligencja są trudne do użycia z ufnością.

Data solution: Wiele organizacji zajmuje się tym wyzwaniem, ujednolicając platformę danych przy użyciu Microsoft Fabric. Fabric umożliwia zespołom tworzenie zaufanych produktów danych, które mogą być zarządzane i bezpiecznie używane do analizy i sztucznej inteligencji w całej organizacji (zobacz Rysunek 1). Te wskazówki zapewniają osobom podejmującym decyzje strukturę, której potrzebują, aby wprowadzić tę zmianę i ustanowić ujednoliconą podstawę danych.

Diagram wysokiego poziomu pokazujący Microsoft Fabric w centrum ujednoliconej platformy danych. Dane ze źródeł przedsiębiorstwa, takie jak systemy lokalne, usługi Microsoft i platformy chmury publicznej, przepływają do Fabric, gdzie są zorganizowane jako udostępnione produkty danych. Te produkty danych są następnie używane w całej organizacji do obsługi analiz, systemów sztucznej inteligencji i raportowania, w tym obciążeń Power BI i nauki o danych. Fabric łączy się z Azure w celu zapewnienia ładu, bezpieczeństwa i monitorowania, podczas gdy obciążenia Azure są uruchamiane razem z nim według potrzeb. Ogólny przepływ pokazuje dane wchodzące do Fabric, zarządzane i ustandaryzowane, które następnie zasilają sztuczną inteligencję, analitykę oraz wgląd w biznes w całej organizacji. Rysunek 1. Ujednolicona platforma danych dla sztucznej inteligencji i analityki.

Dlaczego ujednolicona platforma danych z Fabric?

Większość liderów biznesowych i technologicznych rozumie koszt fragmentowanych danych. To, co często je powstrzymuje, to przekonanie, że ich naprawienie wymaga dużych, ryzykownych migracji. Microsoft Fabric przyjmuje inne podejście i zapewnia wartość bez zakłóceń. Najważniejsze korzyści to:

  • Minimalne zakłócenia biznesowe: Fabric łączy się z istniejącymi systemami przy użyciu wirtualizacji (ułatwień) i replikacji selektywnej (odzwierciedlanie). Zespoły mogą ujednolicić dostęp do danych bez przerywania bieżących operacji.

  • Wbudowane zarządzanie: Fabric łączy inżynierię danych, analitykę i BI na jednej platformie. Zasady zabezpieczeń i ładu są definiowane raz i stosowane spójnie, zamiast ponownie tworzone i wymuszane inaczej w wielu narzędziach.

  • Foundation for AI and analytics: Fabric umożliwia organizacjom tworzenie produktów danych wielokrotnego użytku o wysokiej jakości. Te zaufane produkty przyspieszają analizę i inicjatywy sztucznej inteligencji. Fabric IQ ułatwia ujednolicenie i kontekstowanie danych. Foundry IQ umożliwia agentom Microsoft Foundry wnioskowanie na podstawie zarządzanych i zaufanych danych.

Jaki poziom inwestycji jest wymagany?

Ujednolicenie platformy danych jest inwestycją w możliwości, a nie hurtową wymianę każdego systemu. Celem jest utrzymanie korzystania z istniejących systemów danych i tworzenie wspólnych podstaw, które mogą rosnąć wraz z upływem czasu. Kluczowe czynniki kosztowe obejmują:

  • Microsoft Fabric czynniki kosztów: Podstawowe czynniki kosztów obejmują (patrz Rysunek 2):

    • Compute: Tworzona przez ciebie pojemność obliczeniowa (pojemności Fabric).

    • Magazynowanie: Magazyn w usłudze OneLake.

    • Replikacja: Wykonywana replikacja danych (mirroring).

    • Power BI: Upewnij się, że użytkownicy posiadają wystarczającą pojemność Microsoft Fabric, która obejmuje dostęp do Power BI lub oddzielne licencje Power BI zgodnie ze wskazówkami dotyczącymi licencjonowania.

      Diagram przedstawiający Microsoft Fabric z usługą OneLake w centrum jako ujednolicony jezioro danych. W dolnej części wiele źródeł danych jest przekazywanych do usługi OneLake, w tym przechowywania w chmurze i systemów SaaS za pomocą skrótów i wirtualizacji, baz danych za pośrednictwem replikacji i innych źródeł zewnętrznych. Usługa OneLake udostępnia wbudowane narzędzia do zachowywania danych w całym cyklu życia danych. Obejmuje pozyskiwanie, inżynierię, magazynowanie, analizę w czasie rzeczywistym, naukę o danych i wizualizację przy użyciu Power BI. Diagram podkreśla, że dane są przechowywane raz w usłudze OneLake i ponownie używane w analizie, nauce o danych i raportowaniu, a zarządzanie jest realizowane za pomocą Microsoft Purview. Rysunek 2. Możliwości Microsoft Fabric do tworzenia wartości biznesowej z danych.

  • Microsoft Purview czynniki kosztów: Użyj Microsoft Purview w celu zapewnienia ujednoliconego ładu i zgodności danych. Usługa Purview zapewnia scentralizowany wykaz danych, klasyfikację danych i wymuszanie zasad w całej infrastrukturze danych. Dane mogą znajdować się w usłudze OneLake, Azure, lokalnym, saas innej firmy lub na innych platformach w chmurze. Kluczowe czynniki kosztów usługi Purview obejmują licencjonowanie oparte na subskrypcji i możliwości oparte na użyciu. Budżet zarówno na bieżące licencjonowanie, jak i ilość danych i usług zarządzanych za pomocą usługi Purview.

  • Czynniki kosztowe Azure: Do hostowania zasobów obliczeniowych Fabric (w ramach pojemności) oraz konta Microsoft Purview wykorzystujesz subskrypcje Azure. Nie ma dodatkowych kosztów dla subskrypcji Azure. Jeśli integrujesz inne usługi Azure, takie jak Azure Databricks lub Azure Machine Learning, w ujednoliconej platformie pamiętaj, że te usługi mają własne modele cenowe. Zaplanuj te koszty. Zobacz czynniki kosztów Azure Databricks i Azure Machine Learning.

Jak długo widzisz wartość?

Microsoft Fabric jest przeznaczona do szybkiego dostarczania wartości. Czas do wartości jest krótki, ponieważ zjednoczenie nie zależy od pełnej migracji. Zespoły mogą zacząć od niewielkiego zestawu wysokowartościowych produktów danych. Każdy krok dodaje wartość przy jednoczesnym ograniczeniu ryzyka. W praktyce wiele organizacji widzi wartość w ciągu kilku tygodni dla początkowych scenariuszy analizy lub sztucznej inteligencji. Ponieważ Fabric staje się standardową podstawą produktów danych, analiz i sztucznej inteligencji, wartość rośnie dzięki ponownemu użyciu i spójnym standardom w całej organizacji.

Jak ujednolicić platformę danych?

Microsoft Cloud Adoption Framework przedstawia czteroetapową strukturę do ujednolicenia platformy danych. Proces obejmuje planowanie i organizowanie strategii danych. Obejmuje ona decyzje dotyczące architektury. Ułatwia również ustawianie punktów odniesienia ładu i zabezpieczeń oraz definiowanie standardów operacyjnych.

  1. Gotowość organizacyjna. Zdefiniuj strategię danych i ustanów własność danych i domeny. Wyjaśnij, w jaki sposób dane tworzą wartość biznesową i kto jest odpowiedzialny za jakie dane. Zobacz Gotowość organizacyjna.

  2. Architektura: Zapewnij technologię potrzebną do ujednolicenia platformy danych. Skonfiguruj Microsoft Fabric i wymagane środowiska w Azure. Zobacz Architektura.

  3. Wzorce zarządzania i bezpieczeństwa: Użyj Microsoft Purview, aby uzyskać scentralizowany wgląd i zarządzanie w obrębie infrastruktury danych. Od początku twórz punkty odniesienia zabezpieczeń i zgodności w architekturze Fabric. Zobacz Punkty odniesienia zarządzania i zabezpieczeń.

  4. Standardy operacyjne. Definiowanie spójnych procesów pozyskiwania danych pierwotnych, tworzenia produktów danych i zarządzania ich cyklem życia. Ustal, jak produkty danych są publikowane, zabezpieczone i używane w całej organizacji. Zobacz Standardy operacyjne.

Wykonując te kroki, możesz zjednoczyć platformę danych w sposób ustrukturyzowany. Jeśli nie wiesz, gdzie zacząć, skorzystaj z następującego drzewa decyzyjnego, aby uzyskać wskazówki.

Drzewo decyzyjne służące do ujednolicenia platformy danych

Diagram przedstawiający drzewo decyzyjne służące do ujednolicenia platformy danych dla liderów i osób podejmujących decyzje.

Przepływ zadaje serię pytań typu tak lub nie. Każdy element "Tak" prowadzi do konkretnych wskazówek. Pierwsze pytanie brzmi, czy organizacja potrzebuje pomocy w zrozumieniu priorytetów danych, czy tworzeniu umiejętności w celu uzyskania większej wartości z danych. Jeśli tak, wskazówki dotyczą przygotowywania osób za pomocą ról, szkoleń i gotowości. Drugie pytanie dotyczy tego, czy organizacja potrzebuje ujednoliconego sposobu uzyskiwania dostępu do danych w chmurach i obciążeniach w celu obsługi analiz i sztucznej inteligencji. Jeśli tak, wskazówki dotyczą używania Microsoft Fabric jako ujednoliconej platformy danych. Trzecie pytanie brzmi, czy organizacja potrzebuje pomocy przy przekształcaniu danych operacyjnych w wartość biznesową, czy bezpiecznego przekazywania danych do systemów sztucznej inteligencji, takich jak Microsoft Foundry. Jeśli tak, wskazówki dotyczą integracji usług Azure z Fabric. Czwarte pytanie zadaje pytanie, czy organizacja potrzebuje pomocy w kontrolowaniu dostępu do danych, czy też w spójnym zabezpieczaniu danych. Jeśli tak, wskazówki dotyczą ustawiania punktów odniesienia zarządzania i zabezpieczeń za pomocą Microsoft Purview i powiązanych mechanizmów kontroli. Piąte pytanie brzmi, czy organizacja potrzebuje pomocy przy określaniu spójnych standardów organizacyjnych w celu przetwarzania, zabezpieczania i korzystania z produktów danych na potrzeby analizy i sztucznej inteligencji. Jeśli tak, wskazówki dotyczą ustawiania standardów operacyjnych dla produktów danych, zabezpieczeń i zarządzania cyklem życia. Przepływ kończy się, wskazując na wdrożenie sztucznej inteligencji i wdrożenie agentów sztucznej inteligencji po wdrożeniu ujednoliconej platformy danych i standardów.

Rysunek 3. Microsoft wykorzystuje drzewo decyzyjne do ujednolicenia platformy danych.

Następne kroki

W poniższych sekcjach znajdziesz wskazówki, listy kontrolne, najlepsze rozwiązania, wskazówki dotyczące decyzji i kompromisy w każdym kroku. Wskazówki dotyczą liderów i osób podejmujących decyzje, które nadzorują strategię organizacyjną i nadzór.

Kluczowe terminy

Termin kluczowy Definicja
Analytics Praktyka generowania szczegółowych informacji na podstawie danych w celu wspierania podejmowania decyzji. Obejmuje ona pulpity nawigacyjne, raporty i wizualizacje, na przykład w Power BI.
AI Systemy, które używają danych jako danych wejściowych do modeli, które automatyzują funkcje biznesowe. Ta kategoria obejmuje tradycyjne modele uczenia maszynowego (predykcyjne) i generowanie modeli sztucznej inteligencji.
Produkt danych Dane, które są w formie, która jest cenna dla Twojej firmy, takich jak zestawy danych, tabele, zestawy funkcji lub dane szkoleniowe dotyczące sztucznej inteligencji.
Domena danych Granica odpowiedzialności i własności produktów danych, takich jak jednostki biznesowe (HR, Marketing, Finanse, Sprzedaż, Operacje) i linie produktów (Product 1, Product 2).
Strefa docelowa zarządzania danymi Środowisko (składające się z co najmniej jednej subskrypcji Azure) dla zasobów zarządzania danymi, takich jak konta Microsoft Purview i zasoby obliczeniowe Fabric.
Strefa docelowa danych Środowisko (składające się z co najmniej jednej subskrypcji Azure) dla danych i zasobów sztucznej inteligencji/uczenia maszynowego, takich jak Azure Databricks, Azure Data Lake Storage i Azure Machine Learning.