Opis podstawowych pojęć związanych z modelowaniem danych

Ukończone

Modele analityczne umożliwiają tworzenie struktury danych w celu obsługi analizy. Modele są oparte na powiązanych tabelach danych i definiują wartości liczbowe, które mają być analizowane lub raportowane (znane jako miary) oraz jednostki, zagregowane (znane jako wymiary). Na przykład model może zawierać tabelę zawierającą miary liczbowe dla sprzedaży (np. przychód lub ilość) oraz wymiary produktów, klientów i czasu. Umożliwi to agregowanie miar sprzedaży w co najmniej jednym wymiarze (na przykład w celu zidentyfikowania całkowitego przychodu przez klienta lub całkowitej liczby sprzedanych produktów na miesiąc). Koncepcyjnie model tworzy strukturę wielowymiarową, która jest często nazywana sześcianem, w którym każdy punkt, w którym przecinają się wymiary, reprezentuje zagregowaną miarę dla tych wymiarów.

Diagram modelu danych.

Uwaga

Chociaż często nazywamy modelem analitycznym jako modułem, może istnieć więcej (lub mniej) niż trzy wymiary — nie jest łatwo zwizualizować więcej niż trzy wymiary.

Tabele i schemat

Tabele wymiarów reprezentują jednostki, zagregowane miary liczbowe — na przykład produkt lub klient. Każda jednostka jest reprezentowana przez wiersz z unikatową wartością klucza. Pozostałe kolumny reprezentują atrybuty jednostki — na przykład produkty mają nazwy i kategorie, a klienci mają adresy i miasta. W większości modeli analitycznych często uwzględniany jest wymiar czasowy, dzięki czemu można agregować miary liczbowe skojarzone ze zdarzeniami w czasie.

Miary liczbowe, które będą agregowane przez różne wymiary modelu, są przechowywane w tabelach faktów . Każdy wiersz w tabeli faktów reprezentuje zarejestrowane zdarzenie, które ma skojarzone miary liczbowe. Na przykład tabela Sales (Sprzedaż) w poniższym schemacie reprezentuje transakcje sprzedaży dla poszczególnych elementów i zawiera wartości liczbowe dla sprzedanej ilości i przychodu.

Diagram schematu gwiazdy.

Ten typ schematu, w którym tabela faktów jest powiązana z co najmniej jedną tabelą wymiarów, jest nazywana schematem gwiazdy (załóżmy, że istnieje pięć wymiarów związanych z jedną tabelą faktów — schemat tworzyłby pięcioramienną gwiazdę!). Można również zdefiniować bardziej złożony schemat, w którym tabele wymiarów są powiązane z dodatkowymi tabelami zawierającymi więcej szczegółów (na przykład można reprezentować atrybuty kategorii produktów w oddzielnej tabeli Kategoria , która jest powiązana z tabelą Product — w takim przypadku projekt jest określany jako schemat płatka śniegu. Schemat tabel faktów i wymiarów służy do tworzenia modelu analitycznego, w którym są wstępnie obliczane agregacje miar we wszystkich wymiarach; wykonywanie analiz i raportowania działań znacznie szybciej niż obliczanie agregacji za każdym razem.

Hierarchie atrybutów

Ostatnią rzeczą, którą warto rozważyć w przypadku modeli analitycznych, jest utworzenie hierarchii atrybutów, które umożliwiają szybkie przechodzenie do szczegółów lub przechodzenie do szczegółów w celu znalezienia zagregowanych wartości na różnych poziomach w wymiarze hierarchicznym. Rozważmy na przykład atrybuty w tabelach wymiarów, które omówiliśmy do tej pory. W tabeli Product (Produkt) można utworzyć hierarchię, w której każda kategoria może zawierać wiele nazwanych produktów. Podobnie w tabeli Customer (Klient ) można utworzyć hierarchię reprezentującą wielu nazwanych klientów w każdym mieście. Na koniec w tabeli Time (Czas ) można utworzyć hierarchię roku, miesiąca i dnia. Model można utworzyć przy użyciu wstępnie zagregowanych wartości dla każdego poziomu hierarchii, co pozwala szybko zmienić zakres analizy — na przykład wyświetlając łączną sprzedaż według roku, a następnie przechodząc do szczegółów, aby wyświetlić bardziej szczegółowy podział łącznej sprzedaży według miesiąca.

Diagram hierarchii danych.

Modelowanie analityczne w usłudze Microsoft Power BI

Usługa Power BI umożliwia zdefiniowanie modelu analitycznego z tabel danych, które można zaimportować z jednego lub większej liczby źródeł danych. Następnie możesz użyć interfejsu modelowania danych na karcie Model programu Power BI Desktop, aby zdefiniować model analityczny, tworząc relacje między tabelami faktów i wymiarów, definiując hierarchie, ustawiając typy danych i wyświetlając formaty pól w tabelach oraz zarządzając innymi właściwościami danych, które ułatwiają definiowanie zaawansowanego modelu do analizy.

Zrzut ekranu przedstawiający kartę Model w programie Power BI Desktop.