Udostępnij za pośrednictwem


Analiza między dzierżawami przy użyciu wyodrębnionych danych — aplikacja z jedną dzierżawą

Dotyczy: Azure SQL Database

W tym samouczku przedstawiono kompletny scenariusz analizy dla jednej implementacji dzierżawy. W tym scenariuszu pokazano, jak analiza może umożliwić firmom podejmowanie inteligentnych decyzji. Korzystając z danych wyodrębnionych z każdej bazy danych dzierżawy, możesz użyć analizy, aby uzyskać wgląd w zachowanie dzierżawy, w tym ich użycie przykładowej aplikacji SaaS Wingtip Tickets. Ten scenariusz obejmuje trzy kroki:

  1. Wyodrębnij dane z każdej bazy danych dzierżawy i załaduj je do magazynu analitycznego.
  2. Przekształć wyodrębnione dane na potrzeby przetwarzania analiz.
  3. Użyj narzędzi do analizy biznesowej, aby uzyskać przydatne szczegółowe informacje, które mogą kierować podejmowaniem decyzji.

Ten samouczek zawiera informacje na temat wykonywania następujących czynności:

  • Utwórz magazyn analizy dzierżawy, aby wyodrębnić dane.
  • Wyodrębnianie danych z każdej bazy danych dzierżawy do magazynu analiz przy użyciu zadań elastycznych.
  • Zoptymalizuj wyodrębnione dane (zreorganizuj je w schemacie gwiazdy).
  • Wykonywanie zapytań względem bazy danych analizy.
  • Użyj usługi Power BI do wizualizacji danych, aby wyróżnić trendy w danych dzierżawy i wprowadzić zalecenia dotyczące ulepszeń.

Diagram przedstawia przegląd architektury używanej w tym artykule.

Wzorzec analizy dzierżawy w trybie offline

Aplikacje SaaS z wieloma dzierżawami zwykle mają ogromną ilość danych dzierżawy przechowywanych w chmurze. Te dane zapewniają bogate źródło szczegółowych informacji na temat operacji i użycia aplikacji oraz zachowania dzierżawców. Te szczegółowe informacje mogą kierować opracowywaniem funkcji, ulepszeniami użyteczności i innymi inwestycjami w aplikację i platformę.

Uzyskiwanie dostępu do danych dla wszystkich dzierżaw jest proste, gdy wszystkie dane są w jednej wielodostępnej bazie danych. Jednak dostęp jest bardziej złożony w przypadku dystrybucji na dużą skalę w potencjalnie tysiącach baz danych. Jednym ze sposobów oswojenia złożoności i zminimalizowania wpływu zapytań analitycznych na dane transakcyjne jest wyodrębnienie danych do specjalnie zaprojektowanej bazy danych analizy lub magazynu danych.

W tym samouczku przedstawiono kompletny scenariusz analizy aplikacji SaaS Wingtip Tickets. Najpierw zadania elastyczne służą do wyodrębniania danych z każdej bazy danych dzierżawy i ładowania ich do tabel przejściowych w magazynie analitycznym. Magazyn analityczny może być usługą SQL Database lub dedykowaną pulą SQL. W przypadku wyodrębniania danych na dużą skalę zaleca się użycie usługi Azure Data Factory .

Następnie zagregowane dane są przekształcane w zestaw tabel schematu gwiazdy. Tabele składają się z centralnej tabeli faktów oraz powiązanych tabel wymiarów. Dla biletów Wingtip:

  • Centralna tabela faktów w schemacie gwiazdy zawiera dane biletów.
  • Tabele wymiarów opisują miejsca, wydarzenia, klientów i daty zakupu.

Razem centralne tabele faktów i wymiarów umożliwiają wydajne przetwarzanie analityczne. Schemat gwiazdy używany w tym samouczku jest pokazany na poniższej ilustracji:

architectureOverView

Na koniec magazyn analityczny jest odpytywane przy użyciu usługi Power BI w celu wyróżnienia szczegółowych informacji na temat zachowania dzierżawy i korzystania z aplikacji Wingtip Tickets. Uruchamiasz zapytania, które:

  • Pokaż względną popularność każdego miejsca
  • Wyróżnianie wzorców sprzedaży biletów dla różnych zdarzeń
  • Pokaż względny sukces różnych miejsc w sprzedaży ich imprezy

Zrozumienie, w jaki sposób każda dzierżawa korzysta z usługi, służy do eksplorowania opcji zarabiania na usłudze i ulepszania usługi w celu ułatwienia dzierżawcom większego sukcesu. Ten samouczek zawiera podstawowe przykłady rodzajów szczegółowych informacji, które można zebrać na podstawie danych dzierżawy.

Ustawienia

Wymagania wstępne

Do wykonania zadań opisanych w tym samouczku niezbędne jest spełnienie następujących wymagań wstępnych:

Tworzenie danych dla pokazu

W tym samouczku analiza jest wykonywana na danych sprzedaży biletów. W bieżącym kroku generujesz dane biletów dla wszystkich dzierżaw. Później te dane są wyodrębniane do analizy. Upewnij się, że aprowizowaliśmy partię dzierżaw zgodnie z wcześniejszym opisem, aby mieć znaczącą ilość danych. Wystarczająco duża ilość danych może uwidocznić szereg różnych wzorców zakupów biletów.

  1. W programie PowerShell ISE otwórz plik ...\Learning Modules\Operational Analytics\Tenant Analytics\Demo-TenantAnalytics.ps1 i ustaw następującą wartość:
    • = $DemoScenario 1 Zakup biletów na wydarzenia we wszystkich miejscach
  2. Naciśnij F5 , aby uruchomić skrypt i utworzyć historię zakupów biletów dla każdego wydarzenia w każdym miejscu. Skrypt jest uruchamiany przez kilka minut, aby wygenerować dziesiątki tysięcy biletów.

Wdrażanie magazynu analiz

Często istnieje wiele transakcyjnych baz danych, które razem przechowują wszystkie dane dzierżawy. Musisz agregować dane dzierżawy z wielu transakcyjnych baz danych do jednego magazynu analitycznego. Agregacja umożliwia wydajne wykonywanie zapytań dotyczących danych. W tym samouczku usługa Azure SQL Database jest używana do przechowywania zagregowanych danych.

W poniższych krokach wdrożysz magazyn analityczny, który jest nazywany tenantanalytics. W dalszej części samouczka wdrożysz również wstępnie zdefiniowane tabele:

  1. W programie PowerShell ISE otwórz plik ...\Learning Modules\Operational Analytics\Tenant Analytics\Demo-TenantAnalytics.ps1
  2. Ustaw zmienną $DemoScenario w skrycie tak, aby odpowiadała wybranemu magazynowi analiz:
    • Aby użyć usługi SQL Database bez magazynu kolumn, ustaw $DemoScenario = 2
    • Aby użyć usługi SQL Database z magazynem kolumn, ustaw $DemoScenario = 3
  3. Naciśnij F5, aby uruchomić skrypt demonstracyjny (który wywołuje skrypt Deploy-TenantAnalytics<XX.ps1>), który tworzy magazyn analizy dzierżawy.

Po wdrożeniu aplikacji i wypełnieniu jej interesującymi danymi dzierżawy użyj programu SQL Server Management Studio (SSMS), aby połączyć dzierżawy1-dpt-User<> i catalog-dpt-User<> przy użyciu polecenia Login = developer, Password = P@ssword1. Aby uzyskać więcej wskazówek, zobacz samouczek wprowadzający.

Zrzut ekranu przedstawiający informacje potrzebne do nawiązania połączenia z programem SQL Server.

W Eksplorator obiektów wykonaj następujące kroki:

  1. Rozwiń serwer tenants1-dpt-User><.
  2. Rozwiń węzeł Bazy danych i zobacz listę baz danych dzierżaw.
  3. Rozwiń serwer catalog-dpt-User><.
  4. Sprawdź, czy widzisz magazyn analizy i bazę danych jobaccount.

Zobacz następujące elementy bazy danych w programie SSMS Eksplorator obiektów, rozwijając węzeł magazynu analiz:

  • Tables TicketsRawData i EventsRawData przechowują nieprzetworzone dane z baz danych dzierżawy.
  • Tabele schematu gwiazdy to fact_Tickets, dim_Customers, dim_Venues, dim_Events i dim_Dates.
  • Procedura składowana służy do wypełniania tabel schematu gwiazdy z nieprzetworzonych tabel danych.

Zrzut ekranu przedstawiający elementy bazy danych wyświetlane w programie SSMS Eksplorator obiektów.

Wyodrębnianie danych

Tworzenie grup docelowych

Przed kontynuowaniem upewnij się, że wdrożono konto zadania i bazę danych jobaccount. W następnym zestawie kroków zadania elastyczne są używane do wyodrębniania danych z każdej bazy danych dzierżawy i przechowywania danych w magazynie analitycznym. Następnie drugie zadanie rozdrabnia dane i przechowuje je w tabelach w schemacie gwiazdy. Te dwa zadania są uruchamiane w dwóch różnych grupach docelowych, a mianowicie TenantGroup i AnalyticsGroup. Zadanie wyodrębniania jest uruchamiane względem grupy TenantGroup, która zawiera wszystkie bazy danych dzierżawy. Zadanie rozdrabniania jest uruchamiane względem grupy AnalyticsGroup, która zawiera tylko magazyn analiz. Utwórz grupy docelowe, wykonując następujące kroki:

  1. W programie SSMS nawiąż połączenie z bazą danych jobaccount w katalogu-dpt-User<>.
  2. W programie SSMS otwórz plik ...\Learning Modules\Operational Analytics\Tenant Analytics\ TargetGroups.sql
  3. Zmodyfikuj zmienną @User w górnej części skryptu, zastępując element <User> wartością użytkownika używaną podczas wdrażania aplikacji SaaS Wingtip.
  4. Naciśnij F5 , aby uruchomić skrypt, który tworzy dwie grupy docelowe.

Wyodrębnianie danych pierwotnych ze wszystkich dzierżaw

Obszerne modyfikacje danych mogą występować częściej w przypadku danych biletów i klientów niż w przypadku danych dotyczących zdarzenia i miejsca . W związku z tym rozważ wyodrębnienie danych biletu i klienta oddzielnie i częściej niż wyodrębnianie danych zdarzenia i miejsca. W tej sekcji zdefiniujesz i zaplanujesz dwa oddzielne zadania:

  • Wyodrębnij bilet i dane klienta.
  • Wyodrębnianie danych zdarzenia i miejsca.

Każde zadanie wyodrębnia dane i publikuje je w magazynie analitycznym. Wyodrębnione dane są niszczone w schemacie gwiazdy analizy.

  1. W programie SSMS nawiąż połączenie z bazą danych jobaccount na serwerze catalog-dpt-User<>.
  2. W programie SSMS otwórz plik ...\Learning Modules\Operational Analytics\Tenant Analytics\ExtractTickets.sql.
  3. Zmodyfikuj @User u góry skryptu i zastąp ciąg <User> nazwą użytkownika używaną podczas wdrażania aplikacji SaaS Wingtip
  4. Naciśnij F5, aby uruchomić skrypt, który tworzy i uruchamia zadanie wyodrębniania biletów i danych klientów z każdej bazy danych dzierżawy. Zadanie zapisuje dane w magazynie analitycznym.
  5. Wykonaj zapytanie względem tabeli TicketsRawData w bazie danych tenantanalytics, aby upewnić się, że tabela jest wypełniona informacjami o biletach ze wszystkich dzierżaw.

Powtórz powyższe kroki, z wyjątkiem tego czasu zastąp \ExtractTickets.sql \ExtractVenuesEvents.sql w kroku 2.

Pomyślne uruchomienie zadania spowoduje wypełnienie tabeli EventsRawData w magazynie analitycznym nowymi zdarzeniami i informacjami o miejscach ze wszystkich dzierżaw.

Reorganizacja danych

Wyodrębnione dane w celu wypełnienia tabel schematu gwiazdy

Następnym krokiem jest rozdrobnienie wyodrębnionych danych pierwotnych do zestawu tabel zoptymalizowanych pod kątem zapytań analitycznych. Używany jest schemat gwiazdy. Centralna tabela faktów zawiera indywidualne rekordy sprzedaży biletów. Inne tabele są wypełniane powiązanymi danymi dotyczącymi miejsc, zdarzeń i klientów. Istnieją również tabele wymiarów czasowych.

W tej sekcji samouczka zdefiniujesz i uruchomisz zadanie, które scala wyodrębnione dane pierwotne z danymi w tabelach schematu gwiazdy. Po zakończeniu zadania scalania nieprzetworzone dane zostaną usunięte, pozostawiając tabele gotowe do wypełnienia przez następne zadanie wyodrębniania danych dzierżawy.

  1. W programie SSMS nawiąż połączenie z bazą danych jobaccount w katalogu-dpt-User<>.
  2. W programie SSMS otwórz plik ...\Learning Modules\Operational Analytics\Tenant Analytics\ShredRawExtractedData.sql.
  3. Naciśnij F5 , aby uruchomić skrypt w celu zdefiniowania zadania wywołującego procedurę składowaną sp_ShredRawExtractedData w magazynie analiz.
  4. Poczekaj na pomyślne uruchomienie zadania.
    • Sprawdź kolumnę Cykl życia tabeli jobs.jobs_execution pod kątem stanu zadania. Przed kontynuowaniem upewnij się, że zadanie powiodło się . Pomyślne uruchomienie wyświetla dane podobne do następującego wykresu:

Rozdrabniania

eksploracja danych

Wizualizowanie danych dzierżawy

Dane w tabeli schematu gwiazdy udostępniają wszystkie dane sprzedaży biletów potrzebne do analizy. Aby ułatwić wyświetlanie trendów w dużych zestawach danych, należy ją wizualizować graficznie. W tej sekcji dowiesz się, jak używać usługi Power BI do manipulowania i wizualizowania wyodrębnionych i zorganizowanych danych dzierżawy.

Wykonaj następujące kroki, aby nawiązać połączenie z usługą Power BI i zaimportować utworzone wcześniej widoki:

  1. Uruchom program Power BI Desktop.

  2. Na wstążce Narzędzia główne wybierz pozycję Pobierz dane, a następnie wybierz pozycję Więcej... z menu.

  3. W oknie Pobieranie danych wybierz pozycję Azure SQL Database.

  4. W oknie logowania bazy danych wprowadź nazwę serwera (catalog-dpt-User.database.windows.net<>). Wybierz pozycję Importuj dla trybu łączności danych, a następnie kliknij przycisk OK.

    signinpowerbi

  5. Wybierz pozycję Baza danych w okienku po lewej stronie, a następnie wprowadź nazwę użytkownika = deweloper, a następnie wprowadź hasło = P@ssword1. Kliknij Połącz.

    Zrzut ekranu przedstawiający okno dialogowe bazy danych programu SQL Server, w którym można wprowadzić nazwę użytkownika i hasło.

  6. W okienku Nawigator w obszarze bazy danych analizy wybierz tabele schematu gwiazdy: fact_Tickets, dim_Events, dim_Venues, dim_Customers i dim_Dates. Następnie wybierz pozycję Załaduj.

Gratulacje! Dane zostały pomyślnie załadowane do usługi Power BI. Teraz możesz rozpocząć eksplorowanie interesujących wizualizacji, aby uzyskać wgląd w dzierżawy. Następnie dowiesz się, w jaki sposób analiza może umożliwić dostarczanie rekomendacji opartych na danych zespołowi biznesowym Wingtip Tickets. Zalecenia mogą pomóc w optymalizacji modelu biznesowego i obsługi klienta.

Zacznij od przeanalizowanie danych sprzedaży biletów, aby zobaczyć różnice w użyciu w różnych miejscach. Wybierz następujące opcje w usłudze Power BI, aby wykreślić wykres słupkowy łącznej liczby biletów sprzedanych przez każde miejsce. Ze względu na losowe zmiany w generatorze biletów wyniki mogą być inne.

Zrzut ekranu przedstawiający wizualizację i kontrolki usługi Power BI dla wizualizacji danych po prawej stronie.

Poprzednia fabuła potwierdza, że liczba biletów sprzedanych przez każde miejsce jest różna. Miejsca, które sprzedają więcej biletów, korzystają z usługi bardziej mocno niż miejsca, które sprzedają mniej biletów. Może istnieć możliwość dostosowania alokacji zasobów zgodnie z różnymi potrzebami dzierżawy.

Możesz dokładniej przeanalizować dane, aby zobaczyć, jak sprzedaż biletów zmienia się w czasie. Wybierz następujące opcje w usłudze Power BI, aby wykreślić łączną liczbę sprzedanych biletów każdego dnia przez okres 60 dni.

Zrzut ekranu przedstawiający wizualizację usługi Power BI zatytułowaną Dystrybucja sprzedaży biletów i Dzień sprzedaży.

Na poprzednim wykresie przedstawiono wzrost sprzedaży biletów dla niektórych miejsc. Te skoki wzmacniają ideę, że niektóre miejsca mogą zużywać zasoby systemowe nieproporcjonalnie. Do tej pory nie ma oczywistego wzorca w przypadku wystąpienia skoków.

Następnie chcesz dokładniej zbadać znaczenie tych szczytowych dni sprzedaży. Kiedy te szczyty występują po tym, jak bilety idą na sprzedaż? Aby wykreślić bilety sprzedawane dziennie, wybierz następujące opcje w usłudze Power BI.

SaleDayDistribution

Poprzednia fabuła pokazuje, że niektóre miejsca sprzedają wiele biletów w pierwszym dniu sprzedaży. Jak tylko bilety idą na sprzedaż w tych miejscach, wydaje się być szalony pośpiech. Ten wzrost aktywności przez kilka miejsc może mieć wpływ na usługę dla innych dzierżaw.

Możesz ponownie przejść do danych, aby sprawdzić, czy ten szalony pośpiech jest prawdziwy dla wszystkich wydarzeń hostowanych przez te miejsca. W poprzednich wykresach zaobserwowano, że Contoso Concert Hall sprzedaje wiele biletów, a firma Contoso ma również skok sprzedaży biletów w określonych dniach. Zapoznaj się z opcjami usługi Power BI, aby wykreślić skumulowaną sprzedaż biletów dla Contoso Concert Hall, koncentrując się na trendach sprzedaży dla każdego z jego wydarzeń. Czy wszystkie wydarzenia są zgodne z tym samym wzorcem sprzedaży?

ContosoSales

Poprzedni wykres dla Contoso Concert Hall pokazuje, że szalony pośpiech nie dzieje się dla wszystkich wydarzeń. Pobaw się opcjami filtru, aby zobaczyć trendy sprzedaży dla innych miejsc.

Wgląd w wzorce sprzedaży biletów może prowadzić do rozwiązania Wingtip Tickets w celu zoptymalizowania modelu biznesowego. Zamiast pobierać opłaty za wszystkie dzierżawy, być może etykietka Wingtip powinna wprowadzać warstwy usług o różnych rozmiarach obliczeniowych. Większe miejsca, które muszą sprzedawać więcej biletów dziennie, mogą być oferowane wyższej warstwy z umową dotyczącą wyższego poziomu usług (SLA). Te miejsca mogą mieć bazy danych umieszczone w puli z wyższymi limitami zasobów dla bazy danych. Każda warstwa usługi może mieć alokację sprzedaży godzinowej z dodatkowymi opłatami naliczanymi za przekroczenie alokacji. Większe miejsca, które mają okresowe wzrosty sprzedaży, skorzystają z wyższych warstw, a bilety Wingtip mogą zarabiać na swojej usłudze wydajniej.

Tymczasem niektórzy klienci Wingtip Tickets narzekają, że walczą o sprzedaż wystarczającej ilości biletów, aby uzasadnić koszt usługi. Być może w tych szczegółowych informacji istnieje możliwość zwiększenia sprzedaży biletów dla niedostatecznie performujących miejsc. Wyższa sprzedaż zwiększy postrzeganą wartość usługi. Kliknij prawym przyciskiem myszy fact_Tickets i wybierz pozycję Nowa miara. Wprowadź następujące wyrażenie dla nowej miary o nazwie AverageTicketsSold:

AverageTicketsSold = AVERAGEX( SUMMARIZE( TableName, TableName[Venue Name] ), CALCULATE( SUM(TableName[Tickets Sold] ) ) )

Wybierz następujące opcje wizualizacji, aby wykreślić bilety procentowe sprzedane przez każde miejsce, aby określić ich względny sukces.

Zrzut ekranu przedstawiający wizualizację usługi Power BI zatytułowaną Average Tickets Sold By Each Venue (Średnia liczba biletów sprzedanych przez każde miejsce).

Poprzednia fabuła pokazuje, że mimo że większość miejsc sprzedaje ponad 80% swoich biletów, niektórzy mają trudności z wypełnieniem ponad połowy miejsc. Pobaw się wartościami, aby wybrać maksymalną lub minimalną wartość procentową biletów sprzedanych dla każdego miejsca.

Wcześniej pogłębiono analizę, aby dowiedzieć się, że sprzedaż biletów ma tendencję do obserwowania przewidywalnych wzorców. To odkrycie może pozwolić usłudze Wingtip Tickets pomóc w niedostatecznym zwiększaniu sprzedaży biletów, zalecając dynamiczne ceny. To odkrycie może ujawnić możliwość skorzystania z technik uczenia maszynowego w celu przewidywania sprzedaży biletów dla każdego zdarzenia. Można również przewidzieć wpływ na przychody z ofert rabatów na sprzedaż biletów. Usługę Power BI Embedded można zintegrować z aplikacją do zarządzania zdarzeniami. Integracja może pomóc w wizualizacji przewidywanej sprzedaży i wpływu różnych rabatów. Aplikacja może pomóc w opracowaniu optymalnego rabatu, który ma być stosowany bezpośrednio z poziomu wyświetlacza analitycznego.

Zaobserwowano trendy w danych dzierżawy z aplikacji WingTip. Możesz rozważać inne sposoby, w jakie aplikacja może informować o decyzjach biznesowych dla dostawców aplikacji SaaS. Dostawcy mogą lepiej zaspokoić potrzeby swoich dzierżaw. Mam nadzieję, że ten samouczek zawiera narzędzia niezbędne do przeprowadzania analizy danych dzierżawy w celu umożliwienia firmom podejmowania decyzji opartych na danych.

Następne kroki

W tym samouczku zawarto informacje na temat wykonywania następujących czynności:

  • Wdrożono bazę danych analizy dzierżawy z wstępnie zdefiniowanymi tabelami schematów gwiazdy
  • Wyodrębnianie danych ze wszystkich baz danych dzierżawy przy użyciu zadań elastycznych
  • Scalanie wyodrębnionych danych z tabelami w schemacie gwiazdy zaprojektowanym na potrzeby analizy
  • Wykonywanie zapytań względem bazy danych analizy
  • Używanie usługi Power BI do wizualizacji danych w celu obserwowania trendów w danych dzierżawy

Gratulacje!

Dodatkowe zasoby