Udostępnij przez


Samouczek: wykonywanie zapytań o dublowaną bazę danych z usługi Cosmos DB w usłudze Microsoft Fabric

W tym samouczku wykonasz zapytanie dotyczące replikowanej bazy danych Fabric z istniejącej bazy danych Cosmos DB w bazie danych Fabric. Dowiesz się, jak włączyć dublowanie w bazie danych, zweryfikować stan dublowania, a następnie użyć zarówno danych źródłowych, jak i dublowanych na potrzeby analizy.

Wymagania wstępne

Skonfiguruj swoją bazę danych Cosmos DB w bazie danych Fabric

Najpierw upewnij się, że baza danych Cosmos DB w platformie Fabric jest prawidłowo skonfigurowana i zawiera dane do replikacji.

  1. Otwórz portal Fabric (https://app.fabric.microsoft.com).

  2. Przejdź do istniejącej bazy danych Cosmos DB.

    Ważne

    Na potrzeby tego samouczka istniejąca baza danych Cosmos DB powinna mieć już załadowany przykładowy zestaw danych . W pozostałych krokach w tym samouczku założono, że używasz tego samego zestawu danych dla tej bazy danych.

  3. Sprawdź, czy baza danych zawiera co najmniej jeden kontener z danymi. Wykonaj tę weryfikację, rozwijając kontener w okienku nawigacji i obserwując, że elementy istnieją.

  4. Na pasku menu wybierz pozycję Ustawienia , aby uzyskać dostęp do konfiguracji bazy danych.

  5. W oknie dialogowym Ustawienia przejdź do sekcji Dublowanie , aby sprawdzić, czy dublowanie jest włączone dla tej bazy danych.

    Uwaga / Notatka

    Duplikowanie jest automatycznie włączone dla wszystkich baz danych Cosmos DB w Fabric. Ta funkcja nie wymaga żadnej dodatkowej konfiguracji i zapewnia, że dane są zawsze gotowe do analizy w usłudze OneLake.

Nawiązywanie połączenia z źródłową bazą danych

Następnie upewnij się, że możesz nawiązać połączenie z źródłową bazą danych Cosmos DB i wykonać zapytanie bezpośrednio.

  1. Przejdź z powrotem do istniejącej bazy danych Cosmos DB w Fabric portal.

  2. Wybierz i rozwiń istniejący kontener, aby wyświetlić jego zawartość.

  3. Wybierz pozycję Elementy , aby przeglądać dane bezpośrednio w bazie danych.

  4. Upewnij się, że możesz zobaczyć przedmioty w swoim kontenerze. Jeśli na przykład używasz przykładowego zestawu danych, powinny zostać wyświetlone elementy z właściwościami takimi jak name, categoryi countryOfOrigin.

  5. Wybierz pozycję Nowe zapytanie z menu, aby otworzyć edytor zapytań NoSQL.

  6. Uruchom zapytanie testowe, aby zweryfikować łączność i dostępność danych:

    SELECT COUNT(1) AS itemCount FROM container
    

    To zapytanie powinno zwrócić całkowitą liczbę elementów w kontenerze.

Nawiązywanie połączenia z lustrzaną bazą danych

Teraz uzyskaj dostęp do dublowanej wersji bazy danych za pośrednictwem punktu końcowego analizy SQL, aby wykonywać zapytania dotyczące tych samych danych przy użyciu języka T-SQL.

  1. Na pasku menu wybierz listę Cosmos DB, a następnie wybierz adres końcowy analizy SQL, aby przełączyć się do widoku zreplikowanej bazy danych.

  2. Sprawdź, czy kontener jest wyświetlany jako tabela w punkcie końcowym analizy SQL. Tabela powinna mieć taką samą nazwę jak kontener.

  3. Wybierz pozycję Nowe zapytanie SQL z menu, aby otworzyć edytor zapytań języka T-SQL.

  4. Uruchom zapytanie testowe, aby sprawdzić, czy dublowanie działa poprawnie:

    SELECT COUNT(*) AS itemCount FROM [dbo].[SampleData]
    

    Uwaga / Notatka

    Zastąp [SampleData] nazwą swojego kontenera, jeśli nie używasz przykładowego zestawu danych.

  5. Zapytanie powinno zwrócić tę samą liczbę co zapytanie NoSQL, potwierdzając, że mirroring pomyślnie replikuje dane.

Wykonywanie zapytań względem źródłowej bazy danych z sieci szkieletowej

Użyj portalu sieci szkieletowej, aby eksplorować dane, które już istnieją na koncie usługi Azure Cosmos DB, odpytując źródłową bazę danych Cosmos DB.

  1. Przejdź do dublowanej bazy danych w portalu sieci szkieletowej.

  2. Wybierz pozycję Widok, a następnie źródłową bazę danych. Ta akcja powoduje otwarcie eksploratora danych usługi Azure Cosmos DB z widokiem tylko do odczytu źródłowej bazy danych.

    Zrzut ekranu przedstawiający eksploratora danych z widokiem tylko do odczytu danych NoSQL na koncie usługi Azure Cosmos DB.

  3. Wybierz kontener, a następnie otwórz menu kontekstowe i wybierz pozycję Nowe zapytanie SQL.

  4. Uruchom dowolne zapytanie. Na przykład użyj polecenia SELECT COUNT(1) FROM container , aby zliczyć liczbę elementów w kontenerze.

    Uwaga / Notatka

    Wszystkie operacje odczytu w źródłowej bazie danych są kierowane do Azure i konsumują jednostki żądań (RUs) przydzielone na koncie.

Analizowanie docelowej dublowanej bazy danych

Teraz użyj języka T-SQL, aby wysłać zapytanie do danych NoSQL, które są teraz przechowywane w usłudze Fabric OneLake.

  1. Przejdź do dublowanej bazy danych w portalu sieci szkieletowej.

  2. Przełącz się z dublowanej usługi Azure Cosmos DB do punktu końcowego analizy SQL.

    Zrzut ekranu przedstawiający selektor do przełączania między elementami w portalu sieci szkieletowej.

  3. Każdy kontener w źródłowej bazie danych powinien być reprezentowany w punkcie końcowym analizy SQL jako tabeli magazynu.

  4. Wybierz dowolną tabelę, otwórz menu kontekstowe, a następnie wybierz pozycję Nowe zapytanie SQL, a na koniec wybierz pozycję Wybierz 100 pierwszych.

  5. Zapytanie wykonuje i zwraca 100 rekordów w wybranej tabeli.

  6. Otwórz menu kontekstowe dla tej samej tabeli i wybierz pozycję Nowe zapytanie SQL. Napisz przykładowe zapytanie, które używa agregacji, takich jak SUM, COUNT, MINlub MAX. Połącz wiele tabel w magazynie, aby wykonać zapytanie w wielu kontenerach.

    Uwaga / Notatka

    Na przykład to zapytanie będzie wykonywane w wielu kontenerach:

    SELECT
        d.[product_category_name],
        t.[order_status],
        c.[customer_country],
        s.[seller_state],
        p.[payment_type],
        sum(o.[price]) as price,
        sum(o.[freight_value]) freight_value 
    FROM
        [dbo].[products] p 
    INNER JOIN
        [dbo].[OrdersDB_order_payments] p 
            on o.[order_id] = p.[order_id] 
    INNER JOIN
        [dbo].[OrdersDB_order_status] t 
            ON o.[order_id] = t.[order_id] 
    INNER JOIN
        [dbo].[OrdersDB_customers] c 
            on t.[customer_id] = c.[customer_id] 
    INNER JOIN
        [dbo].[OrdersDB_productdirectory] d 
            ON o.product_id = d.product_id 
    INNER JOIN
        [dbo].[OrdersDB_sellers] s 
            on o.seller_id = s.seller_id 
    GROUP BY
        d.[product_category_name],
        t.[order_status],
        c.[customer_country],
        s.[seller_state],
        p.[payment_type]
    

    W tym przykładzie przyjęto założenie, że nazwa tabeli i kolumn. Użyj własnej tabeli i kolumn podczas pisania zapytania SQL.

  7. Wybierz zapytanie, a następnie wybierz pozycję Zapisz jako widok. Nadaj widokowi unikatową nazwę. Dostęp do tego widoku można uzyskać w dowolnym momencie w portalu sieci szkieletowej.

  8. Wróć do dublowanej bazy danych w portalu sieci szkieletowej.

  9. Wybierz pozycję Nowe zapytanie wizualne. Użyj edytora zapytań, aby tworzyć złożone zapytania.

    Zrzut ekranu przedstawiający edytor zapytań zarówno dla zapytań tekstowych, jak i wizualnych w usłudze Fabric.

Tworzenie raportów analizy biznesowej dotyczących zapytań LUB widoków SQL

  1. Wybierz zapytanie lub widok, a następnie wybierz pozycję Eksploruj te dane (wersja zapoznawcza). Ta akcja eksploruje zapytanie w usłudze Power BI bezpośrednio przy użyciu usługi Direct Lake w danych dublowanych w usłudze OneLake.
  2. Edytuj wykresy zgodnie z potrzebami i zapisz raport.

Wskazówka

Opcjonalnie możesz również użyć narzędzia Copilot lub innych ulepszeń do tworzenia pulpitów nawigacyjnych i raportów bez dalszego przenoszenia danych.