Uproszczenie zarządzania danymi za pomocą dublowania i wirtualizacji

Ukończone

Organizacje często napotykają wyzwania związane z zarządzaniem danymi i analizowaniem ich ze względu na złożoność integrowania różnych źródeł danych, zapewnienia spójności danych i utrzymania dostępności danych w czasie rzeczywistym. Usługa SQL Database w usłudze Microsoft Fabric rozwiązuje te wyzwania, zapewniając ujednoliconą platformę, która upraszcza integrację danych, zwiększa spójność danych i zapewnia dostępność danych niemal w czasie rzeczywistym.

Integracja z dublowaniem

Jedną z kluczowych funkcji usługi SQL Database w usłudze Microsoft Fabric jest możliwość dublowania baz danych z usługi Azure SQL Database bezpośrednio w usłudze OneLake w usłudze Fabric. Ponadto baza danych SQL w Fabric jest automatycznie mirrorowana do celów analitycznych, a dane są stale replikowane do OneLake w niemal rzeczywistym czasie.

Diagram dublowania bazy danych sieci szkieletowej dla usługi Azure SQL Database.

Ten proces dublowania gwarantuje, że dane są stale replikowane niemal w czasie rzeczywistym, eliminując konieczność złożonych procesów wyodrębniania, przekształcania, ładowania (ETL). Dzięki temu zmniejsza całkowity koszt posiadania i przyspiesza analizę czasową, umożliwiając firmom odblokowanie analizy biznesowej, sztucznej inteligencji, inżynierii danych, nauki o danych i scenariuszy udostępniania danych.

Po zainicjowaniu procesu dublowania można monitorować stan replikacji, wybierając opcję Monitorowanie replikacji na karcie Replikacja . Jeśli w tabelach źródłowych nie ma żadnych aktualizacji, aparat wycofa się i wznowi regularne sondowanie po wykryciu zaktualizowanych danych.

Zrzut ekranu przedstawiający monitorowanie procesu dublowania bazy danych SQL w sieci szkieletowej.

Aby dowiedzieć się więcej na temat konfigurowania dublowanych baz danych, zobacz Samouczek: Konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Azure SQL Database.

Eksplorowanie wirtualizacji danych

Wirtualizacja danych w usłudze SQL Database w sieci szkieletowej to funkcja umożliwiająca uzyskiwanie dostępu do danych z różnych źródeł i manipulowanie nimi bez konieczności fizycznego przenoszenia lub kopiowania danych. Takie podejście zapewnia ujednolicony widok danych, umożliwiając bezproblemową integrację i analizę na różnych platformach.

Te funkcje umożliwiają wykonywanie zapytań dotyczących tabel Parquet, CSV i Delta dostępnych w usłudze Lakehouse.

Możliwość Definicja Przykładowe zapytanie
Poświadczenie o zakresie bazy danych Umożliwia tworzenie poświadczeń, które mogą służyć do bezpiecznego uzyskiwania dostępu do zewnętrznych źródeł danych. CREATE DATABASE SCOPED CREDENTIAL MyCredential WITH IDENTITY = 'USER IDENTITY';
Zewnętrzne źródło danych Dzięki temu można definiować zewnętrzne źródła danych, takie jak pliki przechowywane w usłudze OneLake. 'abfss://aaaaaaaa-0000-1111-2222-bbbbbbbbbbbb@<onelake_account_name>.dfs.fabric.microsoft.com/bbbbbbbb-1111-2222-3333-cccccccccccc/Files/parquet/data1.parquet';
Format pliku zewnętrznego Ta funkcja umożliwia określenie formatu plików zewnętrznych, takich jak Parquet, CSV i Delta. CREATE EXTERNAL FILE FORMAT MyFileFormat WITH ( FORMAT_TYPE = DELIMITEDTEXT, FORMAT_OPTIONS ( FIELD_TERMINATOR = ',', STRING_DELIMITER = '"' ) );
Tabela zewnętrzna Dzięki temu można tworzyć tabele odwołujące się do danych przechowywanych poza bazą danych SQL. CREATE EXTERNAL TABLE MyExternalTable ( Column1 INT, Column2 NVARCHAR(50) ) WITH ( LOCATION = 'myfolder/myfile.csv', DATA_SOURCE = MyExternalDataSource, FILE_FORMAT = MyFileFormat );